본 논문은 독일어 트위터 메시지 논조분석에 유용한 언어학적 특징을 분석하는 것을 목적으로 한다. 텍스트 내에는 긍정, 부정, 중립, 혼합 등의 감정이 표현되며 이러한 감정은 작성자의 주... 본 논문은 독일어 트위터 메시지 논조분석에 유용한 언어학적 특징을 분석하는 것을 목적으로 한다. 텍스트 내에는 긍정, 부정, 중립, 혼합 등의 감정이 표현되며 이러한 감정은 작성자의 주관적인 의견을 전달한다는 점에서 학술적 흥미를 불러일으킨다. 따라서 논조분석 분야에서는 감정을 전달하는 어휘, 감정 어휘 사전 구축, 논조분석 방법론 등 다양한 관련 연구가 존재한다. 그러나 기존 연구의 대부분은 영어에 집중하고 있으므로 독일어와 같은 언어에 대한 연구는 매우 부족할 뿐 아니라 주로 블로그나 리뷰 등과 같은 문서 단위의 텍스트를 대상으로 하고 있어 최근 등장한 트위터와 같은 새로운 매체에 대한 연구는 이루어지지 않았다고 할 수 있다. 트위터는 140 바이트라는 메시지 작성 용량 제한 규정을 가지고 있다는 점에서 기존의 매체와는 다른 언어학적 특성을 가지고 있을 것으로 보인다. 본 논문은 독일어로 작성된 트위터 메시지가 문서 단위의 텍스트와는 다른 독립적인 연구 대상으로 인식되어야 한다는 점을 지적하면서 논조 분석에 유용한 트위터 메시지의 특징을 분석한다. 논문은 어휘 의미론, 단문 메시지, 감정 어휘 사전, 자동 논조분석 등 본 논문의 주제와 관련이 있는 기존 연구에 대한 고찰을 시작으로, 독일어 트위터 메시지의 언어학적 특징 분석을 위한 독일어 트위터 코퍼스 구축에 대한 기준을 설명한다. 코퍼스 내 각 문장들은 공동작업, 일관성 유지 등 기준 하에서 두 명의 작업자들에 의해 긍정, 부정, 중립 중의 한 가지 논조로 분류된다. 코퍼스에서 발견된 언어학적 특징들은 단문 메시지적 특징과 구어체적 특징의 두 가지로 크게 나눠볼 수 있다. 단문 메시지적 특징은 이모티콘의 사용, 축약형의 사용 등이며 구어체적 특징은 영어의 사용, 음운론적 변이 등이다. 마지막으로 코퍼스 내에 사용된 어휘들 중 문맥에 상관없이 긍정 혹은 부정의 논조를 띠는 절대 논조 어휘 분석을 위해 코퍼스 분석 도구 'Antconc 3.2.1'이 사용되었으며 분석 결과로 도출된 긍정과 부정의 어휘들을 기존에 구축되어 있는 독일어 논조사전인 ?GPC; GermanPolarityClues' 내 어휘들과 비교하는 과정을 통해 트위터에만 사용되는 특수한 논조 어휘가 존재한다는 점을 명확히 했다. 즉, 트위터 메시지를 대상으로 한 자동 논조분석에서 좀 더 높은 정확도를 기대하기 위해서는 본 연구를 통해 나타난 외래어의 잦은 사용, 문법적으로 알려진 전치사/관사 축약의 확장적 사용 등 트위터 메시지 고유의 언어학적 특징과 트위터 고유의 긍?부정 논조 어휘를 추가적으로 반영하는 것이 중요할 것으로 보이며, 이를 확인하기 위한 보다 심도 있는 연구가 수행될 수 있을 것으로 기대된다.
Diese These berichtet ?ber die Studie, mit der Bebrauchung von einem Korpus von Twitter-Messages auf Deutsch, um linguistische Eigenschaften zu erforschen, die f?r Gef?hl-Analyse von deutschen Twitter-Messages n?tzlich sein k?nnen. Gef?hl sowie positi... Diese These berichtet ?ber die Studie, mit der Bebrauchung von einem Korpus von Twitter-Messages auf Deutsch, um linguistische Eigenschaften zu erforschen, die f?r Gef?hl-Analyse von deutschen Twitter-Messages n?tzlich sein k?nnen. Gef?hl sowie positiv, negativ, neutral, Mischgef?hl in einem Text weckt akademisches Interesse des Sprachwissenschaftlers auf, in dem diese Gef?hle Information ?ber subjektive Meinung des Schriftstellers geben. Also, es gibt viele Themen e.g.(z.B) Konzentrieren auf W?rter, die einflu?reichste Einheit um Gef?hl auszudr?cken haben, Gr?ndung eines Lexikons f?r Gef?hl zeigende W?rter oder Nachpr?fung von Methodik der Gef?hl-Analyse etc. Jedoch konzentrierten sich die meisten dieser existierenden Forschungen auf Englisch, gibt es Mangel an der Forschung anderer Sprachen wie Deutsch. Und allgemeines Thema dieser Studien war ein ganzer Text des Dokumentes, zum Beispiel, blogs oder Berichte etc. Ausserdem ist vor kurzem eine brandneue Medien erschienen - sogenannte ?Twitter?. Das ist vollkommen andere Medien als die schon existierenden, weil es bis zu 140byte geschrieben werden soll. Das ist der Grund warum Nachrichten mit Twitter oder Twit geschrieben einzigartige linguistische Eigenschaften haben und diese von dem existierenden Medien andere Dokument-Niveaus haben muss. Diese Studie weist darauf hin, dass auf Deutsch geschriebene Twitter-Nachrichten als ein unabh?ngiger Typ des Dokumentes anerkannt werden und linguistische Eigenschaften von Twitter ? Nachrichten f?r Gef?hl-Analyse n?zlich sein sollen. Diese These beginnt mit einem ?berblick des Thema, das das Bed?rfnis f?r linguistische Untersuchung von Twitter-Nachrichten anzeigt. Es erkl?rt danach drei rigorose Standards f?r Konstruktion der deutschen Twitter-Nachrichtenkorpus, Repraesentivit?t, Gleichgewichtund Gr?sse. Jede Nachricht im Korpus wird als pos. (positiv), neg. (negativ) oder neu. (neutral) durch zwei unabh?ngige Kommentatoren annotiert und diese Kommentatoren arbeiteten unter zwei Kriterien; Zusammenheit und Konsistenz. In Korpus gefundene linguistische Eigenschaften sind fr?her grob in zwei kategorisiert; kurze nachrichten-artige oder umgangssprachliche Eigenschaften. Mehr ausf?hrliche Subkategorien vom Ersteren sind Gebrauch von emoticon, Abk?rzungen etc., und die Letzteren sind Gebrauch der Englischen, phonologischen Ver?nderung etc.. Dieses Ergebnis scheint auf Twitter-Nachrichten mit der Grenzung von 140-bytes und ihrer einzigartigen Eigenschaft als globales Medium zu beruhen. Zuletzt, Konkordanz-Kontrolleur wird verwendet, um vorherige Polarit?tsw?rter von positiven und negativen Nachrichten herauszuziehen, und diese Wortliste wird mit der fr?her existierte deutsches Polarit?tslexikon und deutsche Polarit?tsanhaltspunkte verglichen. Infolge diese Studie wird es bewiesen, dass linguistische Eigenschaften von deutschen Twitter-Nachrichten Sachen genau wie diejenigen haben, Medium aber klare Unterschiede ebenso zu existieren. So es k?nnte weitere Forschung geben, mit der Genauigkeit f?r Gef?hl-Analyse des Gebrauch von Twitter-Nachrichtens, das die deutsche Polarit?tsanhaltspunkte verwenden. Hinzugef?gt, die existiert Twitter-einzigartige Polarit?tsw?rter k?nnen mit einer Grundlinie verglichen werden, die nur deutsche Polarit?tsanhaltspunkte gebraucht werden. ,韩语毕业论文,韩语论文网站 |