eprintid: 19046 rev_number: 23 eprint_status: archive userid: 1967 dir: disk0/00/01/90/46 datestamp: 2015-08-05 06:07:09 lastmod: 2015-12-03 12:26:00 status_changed: 2015-08-05 06:07:09 type: doctoralThesis metadata_visibility: show creators_name: Wäschle, Katharina title: Quantifying Cross-lingual Semantic Similarity for Natural Language Processing Applications subjects: 004 subjects: 400 divisions: 90500 adv_faculty: af-09 keywords: Parallele Daten, Angewandte Sprachverarbeitung cterms_swd: Maschinelle Übersetzung cterms_swd: Computerunterstützte Übersetzung cterms_swd: Maschinelles Lernen cterms_swd: Computerlinguistik abstract: Translation and cross-lingual access to information are key technologies in a global economy. Even though the quality of machine translation (MT) output is still far from the level of human translations, many real-world applications have emerged, for which MT can be employed. Machine translation supports human translators in computer-assisted translation (CAT), providing the opportunity to improve translation systems based on human interaction and feedback. Besides, many tasks that involve natural language processing operate in a cross-lingual setting, where there is no need for perfectly fluent translations and the transfer of meaning can be modeled by employing MT technology. This thesis describes cumulative work in the field of cross-lingual natural language processing in a user-oriented setting. A common denominator of the presented approaches is their anchoring in an alignment between texts in two different languages to quantify the similarity of their content. abstract_translated_text: Sprachübergreifender Zugang zu Informationen ist eine Schlüsseltechnologie in einem globalen Wirtschaftssystem. Auch wenn die Qualität automatisch generierter Übersetzungen nicht das Niveau menschlicher Übersetzer erreicht, existieren Anwendungen, bei denen maschinelle Übersetzung (MT) erfolgreich zum Einsatz kommt. Im Bereich computergestützte Übersetzung (CAT) werden Übersetzer durch ein MT-System unterstützt, das Übersetzungsvorschläge generiert. Durch das Feedback der Nutzer kann die MT-Komponente stetig angepasst und verbessert werden. Neben der eigentlichen Übersetzung existieren Aufgabenbereiche, bei denen Texte sprachübergreifend verarbeitet werden. Anstatt hierbei komplette Übersetzungen als Zwischenrepräsentationen zu verwenden kann die inhaltliche Beziehung zwischen Text in verschiedenen Sprachen auch direkt modelliert werden. Die vorliegende Dissertation beschreibt kumulative Arbeit in verschiedenen Bereichen der anwendungsorientierten, cross-lingualen Sprachverarbeitung. Alle vorgestellten Modelle und Ansätze eint die Idee von sprachübergreifender Semantik: Auf der Basis eines Alignments von Quell- und Zielsprachentext können inhaltliche Ähnlichkeiten quantifiziert werden. abstract_translated_lang: ger date: 2015 id_scheme: DOI id_number: 10.11588/heidok.00019046 ppn_swb: 1657624404 own_urn: urn:nbn:de:bsz:16-heidok-190461 date_accepted: 2015-07-21 advisor: HASH(0x556120d95fa0) language: eng bibsort: WASCHLEKATQUANTIFYIN2015 full_text_status: public citation: Wäschle, Katharina (2015) Quantifying Cross-lingual Semantic Similarity for Natural Language Processing Applications. [Dissertation] document_url: https://archiv.ub.uni-heidelberg.de/volltextserver/19046/7/thesis.a.pdf