eprintid: 36999 rev_number: 19 eprint_status: archive userid: 8003 dir: disk0/00/03/69/99 datestamp: 2025-07-31 07:55:12 lastmod: 2025-07-31 07:55:58 status_changed: 2025-07-31 07:55:12 type: doctoralThesis metadata_visibility: show creators_name: Dallakyan, Meri title: Modeling Lexical Fields for Translation: a Corpus-Based Study of Armenian, German, and English Culinary Verbs title_de: Modellierung lexikalischer Felder für Übersetzung: Eine korpusbasierte Studie zu armenischen, deutschen und englischen kulinarischen Verben subjects: ddc-400 subjects: ddc-420 subjects: ddc-430 divisions: i-90900 adv_faculty: af-09 keywords: Collocation Analysis, Statistical Significance,Culinary Verbs cterms_swd: Armenian cterms_swd: English cterms_swd: German cterms_swd: Translation Studies cterms_swd: Contrastive Linguistic Analysis abstract: This doctoral thesis presents a corpus-based, bottom-up methodology for analyzing culinary lexical fields in Armenian, German, and English using statistical and computational tools combined with manual semantic annotation. Drawing from authentic comparable corpora, the study develops an interpretable model for identifying translation equivalents and typical lexical choices across languages, focusing on culinary verbs. The methodology offers practical applications for language learners, educators, translators, and developers of machine translation (MT) systems by minimizing atypical collocational usage and enhancing translation accuracy. A key innovation lies in the interpretability of the translation and lexical models, addressing a major shortcoming in current neural MT systems, which often lack transparency in their output. The proposed framework enables explainable lexical modeling and supports the evaluation and refinement of both dictionary definitions and MT outputs. While tested primarily on three languages, the model has demonstrated scalability, with preliminary success in French, and can be adapted to other languages with minor adjustments. By integrating manual semantic analysis with data-driven techniques, this work bridges the gap between logic-based and statistical approaches to language processing, offering a meaningful step toward explainable and semantically grounded applications in NLP and AI. abstract_translated_text: Diese Dissertation präsentiert eine korpusbasierte Methodologie zur Analyse kulinarischer Wortfelder im Armenischen, Deutschen und Englischen unter Anwendung statistischer und computerlinguistischer Verfahren in Kombination mit manueller semantischer Annotation. Auf der Grundlage authentischer vergleichbarer Korpora wird ein interpretierbares Modell zur Identifikation von Übersetzungsäquivalenten und typischen lexikalischen Entscheidungen zwischen den Sprachen entwickelt, mit einem besonderen Fokus auf kulinarische Verben. Die Methodologie bietet praktische Anwendungen für Sprachlernende, Lehrende, ÜbersetzerInnen sowie EntwicklerInnen maschineller Übersetzungssysteme, indem sie untypische Kollokationen vermeidet und die Übersetzungsgenauigkeit verbessert. Eine zentrale Innovation liegt in der Interpretierbarkeit der Übersetzungs- und lexikalischen Modelle, wodurch ein zentrales Defizit aktueller neuronaler MT-Systeme adressiert wird – deren mangelnde Transparenz. Der vorgeschlagene Rahmen ermöglicht erklärbare lexikalische Modellierung und unterstützt die Evaluation und Weiterentwicklung von Wörterbuchdefinitionen sowie MT-Ergebnissen. Obwohl primär auf drei Sprachen angewendet, zeigt das Modell Skalierbarkeit und wurde bereits erfolgreich auf das Französische getestet; eine Adaption auf weitere Sprachen ist mit geringfügigen Anpassungen möglich. Durch die Kombination manueller semantischer Analyse mit datengetriebenen Verfahren schlägt diese Arbeit eine Brücke zwischen logisch-basierter und statistischer Sprachverarbeitung und leistet einen bedeutenden Beitrag zu erklärbaren, semantisch fundierten Anwendungen in NLP und KI. abstract_translated_lang: ger date: 2025 id_scheme: DOI id_number: 10.11588/heidok.00036999 own_urn: urn:nbn:de:bsz:16-heidok-369991 date_accepted: 2024-07-26 advisor: HASH(0x55602a7ebea8) language: eng bibsort: DALLAKYANMMODELINGLE full_text_status: public place_of_pub: Heidelberg citation: Dallakyan, Meri (2025) Modeling Lexical Fields for Translation: a Corpus-Based Study of Armenian, German, and English Culinary Verbs. [Dissertation] document_url: https://archiv.ub.uni-heidelberg.de/volltextserver/36999/1/Dissertation_Meri_Dallakyan.pdf