Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Modeling Lexical Fields for Translation: a Corpus-Based Study of Armenian, German, and English Culinary Verbs

Dallakyan, Meri

German Title: Modellierung lexikalischer Felder für Übersetzung: Eine korpusbasierte Studie zu armenischen, deutschen und englischen kulinarischen Verben

[thumbnail of Dissertation_Meri_Dallakyan.pdf]
Preview
PDF, English - main document
Download (15MB) | Lizenz: Creative Commons LizenzvertragModeling Lexical Fields for Translation: a Corpus-Based Study of Armenian, German, and English Culinary Verbs by Dallakyan, Meri underlies the terms of Creative Commons Attribution 4.0

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

This doctoral thesis presents a corpus-based, bottom-up methodology for analyzing culinary lexical fields in Armenian, German, and English using statistical and computational tools combined with manual semantic annotation. Drawing from authentic comparable corpora, the study develops an interpretable model for identifying translation equivalents and typical lexical choices across languages, focusing on culinary verbs. The methodology offers practical applications for language learners, educators, translators, and developers of machine translation (MT) systems by minimizing atypical collocational usage and enhancing translation accuracy. A key innovation lies in the interpretability of the translation and lexical models, addressing a major shortcoming in current neural MT systems, which often lack transparency in their output. The proposed framework enables explainable lexical modeling and supports the evaluation and refinement of both dictionary definitions and MT outputs. While tested primarily on three languages, the model has demonstrated scalability, with preliminary success in French, and can be adapted to other languages with minor adjustments. By integrating manual semantic analysis with data-driven techniques, this work bridges the gap between logic-based and statistical approaches to language processing, offering a meaningful step toward explainable and semantically grounded applications in NLP and AI.

Translation of abstract (German)

Diese Dissertation präsentiert eine korpusbasierte Methodologie zur Analyse kulinarischer Wortfelder im Armenischen, Deutschen und Englischen unter Anwendung statistischer und computerlinguistischer Verfahren in Kombination mit manueller semantischer Annotation. Auf der Grundlage authentischer vergleichbarer Korpora wird ein interpretierbares Modell zur Identifikation von Übersetzungsäquivalenten und typischen lexikalischen Entscheidungen zwischen den Sprachen entwickelt, mit einem besonderen Fokus auf kulinarische Verben. Die Methodologie bietet praktische Anwendungen für Sprachlernende, Lehrende, ÜbersetzerInnen sowie EntwicklerInnen maschineller Übersetzungssysteme, indem sie untypische Kollokationen vermeidet und die Übersetzungsgenauigkeit verbessert. Eine zentrale Innovation liegt in der Interpretierbarkeit der Übersetzungs- und lexikalischen Modelle, wodurch ein zentrales Defizit aktueller neuronaler MT-Systeme adressiert wird – deren mangelnde Transparenz. Der vorgeschlagene Rahmen ermöglicht erklärbare lexikalische Modellierung und unterstützt die Evaluation und Weiterentwicklung von Wörterbuchdefinitionen sowie MT-Ergebnissen. Obwohl primär auf drei Sprachen angewendet, zeigt das Modell Skalierbarkeit und wurde bereits erfolgreich auf das Französische getestet; eine Adaption auf weitere Sprachen ist mit geringfügigen Anpassungen möglich. Durch die Kombination manueller semantischer Analyse mit datengetriebenen Verfahren schlägt diese Arbeit eine Brücke zwischen logisch-basierter und statistischer Sprachverarbeitung und leistet einen bedeutenden Beitrag zu erklärbaren, semantisch fundierten Anwendungen in NLP und KI.

Document type: Dissertation
Supervisor: Atayan, Prof. Dr. Vahram
Place of Publication: Heidelberg
Date of thesis defense: 26 July 2024
Date Deposited: 31 Jul 2025 07:55
Date: 2025
Faculties / Institutes: Neuphilologische Fakultät > Institut für Übersetzen und Dolmetschen
DDC-classification: 400 Linguistics
420 English
430 Germanic
Controlled Keywords: Armenian, English, German, Translation Studies, Contrastive Linguistic Analysis
Uncontrolled Keywords: Collocation Analysis, Statistical Significance,Culinary Verbs
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative