Ist das Präferenz-Alignment immer die beste Option zur Verbesserung der LLM-basierten Übersetzung? Eine empirische Analyse

Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro

Artefact Research CenterUnbabel, Equall, MICS CentraleSupélec, Université Paris-Saclay, Instituto de Telecomunicações, Instituto Superior Técnico & Universidade de Lisboa (Lisbon ELLIS Unit)

Den Artikel lesen

Wir freuen uns, Ihnen den neuesten Forschungsartikel unserer Doktorandin Hippolyte Gisserot-Boukhlef vorstellen zu können, der für die Neunte Konferenz für Maschinelle Übersetzung (WMT24) im November 2024 ausgewählt wurde.

Abstrakt

Das Papier untersucht die Effektivität von Präferenzoptimierungstechniken, insbesondere im Vergleich zu überwachtem Fine-Tuning. Während die Optimierung von Präferenzen data eine gängige Praxis in der maschinellen Übersetzung ist - wobei oft hochwertige Ergebnisse von externen Modellen wie GPT-4 genutzt werden - sind die weitergehenden Auswirkungen dieses Ansatzes noch nicht vollständig bekannt. Interessanterweise deuten unsere Ergebnisse darauf hin, dass durch die Verwendung des Modells selbst als Selbstlehrer eine vergleichbare Übersetzungsqualität erreicht werden kann, während die Komplexität und die Einschränkungen, die mit der Abhängigkeit von externen Systemen verbunden sind, beseitigt werden.

Zugriff auf das Slide Deck

Kontakt