Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro

Artefact Research Center, Unbabel, Equall, MICS CentraleSupélec, Université Paris-Saclay, Instituto de Telecomunicações, Instituto Superior Técnico & Universidade de Lisboa (Lisbon ELLIS Unit)

Wir freuen uns, Ihnen den neuesten Forschungsartikel unseres Doktoranden Hippolyte Gisserot-Boukhlef vorstellen zu können, der für die Neunte Konferenz für Maschinelle Übersetzung (WMT24) im November 2024 ausgewählt wurde.

Abstrakt

Das Papier untersucht die Effektivität von Präferenzoptimierungstechniken, insbesondere im Vergleich zum Supervised Fine-Tuning. Während die Optimierung auf der Grundlage von Präferenzen data eine gängige Praxis in der maschinellen Übersetzung ist - wobei oft hochwertige Ergebnisse von externen Modellen wie GPT-4 genutzt werden -, sind die weitergehenden Auswirkungen dieses Ansatzes noch nicht vollständig bekannt. Interessanterweise deuten unsere Ergebnisse darauf hin, dass durch die Verwendung des Modells selbst als Selbstlehrer eine vergleichbare Übersetzungsqualität erreicht werden kann, während die Komplexität und die Einschränkungen, die mit dem Verlassen auf externe Systeme verbunden sind, beseitigt werden.