Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro

Artefact Research CenterUnbabel, Equall, MICS CentraleSupélec, Université Paris-Saclay, Instituto de Telecomunicações, Instituto Superior Técnico & Universidade de Lisboa (Lisbon ELLIS Unit)

Nous avons le plaisir de partager le dernier article de recherche de notre doctorant, Hippolyte Gisserot-Boukhlef, qui a été sélectionné comme article vedette à la neuvième conférence sur la traduction automatique (WMT24) en novembre 2024.

Résumé

L'article explore l'efficacité des techniques d'optimisation des préférences, en particulier en comparaison avec le réglage fin supervisé. Bien que l'optimisation des préférences data soit une pratique courante dans le domaine de la traduction automatique - souvent en s'appuyant sur les résultats de haute qualité de modèles externes tels que GPT-4 - les implications plus larges de cette approche ne sont pas encore entièrement comprises. Il est intéressant de noter que nos résultats suggèrent que l'utilisation du modèle lui-même en tant qu'auto-apprentissage peut permettre d'obtenir une qualité de traduction comparable, tout en éliminant les complexités et les contraintes associées à l'utilisation de systèmes externes.