希波吕特-吉塞洛-布赫勒夫、里卡多-雷、埃马纽埃尔-马尔赫贝、席琳-胡德洛、皮埃尔-科伦坡、努诺-M-格雷罗

Artefact Research Center, Unbabel, Equall, MICS CentraleSupélec, Université Paris-Saclay, Instituto de Telecomunicações, Instituto Superior Técnico & Universidade de Lisboa (Lisbon ELLIS Unit)

我们很高兴与大家分享我们的博士生 Hippolyte Gisserot-Boukhlef 的最新研究文章,该文章已被选为 2024 年 11 月第九届机器翻译大会 (WMT24) 的专题论文。.

摘要

本文探讨了偏好优化技术的有效性,特别是与监督微调技术的比较。虽然在偏好 data 上进行优化是机器翻译中的一种常见做法--通常会利用 GPT-4 等外部模型的高质量输出,但这种方法的广泛意义尚未被完全理解。有趣的是,我们的研究结果表明,将模型本身作为自我教师可以达到相当的翻译质量,同时消除了与依赖外部系统相关的复杂性和限制。.