Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro

Artefact Research Center, Unbabel, Equall, MICS CentraleSupélec, Université Paris-Saclay, Instituto de Telecomunicações, Instituto Superior Técnico & Universidade de Lisboa (ELLIS-eenheid Lissabon)

We zijn verheugd het nieuwste onderzoeksartikel van onze promovendus Hippolyte Gisserot-Boukhlef te mogen delen, dat is geselecteerd als uitgelicht artikel voor de Negende Conferentie over Machinevertaling (WMT24) in november 2024.

Samenvatting

In dit artikel wordt de effectiviteit van technieken voor voorkeursoptimalisatie onderzocht, met name in vergelijking met supervised fine-tuning. Hoewel het optimaliseren op basis van data een gangbare praktijk data bij machinevertaling – waarbij vaak gebruik wordt gemaakt van hoogwaardige output van externe modellen zoals GPT-4 – zijn de bredere implicaties van deze aanpak nog niet volledig bekend. Interessant genoeg wijzen onze bevindingen erop dat het gebruik van het model zelf als ‘zelfleraar’ een vergelijkbare vertaalkwaliteit kan opleveren, terwijl de complexiteit en beperkingen die gepaard gaan met het gebruik van externe systemen worden weggenomen.