Is Preference Alignment altijd de beste optie om LLM-gebaseerd vertalen te verbeteren? Een empirische analyse. Artefact

Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro

Artefact Research Center, Unbabel, Equall, MICS CentraleSupélec, Université Paris-Saclay, Instituto de Telecomunicações, Instituto Superior Técnico & Universidade de Lisboa (ELLIS-eenheid Lissabon)

Lees het artikel

We zijn verheugd het nieuwste onderzoeksartikel van onze promovendus Hippolyte Gisserot-Boukhlef te kunnen delen, dat is geselecteerd als een featured paper op de negende conferentie over machinevertaling (WMT24) in november 2024.

Abstract

Het artikel onderzoekt de effectiviteit van voorkeursoptimalisatietechnieken, met name in vergelijking met gecontroleerde fijnafstemming. Hoewel het optimaliseren van voorkeuren op data gebruikelijk is bij machinevertalingen, waarbij vaak gebruik wordt gemaakt van hoogwaardige output van externe modellen zoals GPT-4, worden de bredere implicaties van deze aanpak nog niet volledig begrepen. Interessant is dat onze bevindingen suggereren dat het gebruik van het model zelf als zelfleraar een vergelijkbare vertaalkwaliteit kan bereiken, terwijl de complexiteit en beperkingen die gepaard gaan met het vertrouwen op externe systemen worden geëlimineerd.

Toegang tot het diadeck

Neem contact op