Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro
Artefact Research CenterUnbabel, Equall, MICS CentraleSupélec, Université Paris-Saclay, Instituto de Telecomunicações, Instituto Superior Técnico e Universidade de Lisboa (Unidade ELLIS de Lisboa)
Temos o prazer de compartilhar o mais recente artigo de pesquisa de nosso aluno de doutorado, Hippolyte Gisserot-Boukhlef, que foi selecionado como um artigo em destaque na Nona Conferência sobre Tradução Automática (WMT24) em novembro de 2024.
Resumo
O artigo explora a eficácia das técnicas de otimização de preferências, especialmente em comparação com o ajuste fino supervisionado. data Embora a otimização de preferências seja uma prática comum na tradução automática - geralmente aproveitando resultados de alta qualidade de modelos externos como o GPT-4 -, as implicações mais amplas dessa abordagem ainda não são totalmente compreendidas. É interessante notar que nossas descobertas sugerem que o uso do próprio modelo como autodidata pode alcançar uma qualidade de tradução comparável, eliminando as complexidades e restrições associadas à dependência de sistemas externos.