	{"id":395351,"date":"2025-03-10T16:14:40","date_gmt":"2025-03-10T16:14:40","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=395351"},"modified":"2025-03-11T08:58:00","modified_gmt":"2025-03-11T08:58:00","slug":"artificial-intelligence-and-nlp-the-eurobert-encoder-suite-reaches-a-new-milestone","status":"publish","type":"news","link":"https:\/\/www.artefact.com\/fr\/news\/artificial-intelligence-and-nlp-the-eurobert-encoder-suite-reaches-a-new-milestone\/","title":{"rendered":"Intelligence artificielle et NLP : la suite d'encodeurs EuroBERT franchit une nouvelle \u00e9tape"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-1 description\" style=\"--awb-text-color:var(--awb-color5);--awb-text-font-family:&quot;PT Serif&quot;;--awb-text-font-style:normal;--awb-text-font-weight:400;\"><p>Paris, le 10 mars 2025<\/p>\n<p>Entra\u00een\u00e9e sur 5 000 milliards de tokens, cette suite propose des mod\u00e8les souverains et libres offrant les meilleures performances en mati\u00e8re de repr\u00e9sentation textuelle pour les langues europ\u00e9ennes, ainsi que pour les t\u00e2ches li\u00e9es aux math\u00e9matiques et au codage.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div ><a class=\"fusion-button button-flat fusion-button-default-size button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" target=\"_self\" href=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2025\/03\/CentraleSupelec_Artefact_Diaboloco_ProjetEuroBERT_-1.pdf\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Communiqu\u00e9 de presse<\/span><\/a><\/div><\/div><\/div><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div ><a class=\"fusion-button button-flat fusion-button-default-size button-default fusion-button-default button-2 fusion-button-default-span fusion-button-default-type\" target=\"_self\" href=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2025\/03\/CentraleSupelec_Artefact_Diaboloco_EuroBERT-project_.pdf\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Communiqu\u00e9 de presse<\/span><\/a><\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>La collaboration entre le laboratoire MICS de CentraleSup\u00e9lec, Diabolocom, Artefact et Unbabel, soutenue par l'expertise technologique d'AMD et du CINES, a abouti \u00e0 la publication du mod\u00e8le de repr\u00e9sentation de texte multilingue le plus avanc\u00e9. Ce mod\u00e8le sert de brique fondamentale pour la recherche d'information (RAG), la classification et l'estimation de la qualit\u00e9 (r\u00e9sum\u00e9, traduction).<\/p>\n<\/div><div class=\"fusion-text fusion-text-3\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Ces types de mod\u00e8les sont essentiels dans le traitement du langage naturel (NLP) et ont \u00e9t\u00e9 parmi les plus t\u00e9l\u00e9charg\u00e9s sur Hugging Face depuis de nombreuses ann\u00e9es. Leur capacit\u00e9 \u00e0 capturer avec pr\u00e9cision le sens et le contexte des phrases, offrant une compr\u00e9hension linguistique raffin\u00e9e et approfondie, est cruciale pour le d\u00e9veloppement d'applications artificial intelligence avanc\u00e9es. Le nouveau mod\u00e8le EuroBERT est disponible \u00e0 partir du 10 mars 2025, sous la licence Apache 2.0, sur le site <a href=\"https:\/\/huggingface.co\/EuroBERT\" target=\"_blank\" rel=\"noopener\">Plate-forme d'\u00e9treinte du visage.<\/a><\/p>\n<\/div><div class=\"fusion-text fusion-text-4\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Le projet de recherche a \u00e9t\u00e9 dirig\u00e9 par Nicolas Boizard, doctorant Cifre \u00e0 Diabolocom, avec des contributions majeures d'Hippolyte Gisserot-Boukhlef, doctorant Cifre \u00e0 Artefact, et de Duarte Alves, doctorant \u00e0 l'Instituto Superior T\u00e9cnico (IST). Elle s'appuie sur une recherche initi\u00e9e par Pierre Colombo, ma\u00eetre de conf\u00e9rences \u00e0 CentraleSup\u00e9lec, et a \u00e9t\u00e9 men\u00e9e sous la supervision de C\u00e9line Hudelot, directrice du MICS, et d'Andr\u00e9 Martins, ma\u00eetre de conf\u00e9rences \u00e0 l'IST. Les r\u00e9sultats sont d\u00e9taill\u00e9s dans un article publi\u00e9 sur arXiv le 10 mars 2025 : <a href=\"https:\/\/arxiv.org\/abs\/2503.05500\" target=\"_blank\" rel=\"noopener\">https:\/\/arxiv.org\/abs\/2503.05500<\/a><\/p>\n<\/div><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;--awb-font-size:14px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\"><strong>Un nouveau saut technologique dans l'encodage des textes<\/strong><\/h2><\/div><div class=\"fusion-text fusion-text-5\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>EuroBERT se distingue des codeurs actuellement disponibles sur cinq points essentiels :<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Il est souverain et enti\u00e8rement libre, y compris son code source et ses datasets.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Il prend en charge 8 grandes langues europ\u00e9ennes ainsi que 7 des langues non europ\u00e9ennes les plus parl\u00e9es.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Entra\u00een\u00e9 sur 5 trillions de tokens, soit deux fois la quantit\u00e9 de data utilis\u00e9e pour les codeurs standard ou les mod\u00e8les g\u00e9n\u00e9ratifs tels que Llama 2 (2 trillions de tokens), EuroBERT offre des capacit\u00e9s optimales sans co\u00fbts d'utilisation suppl\u00e9mentaires.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>La famille EuroBERT constitue la meilleure base pour la recherche d'informations (RAG), la classification et l'estimation de la qualit\u00e9 (r\u00e9sum\u00e9, traduction).<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Il excelle dans des domaines jusqu'ici peu explor\u00e9s tels que le traitement math\u00e9matique data et les langages de programmation.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-6\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Il est disponible en trois tailles (210M, 610M et 2.1B), offrant un \u00e9quilibre optimal entre vitesse, qualit\u00e9 et co\u00fbt, adapt\u00e9 aux besoins des utilisateurs professionnels.<br \/>\nEuroBERT transforme ainsi les applications de traitement du langage naturel bas\u00e9es sur des repr\u00e9sentations de phrases, telles que l'analyse de texte, la recherche d'informations, la classification et l'extraction d'informations.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\"><strong>La force et la valeur ajout\u00e9e de la recherche collaborative<\/strong><\/h2><\/div><div class=\"fusion-text fusion-text-7\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Comme pour les mod\u00e8les CroissantLLM et EuroLLM publi\u00e9s sur Hugging Face en 2024, ces avanc\u00e9es scientifiques ont \u00e9t\u00e9 rendues possibles gr\u00e2ce \u00e0 une collaboration publique-priv\u00e9e \u00e9troite et dynamique, ancr\u00e9e dans l'\u00e9cosyst\u00e8me de Paris-Saclay et \u00e9tendue \u00e0 toute l'Europe. Les \u00e9quipes de MICS, IST, Diabolocom, Artefact, et Unbabel ont travaill\u00e9 ensemble dans le cadre de trois projets de th\u00e8se en cours, soutenus par le supercalculateur fran\u00e7ais Adastra, aliment\u00e9 par des acc\u00e9l\u00e9rateurs AMD Instinct\u2122 et des processeurs AMD EPYC\u2122.<\/p>\n<\/div><div class=\"fusion-text fusion-text-8\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Reconnu mondialement pour son excellence en math\u00e9matiques et en informatique, le laboratoire MICS de CentraleSup\u00e9lec m\u00e8ne de multiples programmes et projets de recherche en partenariat avec des organismes priv\u00e9s et publics, repoussant sans cesse les limites de artificial intelligence. Diabolocom, \u00e0 travers son produit de support \u00e0 la relation client, a apport\u00e9 son expertise en traitement du langage, qui a \u00e9t\u00e9 int\u00e9gr\u00e9e dans son produit. Artefact, leader europ\u00e9en de l'IA et du conseil en data, a apport\u00e9 son expertise transversale et sa vision strat\u00e9gique sur de nombreuses applications d'entreprise. Enfin, Unbabel, leader technologique de la traduction automatique, a apport\u00e9 son expertise en IA multilingue.<\/p>\n<\/div><div class=\"fusion-text fusion-text-9\"><blockquote>\n<div class=\"quote\">\u201cUn mois apr\u00e8s le sommet AI Action \u00e0 Paris, nous sommes particuli\u00e8rement heureux d'annoncer la sortie d'EuroBERT. Cette famille de mod\u00e8les d'encodage pour les langues europ\u00e9ennes est la solution la plus compl\u00e8te et la plus performante pour les t\u00e2ches au niveau des documents. Dans le paysage actuel de l'IA, les mod\u00e8les d'encodage sont souvent n\u00e9glig\u00e9s malgr\u00e9 leur importance dans les applications NLP. Par exemple, BERT, introduit en 2017, est encore t\u00e9l\u00e9charg\u00e9 pr\u00e8s de cinq millions de fois par mois sur Hugging Face, d\u00e9passant LLaMA et d'autres mod\u00e8les similaires.\u201d<\/div>\n<div class=\"quote-baseline\">met l'accent sur <strong>C\u00e9line Hudelot, professeur \u00e0 CentraleSup\u00e9lec et directrice du laboratoire MICS.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-10\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Avec la cr\u00e9ation de son centre de recherche, Diabolocom Research, d\u00e9but 2025, Diabolocom se dote de nouvelles ressources pour apporter des solutions concr\u00e8tes et efficaces aux demandes du march\u00e9 en mati\u00e8re de syst\u00e8mes d'IA fiables, souverains et performants.<\/p>\n<\/div><div class=\"fusion-text fusion-text-11\"><blockquote>\n<div class=\"quote\">\u201cLa collaboration multidisciplinaire et les contributions \u00e0 des projets \u00e0 code source ouvert sont au c\u0153ur de notre strat\u00e9gie visant \u00e0 rester \u00e0 la pointe de l'innovation. EuroBERT, notre derni\u00e8re initiative de recherche, s'attaque \u00e0 plusieurs limites des encodeurs existants. Ce mod\u00e8le am\u00e9liorera la fonctionnalit\u00e9 de multiples solutions, y compris la recherche automatique d'informations, la classification automatis\u00e9e et les syst\u00e8mes \u00e0 base d'agents\u201d.\u201d<\/div>\n<div class=\"quote-baseline\">explique<strong> Fr\u00e9d\u00e9ric Durand, pr\u00e9sident et fondateur de Diabolocom<\/strong>.<\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-12\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Pour sa part, Artefact s'est engag\u00e9e activement dans la recherche sur l'IA gr\u00e2ce \u00e0 son centre de recherche, inaugur\u00e9 il y a un an.<\/p>\n<\/div><div class=\"fusion-text fusion-text-13\"><blockquote>\n<div class=\"quote\">\u201cNotre objectif est de d\u00e9velopper et de distribuer des mod\u00e8les utiles et pratiques pour des applications commerciales concr\u00e8tes. Par cons\u00e9quent, toutes nos publications et tous nos algorithmes sont libres. Les progr\u00e8s r\u00e9alis\u00e9s par EuroBERT en mati\u00e8re d'encodage de documents ouvrent de nouvelles possibilit\u00e9s pour am\u00e9liorer l'efficacit\u00e9 et la pertinence de la classification des documents, de la recherche intelligente d'informations et de la reconnaissance des entit\u00e9s nomm\u00e9es (NER). En se concentrant sur l'analyse de documents existants plut\u00f4t que sur la cr\u00e9ation de nouveaux documents, EuroBERT r\u00e9pond \u00e0 un besoin critique et r\u00e9current dans le domaine de l'analyse de textes commerciaux\u201d<\/div>\n<div class=\"quote-baseline\"><strong>Emmanuel Malherbe, directeur du Artefact Research Center<\/strong>.<\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-14\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Quant \u00e0 Unbabel, il s'agit de la premi\u00e8re plateforme d'op\u00e9rations linguistiques aliment\u00e9e par l'IA :<\/p>\n<\/div><div class=\"fusion-text fusion-text-15\"><blockquote>\n<div class=\"quote\">\u201cEuroBERT repr\u00e9sente une avanc\u00e9e majeure dans le domaine de l'IA multilingue. Les mod\u00e8les d'encodage sont depuis longtemps un h\u00e9ros m\u00e9connu du NLP, car ils fournissent la compr\u00e9hension linguistique profonde n\u00e9cessaire aux applications d'IA les plus performantes. Contrairement aux approches purement g\u00e9n\u00e9ratives, les encodeurs excellent dans la capture du sens et du contexte - des \u00e9l\u00e9ments cl\u00e9s pour des syst\u00e8mes multilingues pr\u00e9cis et \u00e9volutifs. Chez Unbabel, nous avons une grande expertise non seulement dans le d\u00e9veloppement de solutions LLM g\u00e9n\u00e9ratives, telles que nos mod\u00e8les de pointe Tower, mais aussi dans la cr\u00e9ation de solutions de r\u00e9f\u00e9rence bas\u00e9es sur des encodeurs, telles que Comet et CometKiwi. Le lancement d'EuroBERT intervient \u00e0 un moment charni\u00e8re, car il r\u00e9pond au manque d'encodeurs multilingues form\u00e9s aux derni\u00e8res avanc\u00e9es en mati\u00e8re de mod\u00e8les g\u00e9n\u00e9ratifs. Nous sommes fiers de contribuer \u00e0 des projets tels qu'EuroBERT et EuroLLM, qui renforcent les capacit\u00e9s europ\u00e9ennes et garantissent notre avenir num\u00e9rique commun\u201d.\u201d<\/div>\n<div class=\"quote-baseline\">ajoute <strong>Nuno Miguel Guerreiro, chercheur \u00e0 Unbabel.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-16\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Ce projet a \u00e9galement \u00e9t\u00e9 rendu possible gr\u00e2ce aux acc\u00e9l\u00e9rateurs AMD Instinct\u2122 MI300A, int\u00e9gr\u00e9s dans Adastra, le supercalculateur fran\u00e7ais tr\u00e8s performant.<\/p>\n<\/div><div class=\"fusion-text fusion-text-17\"><blockquote>\n<div class=\"quote\">\u201cLe d\u00e9veloppement d'EuroBERT marque une \u00e9tape importante dans nos efforts pour am\u00e9liorer les capacit\u00e9s de traitement du langage naturel pour les langues europ\u00e9ennes, sous l'impulsion de la recherche en France. Gr\u00e2ce aux GPU MI300 d'AMD et \u00e0 leur architecture de m\u00e9moire unifi\u00e9e, nous avons atteint des performances et une efficacit\u00e9 sans pr\u00e9c\u00e9dent. Ce projet souligne l'engagement d'AMD en faveur de l'innovation et de l'excellence dans le domaine du artificial intelligence\u201d.\u201d<\/div>\n<div class=\"quote-baseline\">dit <strong>Julien Ruiz, directeur d'AMD France.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-18\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Le d\u00e9veloppement d'EuroBERT a \u00e9galement b\u00e9n\u00e9fici\u00e9 de la contribution d'\u00e9quipes de l'Universit\u00e9 Grenoble Alpes, du CNRS, du LISN, d'Illuin Technology, de l'IRT Saint-Exup\u00e9ry et du CINES.<\/p>\n<\/div><div class=\"fusion-text fusion-text-19\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>A propos de <a href=\"http:\/\/www.centralesupelec.fr\" target=\"_blank\" rel=\"noopener\">CentraleSup\u00e9lec<\/a> - www.centralesupelec.fr<\/strong><\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-20\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>CentraleSup\u00e9lec est un \u00e9tablissement public \u00e0 caract\u00e8re scientifique, culturel et professionnel, n\u00e9 en janvier 2015 de la fusion de l'\u00c9cole Centrale Paris et de Sup\u00e9lec. Aujourd'hui, CentraleSup\u00e9lec est pr\u00e9sente sur quatre campus en France (Paris-Saclay, Metz, Rennes et Reims) et compte plus de 5 400 \u00e9tudiants, dont 3 800 \u00e9l\u00e8ves-ing\u00e9nieurs. L'\u00e9tablissement h\u00e9berge 18 laboratoires ou \u00e9quipes de recherche. Fortement implant\u00e9e \u00e0 l'international - 25% de ses \u00e9tudiants et pr\u00e8s d'un quart de son corps professoral viennent de l'\u00e9tranger - la Centrale Sup\u00e9lec a nou\u00e9 plus de 170 partenariats avec des institutions de premier plan dans le monde entier. Grande \u00e9cole d'enseignement sup\u00e9rieur et de recherche, elle est une r\u00e9f\u00e9rence dans les domaines de l'ing\u00e9nierie et des sciences des syst\u00e8mes. En 2020, CentraleSup\u00e9lec a cofond\u00e9 l'Universit\u00e9 Paris-Saclay et dirige aujourd'hui le Groupe des \u00c9coles Centrale (CentraleSup\u00e9lec, Centrale Lyon, Centrale Lille, Centrale Nantes et Centrale M\u00e9diterran\u00e9e), qui chapeaute les campus internationaux de P\u00e9kin (Chine), Hyderabad (Inde) et Casablanca (Maroc).<\/p>\n<p><strong>\u00c0 propos du laboratoire MICS<\/strong><br \/>\nCr\u00e9\u00e9 au d\u00e9but des ann\u00e9es 2000, le laboratoire MICS regroupe les recherches en math\u00e9matiques et en informatique de CentraleSup\u00e9lec. Au c\u0153ur des technologies num\u00e9riques, ses recherches portent sur la mod\u00e9lisation, la simulation, l'analyse et l'optimisation des syst\u00e8mes complexes, qu'il s'agisse d'applications industrielles, de sciences de la vie, de march\u00e9s financiers ou de r\u00e9seaux d'information. Le laboratoire MICS est structur\u00e9 en six \u00e9quipes de recherche, poursuivant des objectifs scientifiques communs, avec un axe transversal sur l'Intelligence Artificielle.<\/p>\n<\/div><div class=\"fusion-text fusion-text-21\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Contacts presse :<\/strong><\/span><br \/>\nClaire Flin : clairefline@gmail.com \u2013 +33 6 95 41 95 90<br \/>\nMarion Molina : marionmolinapro@gmail.com \u2013 +33 6 29 11 52 08<\/p>\n<\/div><div class=\"fusion-text fusion-text-22\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>A propos de <a href=\"http:\/\/www.diabolocom.com\" target=\"_blank\" rel=\"noopener\">Diabolocom<\/a> - www.diabolocom.com<\/strong><\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-23\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Depuis plus de 20 ans, Diabolocom r\u00e9volutionne les interactions avec les clients gr\u00e2ce \u00e0 sa solution CCaaS (Contact Center as a Service) bas\u00e9e sur le cloud, am\u00e9lior\u00e9e par une IA g\u00e9n\u00e9rative propri\u00e9taire. L'automatisation intelligente, l'am\u00e9lioration de la joignabilit\u00e9 et la fiabilit\u00e9 des analyses fournissent au service client et aux \u00e9quipes commerciales les outils dont ils ont besoin pour r\u00e9ussir. Con\u00e7ue sp\u00e9cifiquement pour la relation client, l'IA de Diabolocom permet la transcription en temps r\u00e9el, l'analyse de la satisfaction et la recommandation d'actions tout en minimisant les t\u00e2ches r\u00e9p\u00e9titives. Le r\u00e9sultat : des interactions hyper-personnalis\u00e9es, une plus grande fid\u00e9lit\u00e9 des clients et des ventes optimis\u00e9es. En offrant une visibilit\u00e9 totale sur chaque interaction client, la solution de Diabolocom aide des entreprises de premier plan telles que Carrefour, Air Liquide, Meilleurtaux et Leboncoin \u00e0 transformer leur relation client dans plus de 60 pays.<\/p>\n<p>Pr\u00e9sent en Europe, en Am\u00e9rique du Nord, au Br\u00e9sil et au Moyen-Orient, Diabolocom aide les organisations \u00e0 am\u00e9liorer leurs relations avec leurs clients \u00e0 l'\u00e9chelle mondiale.<\/p>\n<p>En 2025, Diabolocom a lanc\u00e9 son centre de recherche, Diabolocom Research, d\u00e9di\u00e9 \u00e0 relever les d\u00e9fis de la conception de syst\u00e8mes de centres de contact responsables, fiables, \u00e9thiques et performants. Le laboratoire se concentre sur le d\u00e9veloppement de technologies de pointe dans le domaine du traitement de la parole, du traitement du langage naturel, de l'IA conversationnelle et de l'optimisation mat\u00e9riel-algorithme.<\/p>\n<\/div><div class=\"fusion-text fusion-text-24\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Contacts presse :<\/strong><\/span><br \/>\nNada Nachit : nada.nachit@diabolocom.com<\/p>\n<\/div><div class=\"fusion-text fusion-text-25\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><strong><span style=\"text-decoration: underline;\">A propos de <a href=\"https:\/\/www.artefact.com\/fr\/\">Artefact<\/a><\/span> :<\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-26\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Artefact est une soci\u00e9t\u00e9 fran\u00e7aise de conseil et d'ing\u00e9nierie sp\u00e9cialis\u00e9e dans data et l'IA, et un leader europ\u00e9en dans ce domaine. Bas\u00e9 \u00e0 Paris, nous sommes aujourd'hui pr\u00e9sents dans 23 pays sur tous les continents, avec une \u00e9quipe de 1 500 collaborateurs.<\/p>\n<p>Notre mission est d'aider les entreprises \u00e0 exploiter tout le potentiel de l'IA et de data en d\u00e9veloppant des solutions sur mesure qui r\u00e9pondent \u00e0 leurs d\u00e9fis industriels sp\u00e9cifiques. Pionniers dans ce domaine, nous combinons expertise technologique et excellence op\u00e9rationnelle, en collaborant avec les principaux acteurs du march\u00e9. De la strat\u00e9gie aux op\u00e9rations, nous proposons une approche et des solutions de bout en bout : data strat\u00e9gie, data qualit\u00e9 et gouvernance, data platforms, AI Factory, data-driven exp\u00e9rience client et ROI marketing.<\/p>\n<p>Nos clients couvrent tous les secteurs \u00e9conomiques cl\u00e9s - industrie, commerce de d\u00e9tail, luxe, biens de consommation, soins de sant\u00e9, finance et autres - y compris les grandes entreprises internationales.<br \/>\nAu-del\u00e0 du conseil, nous nous engageons activement \u00e0 promouvoir une IA \u00e9thique et accessible. Nous avons lanc\u00e9 l\u201c\u201d\u00c9cole du Data\" pour faciliter les transitions de carri\u00e8re vers des r\u00f4les technologiques et \u00e9tabli des Artefact AI Research Center \u00e0 Paris et \u00e0 Shanghai.<\/p>\n<p><span style=\"font-weight: 400;\">Pour plus d'informations, consultez le site<\/span><a href=\"https:\/\/www.artefact.com\/fr\/\"> <span style=\"font-weight: 400;\">Artefact<\/span><\/a><span style=\"font-weight: 400;\">\u00a0<\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-27\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Contacts presse :<\/strong><\/span><br \/>\nAstrid Calippe : astrid.calippe@artefact.com<\/p>\n<\/div><\/div><\/div><\/div><\/article><\/p>","protected":false},"excerpt":{"rendered":"<p>Paris, le 10 mars 2025 \u2013 Entra\u00een\u00e9e sur 5 000 milliards de jetons, cette suite propose des mod\u00e8les souverains et open source offrant les meilleures performances en mati\u00e8re de repr\u00e9sentation textuelle pour les langues europ\u00e9ennes, ainsi que pour les t\u00e2ches li\u00e9es aux math\u00e9matiques et au codage.<\/p>","protected":false},"author":[],"featured_media":395626,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"news-category":[4918],"news-language":[311],"class_list":["post-395351","news","type-news","status-publish","has-post-thumbnail","hentry","news-category-press-release","news-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/news\/395351","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/news"}],"about":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/types\/news"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/media\/395626"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/media?parent=395351"}],"wp:term":[{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/author?post=395351"},{"taxonomy":"news-category","embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/news-category?post=395351"},{"taxonomy":"news-language","embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/news-language?post=395351"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}