	{"id":395351,"date":"2025-03-10T16:14:40","date_gmt":"2025-03-10T16:14:40","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=395351"},"modified":"2025-03-11T08:58:00","modified_gmt":"2025-03-11T08:58:00","slug":"artificial-intelligence-and-nlp-the-eurobert-encoder-suite-reaches-a-new-milestone","status":"publish","type":"news","link":"https:\/\/www.artefact.com\/br\/news\/artificial-intelligence-and-nlp-the-eurobert-encoder-suite-reaches-a-new-milestone\/","title":{"rendered":"Intelig\u00eancia artificial e PNL: o conjunto de codificadores EuroBERT atinge um novo marco"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-1 description\" style=\"--awb-text-color:var(--awb-color5);--awb-text-font-family:&quot;PT Serif&quot;;--awb-text-font-style:normal;--awb-text-font-weight:400;\"><p>Paris, 10 de mar\u00e7o de 2025<\/p>\n<p>Treinada em 5.000 bilh\u00f5es de tokens, essa su\u00edte oferece modelos soberanos e de c\u00f3digo aberto que proporcionam o melhor desempenho de representa\u00e7\u00e3o de texto para idiomas europeus, bem como para tarefas relacionadas \u00e0 matem\u00e1tica e \u00e0 codifica\u00e7\u00e3o.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div ><a class=\"fusion-button button-flat fusion-button-default-size button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" target=\"_self\" href=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2025\/03\/CentraleSupelec_Artefact_Diaboloco_ProjetEuroBERT_-1.pdf\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Comunicado de imprensa<\/span><\/a><\/div><\/div><\/div><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div ><a class=\"fusion-button button-flat fusion-button-default-size button-default fusion-button-default button-2 fusion-button-default-span fusion-button-default-type\" target=\"_self\" href=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2025\/03\/CentraleSupelec_Artefact_Diaboloco_EuroBERT-project_.pdf\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Comunicado \u00e0 imprensa<\/span><\/a><\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>A colabora\u00e7\u00e3o entre o laborat\u00f3rio MICS do CentraleSup\u00e9lec, a Diabolocom, a Artefact e a Unbabel, com o apoio da experi\u00eancia tecnol\u00f3gica da AMD e do CINES, resultou no lan\u00e7amento do mais avan\u00e7ado modelo de representa\u00e7\u00e3o de texto multil\u00edngue. Esse modelo serve como um bloco de constru\u00e7\u00e3o fundamental para recupera\u00e7\u00e3o de informa\u00e7\u00f5es (RAG), classifica\u00e7\u00e3o e estimativa de qualidade (resumo, tradu\u00e7\u00e3o).<\/p>\n<\/div><div class=\"fusion-text fusion-text-3\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Esses tipos de modelos s\u00e3o essenciais no processamento de linguagem natural (NLP) e est\u00e3o entre os mais baixados no Hugging Face h\u00e1 muitos anos. Sua capacidade de capturar com precis\u00e3o o significado e o contexto das frases, oferecendo uma compreens\u00e3o lingu\u00edstica refinada e aprofundada, \u00e9 crucial para o desenvolvimento de aplicativos avan\u00e7ados de artificial intelligence. O novo modelo EuroBERT est\u00e1 dispon\u00edvel desde 10 de mar\u00e7o de 2025, sob a licen\u00e7a Apache 2.0, no site <a href=\"https:\/\/huggingface.co\/EuroBERT\" target=\"_blank\" rel=\"noopener\">Plataforma Hugging Face.<\/a><\/p>\n<\/div><div class=\"fusion-text fusion-text-4\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>O projeto de pesquisa foi liderado por Nicolas Boizard, candidato a PhD do Cifre na Diabolocom, com contribui\u00e7\u00f5es importantes de Hippolyte Gisserot-Boukhlef, candidato a PhD do Cifre na Artefact, e Duarte Alves, candidato a PhD no Instituto Superior T\u00e9cnico (IST). Ele se baseia na pesquisa iniciada por Pierre Colombo, professor associado do CentraleSup\u00e9lec, e foi conduzido sob a supervis\u00e3o de C\u00e9line Hudelot, diretora do MICS, e Andr\u00e9 Martins, professor associado do IST. Os resultados est\u00e3o detalhados em um artigo publicado no arXiv em 10 de mar\u00e7o de 2025: <a href=\"https:\/\/arxiv.org\/abs\/2503.05500\" target=\"_blank\" rel=\"noopener\">https:\/\/arxiv.org\/abs\/2503.05500<\/a><\/p>\n<\/div><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;--awb-font-size:14px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\"><strong>Um novo salto tecnol\u00f3gico na codifica\u00e7\u00e3o de textos<\/strong><\/h2><\/div><div class=\"fusion-text fusion-text-5\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>O EuroBERT se destaca dos codificadores atualmente dispon\u00edveis em cinco aspectos principais:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Ele \u00e9 soberano e totalmente de c\u00f3digo aberto, incluindo seu c\u00f3digo-fonte e os datasets.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Ele \u00e9 compat\u00edvel com os 8 principais idiomas europeus, bem como com 7 dos idiomas n\u00e3o europeus mais falados.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Treinado em 5 trilh\u00f5es de tokens, o dobro da quantidade de data usada para codificadores padr\u00e3o ou modelos generativos como o Llama 2 (2 trilh\u00f5es de tokens), o EuroBERT oferece recursos ideais sem custos adicionais de uso.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>A fam\u00edlia EuroBERT oferece a melhor base para recupera\u00e7\u00e3o de informa\u00e7\u00f5es (RAG), classifica\u00e7\u00e3o e estimativa de qualidade (resumo, tradu\u00e7\u00e3o).<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Ele se destaca em \u00e1reas at\u00e9 ent\u00e3o pouco exploradas, como processamento matem\u00e1tico data e linguagens de programa\u00e7\u00e3o.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-6\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Ele est\u00e1 dispon\u00edvel em tr\u00eas tamanhos de modelo (210M, 610M e 2.1B), oferecendo um equil\u00edbrio ideal entre velocidade, qualidade e custo, adaptado \u00e0s necessidades dos usu\u00e1rios corporativos.<br \/>\nAssim, o EuroBERT est\u00e1 transformando os aplicativos de processamento de linguagem natural baseados em representa\u00e7\u00f5es de frases, como an\u00e1lise de texto, recupera\u00e7\u00e3o de informa\u00e7\u00f5es, classifica\u00e7\u00e3o e extra\u00e7\u00e3o de informa\u00e7\u00f5es.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\"><strong>A for\u00e7a e o valor agregado da pesquisa colaborativa<\/strong><\/h2><\/div><div class=\"fusion-text fusion-text-7\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Assim como os modelos CroissantLLM e EuroLLM publicados no Hugging Face em 2024, esses avan\u00e7os cient\u00edficos foram poss\u00edveis gra\u00e7as a uma colabora\u00e7\u00e3o p\u00fablico-privada estreita e din\u00e2mica, enraizada no ecossistema Paris-Saclay e estendida por toda a Europa. As equipes do MICS, IST, Diabolocom, Artefact e Unbabel trabalharam juntas dentro da estrutura de tr\u00eas projetos de doutorado em andamento, apoiados pelo supercomputador franc\u00eas Adastra, alimentado por aceleradores AMD Instinct\u2122 e processadores AMD EPYC\u2122.<\/p>\n<\/div><div class=\"fusion-text fusion-text-8\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Reconhecido mundialmente por sua excel\u00eancia em matem\u00e1tica e ci\u00eancia da computa\u00e7\u00e3o, o laborat\u00f3rio MICS do CentraleSup\u00e9lec lidera v\u00e1rios programas e projetos de pesquisa em parceria com organiza\u00e7\u00f5es p\u00fablicas e privadas, expandindo continuamente os limites do artificial intelligence. A Diabolocom, por meio de seu produto de suporte ao relacionamento com o cliente, contribuiu com sua experi\u00eancia em processamento de idiomas, que foi integrada ao seu produto. A Artefact, l\u00edder europeia em IA e consultoria data, forneceu sua experi\u00eancia intersetorial e vis\u00e3o estrat\u00e9gica em v\u00e1rios aplicativos empresariais. Por fim, a Unbabel, l\u00edder em tecnologia de tradu\u00e7\u00e3o autom\u00e1tica, contribuiu com sua experi\u00eancia em IA multil\u00edngue.<\/p>\n<\/div><div class=\"fusion-text fusion-text-9\"><blockquote>\n<div class=\"quote\">\u201cUm m\u00eas ap\u00f3s a AI Action Summit em Paris, estamos particularmente empolgados em anunciar o lan\u00e7amento do EuroBERT. Essa fam\u00edlia de modelos de codificadores para idiomas europeus \u00e9 a solu\u00e7\u00e3o mais abrangente e de alto desempenho para tarefas em n\u00edvel de documento. No atual cen\u00e1rio de IA, os modelos de codificadores s\u00e3o frequentemente ignorados, apesar de sua import\u00e2ncia nos aplicativos de PNL. Por exemplo, o BERT, introduzido em 2017, ainda recebe quase cinco milh\u00f5es de downloads por m\u00eas na Hugging Face, superando o LLaMA e outros modelos semelhantes\u201d.\u201d<\/div>\n<div class=\"quote-baseline\">enfatiza <strong>C\u00e9line Hudelot, professora do CentraleSup\u00e9lec e diretora do laborat\u00f3rio MICS.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-10\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Com o estabelecimento de seu centro de pesquisa, Diabolocom Research, no in\u00edcio de 2025, a Diabolocom est\u00e1 se equipando com novos recursos para fornecer solu\u00e7\u00f5es concretas e eficientes para as demandas do mercado por sistemas de IA confi\u00e1veis, soberanos e de alto desempenho.<\/p>\n<\/div><div class=\"fusion-text fusion-text-11\"><blockquote>\n<div class=\"quote\">\u201cA colabora\u00e7\u00e3o multidisciplinar e as contribui\u00e7\u00f5es para projetos de c\u00f3digo aberto est\u00e3o no centro de nossa estrat\u00e9gia para permanecer na vanguarda da inova\u00e7\u00e3o. O EuroBERT, nossa mais recente iniciativa de pesquisa, aborda v\u00e1rias limita\u00e7\u00f5es dos codificadores existentes. Esse modelo aprimorar\u00e1 a funcionalidade de v\u00e1rias solu\u00e7\u00f5es, incluindo recupera\u00e7\u00e3o autom\u00e1tica de informa\u00e7\u00f5es, classifica\u00e7\u00e3o automatizada e sistemas baseados em agentes\u201d.\u201d<\/div>\n<div class=\"quote-baseline\">explica<strong> Fr\u00e9d\u00e9ric Durand, presidente e fundador da Diabolocom<\/strong>.<\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-12\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>A Artefact, por sua vez, tem se envolvido ativamente na pesquisa de IA por meio de seu centro de pesquisa, inaugurado h\u00e1 um ano.<\/p>\n<\/div><div class=\"fusion-text fusion-text-13\"><blockquote>\n<div class=\"quote\">\u201cNosso objetivo \u00e9 desenvolver e distribuir modelos \u00fateis e pr\u00e1ticos para aplica\u00e7\u00f5es comerciais concretas. Como resultado, todas as nossas publica\u00e7\u00f5es e algoritmos s\u00e3o de c\u00f3digo aberto. Os avan\u00e7os na codifica\u00e7\u00e3o de documentos representados pelo EuroBERT abrem novas possibilidades para melhorar a efici\u00eancia e a relev\u00e2ncia da classifica\u00e7\u00e3o de documentos, da recupera\u00e7\u00e3o inteligente de informa\u00e7\u00f5es e do reconhecimento de entidades nomeadas (NER). Ao se concentrar na an\u00e1lise de documentos existentes em vez de gerar novos documentos, o EuroBERT atende a uma necessidade cr\u00edtica e recorrente de an\u00e1lise de texto comercial\u201d.\u201d<\/div>\n<div class=\"quote-baseline\"><strong>Emmanuel Malherbe, Diretor do Artefact Research Center<\/strong>.<\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-14\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Quanto \u00e0 Unbabel, a primeira plataforma de opera\u00e7\u00f5es lingu\u00edsticas com tecnologia de IA:<\/p>\n<\/div><div class=\"fusion-text fusion-text-15\"><blockquote>\n<div class=\"quote\">\u201cO EuroBERT representa um grande avan\u00e7o na IA multil\u00edngue. H\u00e1 muito tempo, os modelos codificadores t\u00eam sido um her\u00f3i desconhecido da PNL, fornecendo a compreens\u00e3o lingu\u00edstica profunda necess\u00e1ria para aplicativos de IA de alto desempenho. Ao contr\u00e1rio das abordagens puramente generativas, os codificadores s\u00e3o excelentes na captura de significado e contexto - elementos-chave para sistemas multil\u00edngues precisos e escal\u00e1veis. Na Unbabel, temos grande experi\u00eancia n\u00e3o apenas no desenvolvimento de solu\u00e7\u00f5es de LLM generativas, como nossos modelos Tower de ponta, mas tamb\u00e9m na cria\u00e7\u00e3o de solu\u00e7\u00f5es baseadas em codificadores de refer\u00eancia, como o Comet e o CometKiwi. O lan\u00e7amento do EuroBERT chega em um momento crucial, abordando a falta de codificadores multil\u00edngues treinados com os mais recentes avan\u00e7os em modelos generativos. Isso marca mais um passo na constru\u00e7\u00e3o da infraestrutura essencial para fortalecer a soberania de IA da Europa, e temos orgulho de contribuir com projetos como o EuroBERT e o EuroLLM, que aprimoram as capacidades europeias e garantem nosso futuro digital compartilhado\u201d.\u201d<\/div>\n<div class=\"quote-baseline\">acrescenta <strong>Nuno Miguel Guerreiro, pesquisador da Unbabel.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-16\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Esse projeto tamb\u00e9m foi poss\u00edvel gra\u00e7as aos aceleradores AMD Instinct\u2122 MI300A, integrados ao Adastra, o supercomputador franc\u00eas altamente eficiente.<\/p>\n<\/div><div class=\"fusion-text fusion-text-17\"><blockquote>\n<div class=\"quote\">\u201cO desenvolvimento do EuroBERT representa um marco significativo em nossos esfor\u00e7os para aprimorar os recursos de processamento de linguagem natural para idiomas europeus, impulsionados por pesquisas na Fran\u00e7a. Aproveitando as GPUs MI300 da AMD e sua arquitetura de mem\u00f3ria unificada, alcan\u00e7amos um desempenho e uma efici\u00eancia sem precedentes. Esse projeto ressalta o compromisso da AMD com a inova\u00e7\u00e3o e a excel\u00eancia em artificial intelligence\u201d.\u201d<\/div>\n<div class=\"quote-baseline\">diz <strong>Julien Ruiz, Diretor da AMD Fran\u00e7a.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-18\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>O desenvolvimento do EuroBERT tamb\u00e9m envolveu contribui\u00e7\u00f5es de equipes da Universit\u00e9 Grenoble Alpes, CNRS, LISN, Illuin Technology, IRT Saint-Exup\u00e9ry e CINES.<\/p>\n<\/div><div class=\"fusion-text fusion-text-19\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Sobre <a href=\"http:\/\/www.centralesupelec.fr\" target=\"_blank\" rel=\"noopener\">CentralSup\u00e9lec<\/a> - www.centralesupelec.fr<\/strong><\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-20\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>A CentraleSup\u00e9lec \u00e9 uma institui\u00e7\u00e3o p\u00fablica dedicada \u00e0 educa\u00e7\u00e3o cient\u00edfica, cultural e profissional, fundada em janeiro de 2015 por meio da fus\u00e3o da \u00c9cole Centrale Paris e da Sup\u00e9lec. Atualmente, a CentraleSup\u00e9lec opera em quatro campi na Fran\u00e7a (Paris-Saclay, Metz, Rennes e Reims) e tem mais de 5.400 alunos, incluindo 3.800 alunos de engenharia. A institui\u00e7\u00e3o abriga 18 laborat\u00f3rios ou equipes de pesquisa. Com uma forte presen\u00e7a internacional - 25% de seus alunos e quase um quarto de seu corpo docente v\u00eam do exterior - o CentreSup\u00e9lec estabeleceu mais de 170 parcerias com as principais institui\u00e7\u00f5es do mundo. Uma escola l\u00edder em ensino superior e pesquisa, serve como refer\u00eancia nas \u00e1reas de engenharia e ci\u00eancias de sistemas. Em 2020, o CentraleSup\u00e9lec co-fundou a Universit\u00e9 Paris-Saclay e atualmente lidera o Groupe des \u00c9coles Centrale (CentraleSup\u00e9lec, Centrale Lyon, Centrale Lille, Centrale Nantes e Centrale M\u00e9diterran\u00e9e), que supervisiona os campi internacionais em Pequim (China), Hyderabad (\u00cdndia) e Casablanca (Marrocos).<\/p>\n<p><strong>Sobre o Laborat\u00f3rio MICS<\/strong><br \/>\nFundado no in\u00edcio dos anos 2000, o laborat\u00f3rio MICS re\u00fane pesquisas em Matem\u00e1tica e Ci\u00eancia da Computa\u00e7\u00e3o no CentraleSup\u00e9lec. Posicionado no centro das tecnologias digitais, sua pesquisa se concentra na modelagem, simula\u00e7\u00e3o, an\u00e1lise e otimiza\u00e7\u00e3o de sistemas complexos, abrangendo aplica\u00e7\u00f5es industriais, ci\u00eancias da vida, mercados financeiros e redes de informa\u00e7\u00e3o. O laborat\u00f3rio MICS est\u00e1 estruturado em seis equipes de pesquisa, buscando objetivos cient\u00edficos compartilhados, juntamente com um foco interdisciplinar em Intelig\u00eancia Artificial.<\/p>\n<\/div><div class=\"fusion-text fusion-text-21\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Contatos para a imprensa:<\/strong><\/span><br \/>\nClaire Flin: clairefline@gmail.com \u2013 +33 6 95 41 95 90<br \/>\nMarion Molina: marionmolinapro@gmail.com \u2013 +33 6 29 11 52 08<\/p>\n<\/div><div class=\"fusion-text fusion-text-22\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Sobre <a href=\"http:\/\/www.diabolocom.com\" target=\"_blank\" rel=\"noopener\">Diabolocom<\/a> - www.diabolocom.com<\/strong><\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-23\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>H\u00e1 mais de 20 anos, a Diabolocom vem revolucionando as intera\u00e7\u00f5es com os clientes com sua solu\u00e7\u00e3o CCaaS (Contact Center as a Service) baseada em cloud, aprimorada por IA generativa propriet\u00e1ria. A automa\u00e7\u00e3o inteligente, a acessibilidade aprimorada e a an\u00e1lise confi\u00e1vel fornecem \u00e0s equipes de atendimento ao cliente e de vendas as ferramentas necess\u00e1rias para o sucesso. Projetada especificamente para o relacionamento com o cliente, a IA da Diabolocom apresenta transcri\u00e7\u00e3o em tempo real, an\u00e1lise de satisfa\u00e7\u00e3o e recomenda\u00e7\u00f5es de a\u00e7\u00f5es, minimizando as tarefas repetitivas. O resultado: intera\u00e7\u00f5es hiperpersonalizadas, maior fidelidade do cliente e vendas otimizadas. Ao oferecer visibilidade total de cada intera\u00e7\u00e3o com o cliente, a solu\u00e7\u00e3o da Diabolocom ajuda empresas l\u00edderes como Carrefour, Air Liquide, Meilleurtaux e Leboncoin a transformar suas rela\u00e7\u00f5es com os clientes em mais de 60 pa\u00edses.<\/p>\n<p>Com presen\u00e7a na Europa, Am\u00e9rica do Norte, Brasil e Oriente M\u00e9dio, a Diabolocom apoia as organiza\u00e7\u00f5es no aprimoramento das rela\u00e7\u00f5es com os clientes em escala global.<\/p>\n<p>Em 2025, a Diabolocom lan\u00e7ou seu centro de pesquisa, o Diabolocom Research, dedicado a enfrentar os desafios de projetar sistemas de contact center respons\u00e1veis, confi\u00e1veis, \u00e9ticos e de alto desempenho. O laborat\u00f3rio se concentra no desenvolvimento de tecnologias de ponta em processamento de fala, processamento de linguagem natural, IA de conversa\u00e7\u00e3o e otimiza\u00e7\u00e3o de algoritmos de hardware.<\/p>\n<\/div><div class=\"fusion-text fusion-text-24\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Contatos para a imprensa:<\/strong><\/span><br \/>\nNada Nachit: nada.nachit@diabolocom.com<\/p>\n<\/div><div class=\"fusion-text fusion-text-25\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><strong><span style=\"text-decoration: underline;\">Sobre <a href=\"https:\/\/www.artefact.com\/br\/\">Artefact<\/a><\/span> :<\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-26\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>A Artefact \u00e9 uma empresa francesa de consultoria e engenharia especializada em data e IA, e l\u00edder europeia no setor. Com sede em Paris, atualmente estamos presentes em 23 pa\u00edses em todos os continentes, com uma equipe de 1.500 funcion\u00e1rios.<\/p>\n<p>Nossa miss\u00e3o \u00e9 ajudar as empresas a desbloquear todo o potencial da IA e da data, desenvolvendo solu\u00e7\u00f5es personalizadas que abordem seus desafios espec\u00edficos do setor. Como pioneiros nesse campo, combinamos conhecimento tecnol\u00f3gico com excel\u00eancia operacional, colaborando com os principais participantes do mercado. Da estrat\u00e9gia \u00e0s opera\u00e7\u00f5es, oferecemos uma abordagem e solu\u00e7\u00f5es de ponta a ponta: data estrat\u00e9gia, data qualidade e governan\u00e7a, data platforms, AI Factory, data-driven experi\u00eancia do cliente e ROI de marketing<\/p>\n<p>Nossos clientes abrangem todos os principais setores econ\u00f4micos - ind\u00fastria, varejo, luxo, bens de consumo, sa\u00fade, finan\u00e7as e outros - incluindo grandes corpora\u00e7\u00f5es internacionais.<br \/>\nAl\u00e9m da consultoria, estamos ativamente comprometidos com a promo\u00e7\u00e3o de uma IA \u00e9tica e acess\u00edvel. Lan\u00e7amos a \u201cSchool of Data\u201d para facilitar a transi\u00e7\u00e3o de carreira para fun\u00e7\u00f5es tecnol\u00f3gicas e estabelecemos Artefact AI Research Centers em Paris e Xangai.<\/p>\n<p><span style=\"font-weight: 400;\">Obtenha mais informa\u00e7\u00f5es em<\/span><a href=\"https:\/\/www.artefact.com\/br\/\"> <span style=\"font-weight: 400;\">Artefact<\/span><\/a><span style=\"font-weight: 400;\">\u00a0<\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-27\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Contatos para a imprensa:<\/strong><\/span><br \/>\nAstrid Calippe: astrid.calippe@artefact.com<\/p>\n<\/div><\/div><\/div><\/div><\/article><\/p>","protected":false},"excerpt":{"rendered":"<p>Paris, 10 de mar\u00e7o de 2025 \u2013 Treinada com 5.000 bilh\u00f5es de tokens, esta su\u00edte oferece modelos independentes e de c\u00f3digo aberto que proporcionam o melhor desempenho em representa\u00e7\u00e3o de texto para as l\u00ednguas europeias, bem como para tarefas relacionadas \u00e0 matem\u00e1tica e \u00e0 programa\u00e7\u00e3o.<\/p>","protected":false},"author":[],"featured_media":395626,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"news-category":[4918],"news-language":[311],"class_list":["post-395351","news","type-news","status-publish","has-post-thumbnail","hentry","news-category-press-release","news-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/br\/wp-json\/wp\/v2\/news\/395351","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/br\/wp-json\/wp\/v2\/news"}],"about":[{"href":"https:\/\/www.artefact.com\/br\/wp-json\/wp\/v2\/types\/news"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/br\/wp-json\/wp\/v2\/media\/395626"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/br\/wp-json\/wp\/v2\/media?parent=395351"}],"wp:term":[{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.artefact.com\/br\/wp-json\/wp\/v2\/author?post=395351"},{"taxonomy":"news-category","embeddable":true,"href":"https:\/\/www.artefact.com\/br\/wp-json\/wp\/v2\/news-category?post=395351"},{"taxonomy":"news-language","embeddable":true,"href":"https:\/\/www.artefact.com\/br\/wp-json\/wp\/v2\/news-language?post=395351"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}