{"id":395351,"date":"2025-03-10T16:14:40","date_gmt":"2025-03-10T16:14:40","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=395351"},"modified":"2025-03-11T08:58:00","modified_gmt":"2025-03-11T08:58:00","slug":"artificial-intelligence-and-nlp-the-eurobert-encoder-suite-reaches-a-new-milestone","status":"publish","type":"news","link":"https:\/\/www.artefact.com\/de\/news\/artificial-intelligence-and-nlp-the-eurobert-encoder-suite-reaches-a-new-milestone\/","title":{"rendered":"K\u00fcnstliche Intelligenz und NLP: die EuroBERT Encoder Suite erreicht einen neuen Meilenstein"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-1 description\" style=\"--awb-text-color:var(--awb-color5);--awb-text-font-family:&quot;PT Serif&quot;;--awb-text-font-style:normal;--awb-text-font-weight:400;\"><p>Paris, 10. M\u00e4rz 2025<\/p>\n<p>Diese Suite wurde auf der Grundlage von 5.000 Milliarden Token trainiert und bietet souver\u00e4ne, quelloffene Modelle, die die beste Textdarstellungsleistung f\u00fcr europ\u00e4ische Sprachen sowie f\u00fcr Aufgaben im Zusammenhang mit Mathematik und Codierung liefern.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div ><a class=\"fusion-button button-flat fusion-button-default-size button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" target=\"_self\" href=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2025\/03\/CentraleSupelec_Artefact_Diaboloco_ProjetEuroBERT_-1.pdf\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Communiqu\u00e9 de presse<\/span><\/a><\/div><\/div><\/div><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div ><a class=\"fusion-button button-flat fusion-button-default-size button-default fusion-button-default button-2 fusion-button-default-span fusion-button-default-type\" target=\"_self\" href=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2025\/03\/CentraleSupelec_Artefact_Diaboloco_EuroBERT-project_.pdf\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Pressemitteilung<\/span><\/a><\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Die Zusammenarbeit zwischen dem MICS-Labor von CentraleSup\u00e9lec, Diabolocom, Artefact und Unbabel, unterst\u00fctzt durch das technologische Know-how von AMD und CINES, hat zur Ver\u00f6ffentlichung des fortschrittlichsten Modells zur Darstellung mehrsprachiger Texte gef\u00fchrt. Dieses Modell dient als grundlegender Baustein f\u00fcr Information Retrieval (RAG), Klassifizierung und Qualit\u00e4tsbewertung (Zusammenfassung, \u00dcbersetzung).<\/p>\n<\/div><div class=\"fusion-text fusion-text-3\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Diese Art von Modellen ist f\u00fcr die Verarbeitung nat\u00fcrlicher Sprache (NLP) unverzichtbar und geh\u00f6rt seit vielen Jahren zu den am h\u00e4ufigsten heruntergeladenen auf Hugging Face. Ihre F\u00e4higkeit, die Bedeutung und den Kontext von S\u00e4tzen genau zu erfassen und ein verfeinertes und tiefgehendes linguistisches Verst\u00e4ndnis zu bieten, ist f\u00fcr die Entwicklung fortschrittlicher artificial intelligence-Anwendungen von entscheidender Bedeutung. Das neue EuroBERT-Modell ist ab dem 10. M\u00e4rz 2025 unter der Apache 2.0 Lizenz auf der <a href=\"https:\/\/huggingface.co\/EuroBERT\" target=\"_blank\" rel=\"noopener\">Umarmende Gesichtsplattform.<\/a><\/p>\n<\/div><div class=\"fusion-text fusion-text-4\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Das Forschungsprojekt wurde von Nicolas Boizard, einem Cifre-Doktoranden bei Diabolocom, geleitet. Wichtige Beitr\u00e4ge leisteten Hippolyte Gisserot-Boukhlef, ein Cifre-Doktorand bei Artefact, und Duarte Alves, ein Doktorand am Instituto Superior T\u00e9cnico (IST). Die Studie basiert auf Forschungsarbeiten, die von Pierre Colombo, au\u00dferordentlicher Professor am CentraleSup\u00e9lec, initiiert wurden und unter der Aufsicht von C\u00e9line Hudelot, Direktorin des MICS, und Andr\u00e9 Martins, au\u00dferordentlicher Professor am IST, durchgef\u00fchrt wurden. Die Ergebnisse sind in einem Papier, das am 10. M\u00e4rz 2025 auf arXiv ver\u00f6ffentlicht wurde, detailliert beschrieben: <a href=\"https:\/\/arxiv.org\/abs\/2503.05500\" target=\"_blank\" rel=\"noopener\">https:\/\/arxiv.org\/abs\/2503.05500<\/a><\/p>\n<\/div><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;--awb-font-size:14px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\"><strong>Ein neuer Technologiesprung in der Textkodierung<\/strong><\/h2><\/div><div class=\"fusion-text fusion-text-5\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>EuroBERT unterscheidet sich in f\u00fcnf wesentlichen Punkten von den derzeit erh\u00e4ltlichen Encodern:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Es ist souver\u00e4n und vollst\u00e4ndig quelloffen, sowohl was den Quellcode als auch die data-Sets betrifft.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Es unterst\u00fctzt 8 wichtige europ\u00e4ische Sprachen sowie 7 der am h\u00e4ufigsten gesprochenen au\u00dfereurop\u00e4ischen Sprachen.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>EuroBERT wurde auf 5 Billionen Token trainiert, doppelt so viel wie data, das f\u00fcr Standard-Encoder oder generative Modelle wie Llama 2 (2 Billionen Token) verwendet wird, und bietet somit optimale F\u00e4higkeiten ohne zus\u00e4tzliche Nutzungskosten.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Die EuroBERT-Familie bietet die beste Grundlage f\u00fcr Information Retrieval (RAG), Klassifizierung und Qualit\u00e4tseinsch\u00e4tzung (Zusammenfassung, \u00dcbersetzung).<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Es zeichnet sich durch bisher wenig erforschte Bereiche wie die mathematische data-Verarbeitung und Programmiersprachen aus.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-6\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Er ist in drei Modellgr\u00f6\u00dfen (210M, 610M und 2.1B) erh\u00e4ltlich und bietet ein optimales Gleichgewicht zwischen Geschwindigkeit, Qualit\u00e4t und Kosten, das auf die Bed\u00fcrfnisse von Unternehmensanwendern zugeschnitten ist.<br \/>\nEuroBERT transformiert damit Anwendungen zur Verarbeitung nat\u00fcrlicher Sprache, die auf Satzrepr\u00e4sentationen basieren, wie Textanalyse, Informationsabfrage, Klassifizierung und Informationsextraktion.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\"><strong>Die St\u00e4rke und der Mehrwert der kollaborativen Forschung<\/strong><\/h2><\/div><div class=\"fusion-text fusion-text-7\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Wie bei den CroissantLLM- und EuroLLM-Modellen, die 2024 auf Hugging Face ver\u00f6ffentlicht wurden, wurden diese wissenschaftlichen Fortschritte durch eine enge und dynamische \u00f6ffentlich-private Zusammenarbeit erm\u00f6glicht, die im Paris-Saclay-\u00d6kosystem verwurzelt ist und sich \u00fcber ganz Europa erstreckt. Die Teams von MICS, IST, Diabolocom, Artefact und Unbabel arbeiteten im Rahmen von drei laufenden PhD-Projekten zusammen, die vom franz\u00f6sischen Supercomputer Adastra unterst\u00fctzt wurden, der von AMD Instinct\u2122 Accelerators und AMD EPYC\u2122 Prozessoren angetrieben wird.<\/p>\n<\/div><div class=\"fusion-text fusion-text-8\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Das MICS-Labor von CentraleSup\u00e9lec, das weltweit f\u00fcr seine herausragenden Leistungen in den Bereichen Mathematik und Informatik anerkannt ist, leitet zahlreiche Forschungsprogramme und -projekte in Zusammenarbeit mit privaten und \u00f6ffentlichen Organisationen und verschiebt dabei st\u00e4ndig die Grenzen von artificial intelligence. Diabolocom hat mit seinem Produkt zur Unterst\u00fctzung von Kundenbeziehungen sein Fachwissen im Bereich der Sprachverarbeitung eingebracht, das in sein Produkt integriert wurde. Artefact, ein f\u00fchrendes europ\u00e4isches Unternehmen im Bereich KI und data-Beratung, hat sein sektor\u00fcbergreifendes Fachwissen und seine strategische Vision f\u00fcr zahlreiche Unternehmensanwendungen zur Verf\u00fcgung gestellt. Und schlie\u00dflich hat Unbabel, ein f\u00fchrendes Unternehmen im Bereich der maschinellen \u00dcbersetzung, sein Fachwissen im Bereich der mehrsprachigen KI eingebracht.<\/p>\n<\/div><div class=\"fusion-text fusion-text-9\"><blockquote>\n<div class=\"quote\">\u201cEinen Monat nach dem AI Action Summit in Paris freuen wir uns besonders, die Ver\u00f6ffentlichung von EuroBERT bekannt zu geben. Diese Familie von Encoder-Modellen f\u00fcr europ\u00e4ische Sprachen ist die umfassendste und leistungsst\u00e4rkste L\u00f6sung f\u00fcr Aufgaben auf Dokumentenebene. In der heutigen KI-Landschaft werden Encoder-Modelle trotz ihrer Bedeutung f\u00fcr NLP-Anwendungen oft \u00fcbersehen. BERT zum Beispiel, das 2017 eingef\u00fchrt wurde, wird immer noch fast f\u00fcnf Millionen Mal pro Monat auf Hugging Face heruntergeladen und \u00fcbertrifft damit LLaMA und andere \u00e4hnliche Modelle.\u201d<\/div>\n<div class=\"quote-baseline\">unterstreicht <strong>C\u00e9line Hudelot, Professorin an der CentraleSup\u00e9lec und Leiterin des MICS-Labors.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-10\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Mit der Gr\u00fcndung des Forschungszentrums Diabolocom Research Anfang 2025 stattet sich Diabolocom mit neuen Ressourcen aus, um konkrete und effiziente L\u00f6sungen f\u00fcr die Marktanforderungen an zuverl\u00e4ssige, souver\u00e4ne und leistungsstarke KI-Systeme zu liefern.<\/p>\n<\/div><div class=\"fusion-text fusion-text-11\"><blockquote>\n<div class=\"quote\">\u201cMultidisziplin\u00e4re Zusammenarbeit und Beitr\u00e4ge zu Open-Source-Projekten sind das Herzst\u00fcck unserer Strategie, um an der Spitze der Innovation zu bleiben. EuroBERT, unsere j\u00fcngste Forschungsinitiative, befasst sich mit mehreren Einschr\u00e4nkungen bestehender Kodierer. Dieses Modell wird die Funktionalit\u00e4t mehrerer L\u00f6sungen verbessern, einschlie\u00dflich der automatischen Informationsbeschaffung, der automatischen Klassifizierung und der agentenbasierten Systeme.\u201d<\/div>\n<div class=\"quote-baseline\">erkl\u00e4rt<strong> Fr\u00e9d\u00e9ric Durand, Pr\u00e4sident und Gr\u00fcnder von Diabolocom<\/strong>.<\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-12\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Artefact seinerseits hat sich \u00fcber sein vor einem Jahr er\u00f6ffnetes Forschungszentrum aktiv in der KI-Forschung engagiert.<\/p>\n<\/div><div class=\"fusion-text fusion-text-13\"><blockquote>\n<div class=\"quote\">\u201cUnser Ziel ist es, n\u00fctzliche, praktische Modelle f\u00fcr konkrete Gesch\u00e4ftsanwendungen zu entwickeln und zu verbreiten. Daher sind alle unsere Ver\u00f6ffentlichungen und Algorithmen Open-Source. Die Fortschritte in der Dokumentenkodierung, f\u00fcr die EuroBERT steht, er\u00f6ffnen neue M\u00f6glichkeiten zur Verbesserung der Effizienz und Relevanz von Dokumentenklassifizierung, intelligentem Information Retrieval und Named Entity Recognition (NER). Da sich EuroBERT auf die Analyse bestehender Dokumente konzentriert, anstatt neue Dokumente zu generieren, erf\u00fcllt es einen kritischen und immer wiederkehrenden Bedarf f\u00fcr die Textanalyse in Unternehmen.\u201d<\/div>\n<div class=\"quote-baseline\"><strong>Emmanuel Malherbe, Direktor des Artefact Research Center<\/strong>.<\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-14\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Was Unbabel betrifft, die erste KI-gest\u00fctzte Plattform f\u00fcr Sprachoperationen:<\/p>\n<\/div><div class=\"fusion-text fusion-text-15\"><blockquote>\n<div class=\"quote\">\u201cEuroBERT stellt einen gro\u00dfen Durchbruch in der mehrsprachigen KI dar. Encoder-Modelle sind seit langem ein unbesungener Held der NLP, denn sie liefern das tiefe linguistische Verst\u00e4ndnis, das f\u00fcr leistungsstarke KI-Anwendungen notwendig ist. Im Gegensatz zu rein generativen Ans\u00e4tzen zeichnen sich Encoder durch die Erfassung von Bedeutung und Kontextelementen aus - Schl\u00fcsselelemente f\u00fcr pr\u00e4zise und skalierbare mehrsprachige Systeme. Wir bei Unbabel verf\u00fcgen nicht nur \u00fcber eine gro\u00dfe Erfahrung in der Entwicklung generativer LLM-L\u00f6sungen, wie z.B. unsere innovativen Tower-Modelle, sondern auch in der Entwicklung von Referenzl\u00f6sungen auf Encoder-Basis wie Comet und CometKiwi. Die Einf\u00fchrung von EuroBERT kommt zu einem entscheidenden Zeitpunkt, da es an mehrsprachigen Encodern mangelt, die mit den neuesten generativen Modellen trainiert wurden. Dies ist ein weiterer Schritt auf dem Weg zum Aufbau der notwendigen Infrastruktur f\u00fcr die St\u00e4rkung der KI-Souver\u00e4nit\u00e4t Europas. Wir sind stolz darauf, mit Projekten wie EuroBERT und EuroLLM einen Beitrag zu leisten, der die europ\u00e4ischen F\u00e4higkeiten verbessert und unsere gemeinsame digitale Zukunft sichert.\u201d<\/div>\n<div class=\"quote-baseline\">f\u00fcgt  hinzu <strong>Nuno Miguel Guerreiro, Forscher bei Unbabel.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-16\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Dieses Projekt wurde auch dank der AMD Instinct\u2122 MI300A Beschleuniger m\u00f6glich, die in Adastra, dem hocheffizienten franz\u00f6sischen Supercomputer, integriert sind.<\/p>\n<\/div><div class=\"fusion-text fusion-text-17\"><blockquote>\n<div class=\"quote\">\u201cDie Entwicklung von EuroBERT stellt einen wichtigen Meilenstein in unseren Bem\u00fchungen dar, die F\u00e4higkeiten zur Verarbeitung nat\u00fcrlicher Sprache f\u00fcr europ\u00e4ische Sprachen zu verbessern, die von der Forschung in Frankreich vorangetrieben wurden. Durch den Einsatz der MI300 Grafikprozessoren von AMD und ihrer einheitlichen Speicherarchitektur haben wir eine noch nie dagewesene Leistung und Effizienz erreicht. Dieses Projekt unterstreicht das Engagement von AMD f\u00fcr Innovation und Exzellenz im Bereich artificial intelligence.\u201d<\/div>\n<div class=\"quote-baseline\">sagt <strong>Julien Ruiz, Direktor von AMD Frankreich.<\/strong><\/div>\n<\/blockquote>\n<\/div><div class=\"fusion-text fusion-text-18\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>An der Entwicklung von EuroBERT waren auch Teams der Universit\u00e9 Grenoble Alpes, des CNRS, des LISN, von Illuin Technology, des IRT Saint-Exup\u00e9ry und des CINES beteiligt.<\/p>\n<\/div><div class=\"fusion-text fusion-text-19\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>\u00dcber <a href=\"http:\/\/www.centralesupelec.fr\" target=\"_blank\" rel=\"noopener\">CentraleSup\u00e9lec<\/a> - www.centralesupelec.fr<\/strong><\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-20\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>CentraleSup\u00e9lec ist eine \u00f6ffentliche Einrichtung, die sich der wissenschaftlichen, kulturellen und beruflichen Bildung widmet und im Januar 2015 durch die Fusion der \u00c9cole Centrale Paris und Sup\u00e9lec gegr\u00fcndet wurde. Heute verf\u00fcgt die CentraleSup\u00e9lec \u00fcber vier Standorte in Frankreich (Paris-Saclay, Metz, Rennes und Reims) und hat mehr als 5.400 Studenten, darunter 3.800 Ingenieurstudenten. Die Einrichtung beherbergt 18 Forschungslabors oder -teams. Mit einer starken internationalen Pr\u00e4senz - 25% der Studenten und fast ein Viertel der Dozenten kommen aus dem Ausland - hat die CentraleSup\u00e9lec mehr als 170 Partnerschaften mit Spitzeneinrichtungen auf der ganzen Welt geschlossen. Als f\u00fchrende Schule in der Hochschulbildung und Forschung dient sie als Ma\u00dfstab in den Bereichen Ingenieur- und Systemwissenschaften. Im Jahr 2020 war die CentraleSup\u00e9lec Mitbegr\u00fcnderin der Universit\u00e9 Paris-Saclay und leitet derzeit die Groupe des \u00c9coles Centrale (CentraleSup\u00e9lec, Centrale Lyon, Centrale Lille, Centrale Nantes und Centrale M\u00e9diterran\u00e9e), die internationale Campusse in Peking (China), Hyderabad (Indien) und Casablanca (Marokko) betreut.<\/p>\n<p><strong>\u00dcber das MICS-Labor<\/strong><br \/>\nDas MICS-Labor wurde in den fr\u00fchen 2000er Jahren gegr\u00fcndet und vereint die Forschung in Mathematik und Informatik an der CentraleSup\u00e9lec. Im Zentrum der digitalen Technologien gelegen, konzentriert sich die Forschung auf die Modellierung, Simulation, Analyse und Optimierung komplexer Systeme, die industrielle Anwendungen, Biowissenschaften, Finanzm\u00e4rkte und Informationsnetzwerke umfassen. Das MICS-Labor ist in sechs Forschungsteams gegliedert, die gemeinsame wissenschaftliche Ziele verfolgen und einen disziplin\u00fcbergreifenden Schwerpunkt auf K\u00fcnstliche Intelligenz legen.<\/p>\n<\/div><div class=\"fusion-text fusion-text-21\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Presse-Kontakte:<\/strong><\/span><br \/>\nClaire Flin: clairefline@gmail.com \u2013 +33 6 95 41 95 90<br \/>\nMarion Molina: marionmolinapro@gmail.com \u2013 +33 6 29 11 52 08<\/p>\n<\/div><div class=\"fusion-text fusion-text-22\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>\u00dcber <a href=\"http:\/\/www.diabolocom.com\" target=\"_blank\" rel=\"noopener\">Diabolocom<\/a> - www.diabolocom.com<\/strong><\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-23\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Seit mehr als 20 Jahren revolutioniert Diabolocom die Kundeninteraktion mit seiner cloud-basierten CCaaS-L\u00f6sung (Contact Center as a Service), die durch eine propriet\u00e4re generative KI erg\u00e4nzt wird. Intelligente Automatisierung, verbesserte Erreichbarkeit und zuverl\u00e4ssige Analysen geben Kundendienst- und Vertriebsteams die Werkzeuge an die Hand, die sie f\u00fcr ihren Erfolg ben\u00f6tigen. Die KI von Diabolocom wurde speziell f\u00fcr Kundenbeziehungen entwickelt und bietet Echtzeit-Transkription, Zufriedenheitsanalyse und Handlungsempfehlungen bei gleichzeitiger Minimierung sich wiederholender Aufgaben. Das Ergebnis: Hyper-personalisierte Interaktionen, st\u00e4rkere Kundenbindung und optimierte Verk\u00e4ufe. Durch die vollst\u00e4ndige Transparenz jeder Kundeninteraktion hilft die L\u00f6sung von Diabolocom f\u00fchrenden Unternehmen wie Carrefour, Air Liquide, Meilleurtaux und Leboncoin, ihre Kundenbeziehungen in \u00fcber 60 L\u00e4ndern zu verbessern.<\/p>\n<p>Mit einer Pr\u00e4senz in Europa, Nordamerika, Brasilien und dem Nahen Osten unterst\u00fctzt Diabolocom Unternehmen bei der Verbesserung ihrer Kundenbeziehungen auf globaler Ebene.<\/p>\n<p>Im Jahr 2025 gr\u00fcndete Diabolocom sein Forschungszentrum Diabolocom Research, das sich den Herausforderungen bei der Entwicklung verantwortungsvoller, zuverl\u00e4ssiger, ethischer und leistungsstarker Contact Center-Systeme widmet. Das Labor konzentriert sich auf die Entwicklung von Spitzentechnologien in den Bereichen Sprachverarbeitung, nat\u00fcrliche Sprachverarbeitung, KI und Hardware-Algorithmus-Optimierung.<\/p>\n<\/div><div class=\"fusion-text fusion-text-24\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Presse-Kontakte:<\/strong><\/span><br \/>\nNada Nachit: nada.nachit@diabolocom.com<\/p>\n<\/div><div class=\"fusion-text fusion-text-25\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><strong><span style=\"text-decoration: underline;\">\u00dcber <a href=\"https:\/\/www.artefact.com\/de\/\">Artefact<\/a><\/span> :<\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-26\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Artefact ist ein franz\u00f6sisches Beratungs- und Ingenieurb\u00fcro, das auf data und KI spezialisiert ist und zu den europ\u00e4ischen Marktf\u00fchrern in diesem Bereich geh\u00f6rt. Wir haben unseren Hauptsitz in Paris und sind heute in 23 L\u00e4ndern auf allen Kontinenten mit einem Team von 1.500 Mitarbeitern vertreten.<\/p>\n<p>Unsere Aufgabe ist es, Unternehmen dabei zu helfen, das volle Potenzial von KI und data auszusch\u00f6pfen, indem wir ma\u00dfgeschneiderte L\u00f6sungen f\u00fcr ihre spezifischen Branchenherausforderungen entwickeln. Als Pioniere auf diesem Gebiet kombinieren wir technologisches Know-how mit operativer Exzellenz und arbeiten mit gro\u00dfen Marktteilnehmern zusammen. Von der Strategie bis zum Betrieb bieten wir einen End-to-End-Ansatz und L\u00f6sungen: data Strategie, data Qualit\u00e4t und Governance, data platforms, AI Factory, data-driven Kundenerfahrung und Marketing-ROI<\/p>\n<p>Unsere Kunden kommen aus allen wichtigen Wirtschaftsbereichen - Industrie, Einzelhandel, Luxusg\u00fcter, Konsumg\u00fcter, Gesundheitswesen, Finanzen und mehr - einschlie\u00dflich gro\u00dfer internationaler Unternehmen.<br \/>\n\u00dcber die Beratung hinaus engagieren wir uns aktiv f\u00fcr die F\u00f6rderung ethischer und zug\u00e4nglicher KI. Wir haben die \u201cSchool of Data\u201d ins Leben gerufen, um Karrierewege in technische Berufe zu erleichtern, und Artefact AI Research Centers in Paris und Shanghai gegr\u00fcndet.<\/p>\n<p><span style=\"font-weight: 400;\">Weitere Informationen finden Sie unter<\/span><a href=\"https:\/\/www.artefact.com\/de\/\"> <span style=\"font-weight: 400;\">Artefact<\/span><\/a><span style=\"font-weight: 400;\">\u00a0<\/span><\/p>\n<\/div><div class=\"fusion-text fusion-text-27\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p><span style=\"text-decoration: underline;\"><strong>Presse-Kontakte:<\/strong><\/span><br \/>\nAstrid Calippe: astrid.calippe@artefact.com<\/p>\n<\/div><\/div><\/div><\/div><\/article><\/p>","protected":false},"excerpt":{"rendered":"<p>Paris, 10. M\u00e4rz 2025 \u2013 Diese Modellsuite wurde auf der Grundlage von 5.000 Milliarden Token trainiert und bietet unabh\u00e4ngige Open-Source-Modelle, die die beste Leistung bei der Textdarstellung f\u00fcr europ\u00e4ische Sprachen sowie f\u00fcr Aufgaben im Bereich Mathematik und Programmierung liefern.<\/p>","protected":false},"author":[],"featured_media":395626,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"news-category":[4918],"news-language":[311],"class_list":["post-395351","news","type-news","status-publish","has-post-thumbnail","hentry","news-category-press-release","news-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/news\/395351","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/news"}],"about":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/types\/news"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media\/395626"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media?parent=395351"}],"wp:term":[{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/author?post=395351"},{"taxonomy":"news-category","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/news-category?post=395351"},{"taxonomy":"news-language","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/news-language?post=395351"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}