	{"id":95610,"date":"2024-02-08T16:25:33","date_gmt":"2024-02-08T16:25:33","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=blog&#038;p=95610"},"modified":"2024-09-20T17:46:02","modified_gmt":"2024-09-20T16:46:02","slug":"why-you-need-llmops","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/fr\/blog\/why-you-need-llmops\/","title":{"rendered":"Pourquoi vous avez besoin de LLMOps"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Auteur<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/meryam-assermouh.jpg\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-text-color:var(--awb-color7);--awb-margin-bottom-small:8px;--awb-font-size:18px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;Josefin Sans&quot;;font-style:normal;font-weight:600;margin:0;font-size:1em;--fontSize:18;line-height:1.5;\">Meryam Assermouh<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\" style=\"--awb-font-size:14px;--awb-line-height:1.6;--awb-letter-spacing:2px;--awb-text-transform:uppercase;--awb-text-color:var(--awb-color7);--awb-text-font-family:&quot;Roboto&quot;;--awb-text-font-style:normal;--awb-text-font-weight:400;\"><p>Data Engineer <a href=\"https:\/\/www.artefact.com\/fr\/\">\u00e0 Artefact France<\/a><\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">TL;DR<\/h2><\/div><div class=\"fusion-text fusion-text-2\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Cet article pr\u00e9sente le LLMOps, une branche sp\u00e9cialis\u00e9e fusionnant le DevOps et le MLOps pour les <strong>g\u00e9rer les d\u00e9fis pos\u00e9s par les grands mod\u00e8les linguistiques<\/strong> (LLM). Les LLM, comme le GPT de l'OpenAI, utilisent des textes \u00e9tendus data pour des t\u00e2ches telles que la g\u00e9n\u00e9ration de textes et la traduction de langues. Les LLMOps s'attaquent \u00e0 des probl\u00e8mes tels que <strong>personnalisation, modifications de l'API, d\u00e9rive data, \u00e9valuation du mod\u00e8le et surveillance<\/strong> gr\u00e2ce \u00e0 des outils tels que LangSmith, TruLens et W&amp;B Prompts. Il garantit l'adaptabilit\u00e9, l'\u00e9valuation et le suivi des mod\u00e8les linguistiques dans des sc\u00e9narios r\u00e9els, offrant ainsi une solution compl\u00e8te aux organisations qui exploitent ces mod\u00e8les linguistiques avanc\u00e9s.<\/p>\n<\/div><div class=\"fusion-text fusion-text-3\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Pour vous guider dans cette discussion, nous commencerons par revoir les principes fondamentaux de DevOps et MLOps, puis nous nous concentrerons sur LLMOps, en commen\u00e7ant par une br\u00e8ve introduction aux LLM et \u00e0 leur utilisation par les organisations. Ensuite, nous nous pencherons sur les principaux d\u00e9fis op\u00e9rationnels pos\u00e9s par la technologie LLM et sur la mani\u00e8re dont le LLMOps les aborde efficacement.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Principes fondamentaux pour LLMOps : DevOps et MLOps<\/h2><\/div><div class=\"fusion-text fusion-text-4\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>DevOps, abr\u00e9viation de Development and Operations, est un ensemble de pratiques visant \u00e0 automatiser le processus de livraison de logiciels, le rendant plus efficace, plus fiable et plus \u00e9volutif. Les principes fondamentaux de DevOps comprennent : la collaboration, l'automatisation, les tests continus, la surveillance et l'orchestration du d\u00e9ploiement.<\/p>\n<\/div><div class=\"fusion-text fusion-text-5\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>MLOps, abr\u00e9viation de Machine Learning Operations, est une extension des pratiques DevOps sp\u00e9cifiquement adapt\u00e9e \u00e0 la gestion du cycle de vie des mod\u00e8les d'apprentissage automatique. Elle r\u00e9pond aux d\u00e9fis uniques pos\u00e9s par la nature it\u00e9rative et exp\u00e9rimentale du d\u00e9veloppement de l'apprentissage automatique. Elle introduit des t\u00e2ches suppl\u00e9mentaires telles que la gestion des versions de data, ainsi que l'exp\u00e9rimentation et l'entra\u00eenement des mod\u00e8les.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">LLMOps : Gestion du d\u00e9ploiement et de la maintenance de grands mod\u00e8les linguistiques<\/h2><\/div><div class=\"fusion-text fusion-text-6\"><p>LLMOps, abr\u00e9viation de Large Language Model Operations, est une branche sp\u00e9cialis\u00e9e de MLOps sp\u00e9cialement con\u00e7ue pour relever les d\u00e9fis et r\u00e9pondre aux exigences uniques de la gestion de grands mod\u00e8les linguistiques (LLM).<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Mais tout d'abord, qu'est-ce qu'un LLM exactement ?<\/h2><\/div><div class=\"fusion-text fusion-text-7\"><p>Les LLM sont un type de mod\u00e8le d'apprentissage profond qui utilise des quantit\u00e9s massives de texte data pour estimer des milliards de param\u00e8tres. Ces param\u00e8tres permettent aux LLM de comprendre et de g\u00e9n\u00e9rer des textes de qualit\u00e9 humaine, de traduire des langues, de r\u00e9sumer des informations complexes et d'effectuer diverses t\u00e2ches de traitement du langage naturel.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Comment les organisations utilisent-elles les LLM ?<\/h2><\/div><div class=\"fusion-text fusion-text-8\"><p>La formation de LLM \u00e0 partir de z\u00e9ro \u00e9tant extr\u00eamement co\u00fbteuse et chronophage, les organisations optent pour des mod\u00e8les de base pr\u00e9-entra\u00een\u00e9s, tels que GPT d'OpenAI ou LaMDA de Google AI, comme point de d\u00e9part. Ces mod\u00e8les, d\u00e9j\u00e0 entra\u00een\u00e9s sur de grandes quantit\u00e9s de data, poss\u00e8dent des connaissances \u00e9tendues et peuvent effectuer diverses t\u00e2ches, notamment la g\u00e9n\u00e9ration de texte, la traduction de langues et la r\u00e9daction de diff\u00e9rents types de contenu cr\u00e9atif. Pour personnaliser davantage les r\u00e9sultats du LLM en fonction de t\u00e2ches ou de domaines sp\u00e9cifiques, les organisations utilisent des techniques telles que l'ing\u00e9nierie des messages, la g\u00e9n\u00e9ration augment\u00e9e par la recherche (RAG) et le r\u00e9glage fin. L'ing\u00e9nierie des messages implique la cr\u00e9ation d'instructions claires et concises qui guident le LLM vers le r\u00e9sultat souhait\u00e9, tandis que la RAG fonde le mod\u00e8le sur des informations suppl\u00e9mentaires provenant de sources data externes, am\u00e9liorant ainsi ses performances et sa pertinence. Le r\u00e9glage fin, quant \u00e0 lui, consiste \u00e0 ajuster les param\u00e8tres du LLM en utilisant des data suppl\u00e9mentaires sp\u00e9cifiques aux besoins de l'organisation. Le sch\u00e9ma ci-dessous donne un aper\u00e7u du flux de travail des LLMOps, illustrant la mani\u00e8re dont ces techniques s'int\u00e8grent dans le processus global.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"text-align:center;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"1336\" height=\"463\" title=\"sch\u00e9ma LLMOps medium article\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article.png\" alt class=\"lazyload img-responsive wp-image-95612\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271336%27%20height%3D%27463%27%20viewBox%3D%270%200%201336%20463%27%3E%3Crect%20width%3D%271336%27%20height%3D%27463%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-200x69.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-400x139.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-600x208.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-800x277.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-1200x416.png 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article.png 1336w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1336px\" \/><\/span><\/div><div class=\"fusion-title title fusion-title-8 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Pourquoi nous avons besoin des LLMOps<\/h2><\/div><div class=\"fusion-text fusion-text-9\"><p>Les progr\u00e8s rapides de la technologie LLM ont mis en lumi\u00e8re plusieurs d\u00e9fis op\u00e9rationnels qui n\u00e9cessitent des approches sp\u00e9cialis\u00e9es.<\/p>\n<p>Parmi ces d\u00e9fis, citons :<\/p>\n<\/div><ul style=\"--awb-iconcolor:var(--awb-color7);--awb-textcolor:var(--awb-color7);--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons paddingList dark-text\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Le besoin de personnalisation<\/strong>: Alors que les LLM sont pr\u00e9-entra\u00een\u00e9s sur des quantit\u00e9s massives de data, la personnalisation est essentielle pour une performance optimale sur des t\u00e2ches sp\u00e9cifiques. Cela a conduit au d\u00e9veloppement de nouvelles techniques de personnalisation, telles que <strong>ing\u00e9nierie rapide<\/strong>, la g\u00e9n\u00e9ration augment\u00e9e par la recherche (<strong>RAG<\/strong>) et <strong>peaufinage<\/strong>. RAG aide le mod\u00e8le \u00e0 s'appuyer sur les informations les plus pr\u00e9cises en lui fournissant une base de connaissances externe, tandis que le r\u00e9glage fin est plus appropri\u00e9 lorsque nous voulons que le mod\u00e8le ex\u00e9cute des t\u00e2ches sp\u00e9cifiques ou respecte un format de r\u00e9ponse particulier tel que JSON ou SQL. Le choix entre le RAG et le r\u00e9glage fin d\u00e9pend de la question de savoir si nous voulons am\u00e9liorer les connaissances du mod\u00e8le ou ses performances dans le cadre d'une t\u00e2che sp\u00e9cifique.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Modifications de l'API<\/strong>: Contrairement aux mod\u00e8les ML traditionnels, les LLM sont souvent accessibles via des API tierces, qui peuvent \u00eatre modifi\u00e9es ou m\u00eame supprim\u00e9es, ce qui n\u00e9cessite une surveillance et une adaptation continues. Par exemple, <a href=\"https:\/\/platform.openai.com\/docs\/deprecations\" target=\"_blank\" rel=\"noopener\">Documentation sur l'IA ouverte<\/a> mentionne explicitement que ses mod\u00e8les font l'objet de mises \u00e0 jour r\u00e9guli\u00e8res, ce qui peut obliger les utilisateurs \u00e0 mettre \u00e0 jour leur logiciel ou \u00e0 migrer vers des mod\u00e8les ou des terminaux plus r\u00e9cents.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Data d\u00e9rive<\/strong>, L'expression \"changement dans les propri\u00e9t\u00e9s statistiques de l'entr\u00e9e data\" d\u00e9signe un changement dans les propri\u00e9t\u00e9s statistiques de l'entr\u00e9e data, qui se produit fr\u00e9quemment dans la production lorsque la data rencontr\u00e9e s'\u00e9carte de la data sur laquelle les LLM ont \u00e9t\u00e9 form\u00e9s. Cela peut conduire \u00e0 la production d'informations inexactes ou obsol\u00e8tes. Par exemple, avec le mod\u00e8le GPT-3.5, ses informations ont \u00e9t\u00e9 limit\u00e9es jusqu'en septembre 2021 avant que le mod\u00e8le GPT-3.5 ne soit utilis\u00e9. <a href=\"https:\/\/www.zdnet.com\/article\/chatgpt-is-no-longer-as-clueless-about-recent-events\/\" target=\"_blank\" rel=\"noopener\">la date limite a \u00e9t\u00e9 repouss\u00e9e \u00e0 janvier 2022<\/a>. Par cons\u00e9quent, il n'a pas pu r\u00e9pondre aux questions concernant des \u00e9v\u00e9nements plus r\u00e9cents, ce qui a provoqu\u00e9 la frustration des utilisateurs.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>\u00c9valuation du mod\u00e8le<\/strong>: Dans l'apprentissage automatique traditionnel, nous nous appuyons sur des mesures telles que l'exactitude, la pr\u00e9cision et le rappel pour \u00e9valuer nos mod\u00e8les. Cependant, l'\u00e9valuation des LLM est beaucoup plus complexe, en particulier en l'absence de v\u00e9rit\u00e9 terrain data et lorsqu'il s'agit de sorties en langage naturel plut\u00f4t que de valeurs num\u00e9riques.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Contr\u00f4le<\/strong>: Le contr\u00f4le continu des LLM et des applications bas\u00e9es sur les LLM est crucial. Il est \u00e9galement plus compliqu\u00e9 car il implique de multiples aspects qui doivent \u00eatre pris en compte pour garantir l'efficacit\u00e9 et la fiabilit\u00e9 globales de ces mod\u00e8les de langage. Nous discuterons de ces aspects plus en d\u00e9tail dans la section suivante.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-title title fusion-title-9 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Comment les LLMOps rel\u00e8vent ces d\u00e9fis<\/h2><\/div><div class=\"fusion-text fusion-text-10\"><p>LLMOps s'appuie sur les fondements de MLOps tout en introduisant des \u00e9l\u00e9ments sp\u00e9cialis\u00e9s adapt\u00e9s aux LLM :<\/p>\n<\/div><ul style=\"--awb-iconcolor:var(--awb-color7);--awb-textcolor:var(--awb-color7);--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-2 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Gestion rapide de l'ing\u00e9nierie et de la mise au point<\/strong>: LLMOps fournit des outils tels que <strong>les syst\u00e8mes de contr\u00f4le de version rapides<\/strong> pour suivre et g\u00e9rer les diff\u00e9rentes versions des messages-guides. Il s'int\u00e8gre \u00e9galement \u00e0 <strong>des cadres d'affinage<\/strong> pour automatiser et optimiser le processus de mise au point. Un exemple frappant de ces outils est LangSmith, un cadre sp\u00e9cialement con\u00e7u pour g\u00e9rer les flux de travail du LLM. Ses fonctionnalit\u00e9s compl\u00e8tes comprennent <a href=\"https:\/\/docs.smith.langchain.com\/cookbook\/hub-examples\/retrieval-qa-chain-versioned\" target=\"_blank\" rel=\"noopener\">versionnement de l'invite<\/a>, permettant une exp\u00e9rimentation contr\u00f4l\u00e9e et la reproductibilit\u00e9. En outre, LangSmith facilite <a href=\"https:\/\/docs.smith.langchain.com\/cookbook\/fine-tuning-examples\" target=\"_blank\" rel=\"noopener\">peaufinage<\/a> de LLMs utilisant les runs \u2019data apr\u00e8s un \u00e9ventuel filtrage et enrichissement pour am\u00e9liorer la performance du mod\u00e8le.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Gestion des modifications de l'API<\/strong>: Les LLMOps \u00e9tablissent des processus pour <strong>surveillance<\/strong> Changements dans l'API, <strong>alerte<\/strong> les op\u00e9rateurs \u00e0 des perturbations potentielles, et <strong>l'activation des rollbacks<\/strong> si n\u00e9cessaire.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Adaptation du mod\u00e8le au changement data<\/strong>: LLMOps facilite l'adaptation des LLM aux paysages data en \u00e9volution, en veillant \u00e0 ce que les mod\u00e8les restent pertinents et performants \u00e0 mesure que les mod\u00e8les data changent. Cet objectif pourrait \u00eatre atteint en <strong>surveiller les distributions de data et d\u00e9clencher des processus d'adaptation<\/strong> lorsque des changements significatifs sont d\u00e9tect\u00e9s. Ces processus peuvent inclure<br \/>\n-&gt; <strong>Recyclage ou mise au point<\/strong>: En fonction de l'ampleur de la d\u00e9rive du data et des ressources disponibles, il est possible de recourir au recyclage ou \u00e0 la mise au point pour en att\u00e9nuer l'impact.<br \/>\n-&gt; <strong>Adaptation du domaine<\/strong>: Mise au point du LLM sur un dataset du domaine cible.<br \/>\n-&gt; <strong>Distillation des connaissances<\/strong>: Former un mod\u00e8le plus petit en tirant parti des connaissances et de l'expertise d'un mod\u00e8le plus grand, plus puissant et plus moderne.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>\u00c9valuation sp\u00e9cifique au LLM<\/strong>: LLMOps utilise de nouveaux outils d'\u00e9valuation adapt\u00e9s aux LLM. Il s'agit notamment de<br \/>\n-&gt; <strong>Mesures bas\u00e9es sur le texte<\/strong>, Les mesures de la complexit\u00e9, telles que la perplexit\u00e9, sont une mesure statistique de la capacit\u00e9 du mod\u00e8le \u00e0 pr\u00e9dire le mot suivant dans une s\u00e9quence. Ainsi que les mesures BLEU et ROUGE, qui comparent un texte g\u00e9n\u00e9r\u00e9 par une machine \u00e0 un ou plusieurs textes de r\u00e9f\u00e9rence g\u00e9n\u00e9r\u00e9s par des humains. Elles sont couramment utilis\u00e9es pour les t\u00e2ches de traduction et de r\u00e9sum\u00e9.<br \/>\n-&gt; <strong>Analyser les ench\u00e2ssements<\/strong> (repr\u00e9sentations vectorielles de mots ou de phrases), afin d'\u00e9valuer la capacit\u00e9 du mod\u00e8le \u00e0 comprendre les mots sp\u00e9cifiques au contexte et \u00e0 saisir les similitudes s\u00e9mantiques. Les techniques de visualisation et de regroupement peuvent \u00e9galement nous aider \u00e0 d\u00e9tecter les biais.<br \/>\n-&gt; <strong>Evaluateur LLMs<\/strong>: Utiliser d'autres LLM pour \u00e9valuer notre mod\u00e8le. Par exemple, cela peut se faire en attribuant un score \u00e0 la sortie du mod\u00e8le \u00e9valu\u00e9 sur la base de m\u00e9triques pr\u00e9d\u00e9finies, telles que la fluidit\u00e9, la coh\u00e9rence, la pertinence et l'exactitude factuelle.<br \/>\n-&gt; <strong>Int\u00e9gration du retour d'information humain<\/strong>: LLMOps incorpore des m\u00e9canismes de collecte et d'int\u00e9gration du retour d'information humain dans le cycle de vie du ML, am\u00e9liorant ainsi les performances du LLM et corrigeant les pr\u00e9jug\u00e9s.<br \/>\n<a href=\"https:\/\/www.trulens.org\/trulens_eval\/core_concepts_feedback_functions\/#feedback-functions\" target=\"_blank\" rel=\"noopener\">TruLens<\/a> est un outil qui permet d'int\u00e9grer ces \u00e9valuations dans les applications du programme d'\u00e9ducation et de formation tout au long de la vie par le biais d'une approche programmatique connue sous le nom de fonctions de r\u00e9troaction.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Suivi sp\u00e9cifique au LLM<\/strong>: LLMOps int\u00e8gre un contr\u00f4le continu pour suivre les mesures de performance du LLM, identifier les probl\u00e8mes potentiels et d\u00e9tecter les d\u00e9rives ou les distorsions du concept. Cela comprend :<br \/>\n-&gt; <strong>Contr\u00f4le fonctionnel<\/strong>; en suivant le nombre de demandes, le temps de r\u00e9ponse, l'utilisation des jetons, les taux d'erreur et les co\u00fbts.<br \/>\n-&gt; <strong>Un suivi rapide<\/strong>; pour assurer la lisibilit\u00e9 et pour d\u00e9tecter la toxicit\u00e9 et d'autres formes d'abus. <a href=\"https:\/\/docs.wandb.ai\/guides\/prompts_platform\" target=\"_blank\" rel=\"noopener\">Promesses W&amp;B<\/a> est un ensemble d'outils con\u00e7us pour surveiller les applications bas\u00e9es sur les LLM. Il peut \u00eatre utilis\u00e9 pour analyser les entr\u00e9es et les sorties de vos LLM, visualiser les r\u00e9sultats interm\u00e9diaires et stocker et g\u00e9rer vos invites en toute s\u00e9curit\u00e9.<br \/>\n-&gt; <strong>Suivi des r\u00e9ponses<\/strong>; garantir la pertinence et la coh\u00e9rence du mod\u00e8le. Il s'agit notamment d'emp\u00eacher la g\u00e9n\u00e9ration de contenus hallucinatoires ou fictifs, et de veiller \u00e0 l'exclusion de tout mat\u00e9riel nuisible ou inappropri\u00e9. La transparence peut nous aider \u00e0 mieux comprendre la r\u00e9ponse du mod\u00e8le. Elle peut \u00eatre \u00e9tablie en r\u00e9v\u00e9lant les sources de r\u00e9ponse (dans RAG) ou en invitant le mod\u00e8le \u00e0 justifier son raisonnement (cha\u00eene de pens\u00e9e).<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-11\"><p>Cette surveillance data peut \u00eatre utilis\u00e9e pour am\u00e9liorer l'efficacit\u00e9 op\u00e9rationnelle. Nous pouvons am\u00e9liorer la gestion des co\u00fbts en mettant en place des alertes sur l'utilisation des jetons et en employant des strat\u00e9gies telles que la mise en cache des r\u00e9ponses pr\u00e9c\u00e9dentes. Cela nous permet de les r\u00e9utiliser pour des requ\u00eates similaires sans avoir \u00e0 invoquer \u00e0 nouveau le LLM. En outre, nous pouvons minimiser la latence en optant pour des mod\u00e8les plus petits lorsque cela est possible et en limitant le nombre de jetons g\u00e9n\u00e9r\u00e9s.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-10 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Conclusion<\/h2><\/div><div class=\"fusion-text fusion-text-12\"><p>Dans cet article, nous avons explor\u00e9 l'\u00e9mergence de LLMOps, un descendant de DevOps et MLOps, sp\u00e9cifiquement con\u00e7u pour r\u00e9pondre aux d\u00e9fis op\u00e9rationnels pos\u00e9s par les grands mod\u00e8les de langage. Terminons par une comparaison visuelle de ces trois m\u00e9thodologies, illustrant leur port\u00e9e dans le contexte des entreprises utilisatrices de LLM, qui s'appuient sur ces mod\u00e8les pour cr\u00e9er des produits et r\u00e9soudre des probl\u00e8mes commerciaux.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"text-align:center;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"927\" height=\"727\" title=\"sch\u00e9ma 2 LLMOps medium article\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article.png\" alt class=\"lazyload img-responsive wp-image-95613\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27927%27%20height%3D%27727%27%20viewBox%3D%270%200%20927%20727%27%3E%3Crect%20width%3D%27927%27%20height%3D%27727%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article-200x157.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article-400x314.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article-600x471.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article-800x627.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article.png 927w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 927px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-13\"><p>Bien que ces trois m\u00e9thodologies partagent des pratiques communes telles que CI\/CD, le versionnage et l'\u00e9valuation, elles ont chacune des domaines d'int\u00e9r\u00eat distincts. DevOps couvre l'ensemble du cycle de d\u00e9veloppement des logiciels, du d\u00e9veloppement au d\u00e9ploiement et \u00e0 la maintenance. MLOps \u00e9tend DevOps pour r\u00e9pondre aux d\u00e9fis sp\u00e9cifiques des mod\u00e8les d'apprentissage automatique, y compris l'automatisation de la formation, du d\u00e9ploiement et de la surveillance des mod\u00e8les. LLMOps, la derni\u00e8re it\u00e9ration de ces m\u00e9thodologies, se concentre sp\u00e9cifiquement sur les LLM. M\u00eame si les entreprises utilisatrices de LLM n'ont pas besoin de d\u00e9velopper leurs propres mod\u00e8les, elles sont toujours confront\u00e9es \u00e0 des d\u00e9fis op\u00e9rationnels, notamment la gestion des changements d'API et la personnalisation des mod\u00e8les gr\u00e2ce \u00e0 des techniques telles que l'ing\u00e9nierie prompte et le r\u00e9glage fin.<\/p>\n<\/div><\/div><\/div><\/div><\/article><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center\" style=\"--awb-padding-top:40px;--awb-padding-right:40px;--awb-padding-bottom:40px;--awb-padding-left:40px;--awb-overflow:hidden;--awb-bg-position:left center;--awb-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper lazyload fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-column fusion-column-has-bg-image\" data-bg-url=\"https:\/\/artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\" data-bg=\"https:\/\/artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-3 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"moyen\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-title title fusion-title-11 fusion-sep-none fusion-title-center fusion-title-text fusion-title-size-three\" style=\"--awb-margin-top:20px;--awb-margin-bottom:0px;--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-center fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Moyen Blog par Artefact.<\/h3><\/div><div class=\"fusion-text fusion-text-14\" style=\"--awb-content-alignment:center;\"><p>Cet article a \u00e9t\u00e9 initialement publi\u00e9 sur Medium.com.<br \/>\nSuivez-nous sur notre Medium Blog !<\/p>\n<\/div><div style=\"text-align:center;\"><a class=\"fusion-button button-flat button-medium button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" style=\"--button_text_transform:var(--awb-custom_typography_2-text-transform);--button_typography-letter-spacing:var(--awb-custom_typography_2-letter-spacing);--button_typography-font-family:var(--awb-custom_typography_2-font-family);--button_typography-font-weight:var(--awb-custom_typography_2-font-weight);--button_typography-font-style:var(--awb-custom_typography_2-font-style);\" target=\"_blank\" rel=\"noopener noreferrer\" data-hover=\"text_slide_down\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/why-you-need-llmops-48c0925827de#c82e-c015f09e2d46\"><div class=\"awb-button-text-transition  awb-button__hover-content--centered\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Lire notre article<\/span><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Lire notre article<\/span><\/div><\/a><\/div><\/div><\/div><\/div><\/div><\/p>","protected":false},"excerpt":{"rendered":"<p>Cet article pr\u00e9sente LLMOps, une discipline sp\u00e9cialis\u00e9e alliant DevOps et MLOps afin de relever les d\u00e9fis pos\u00e9s par les grands mod\u00e8les linguistiques (LLM)\u2026<\/p>","protected":false},"featured_media":95614,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[2995,21939],"blog-language":[2991],"class_list":["post-95610","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-ai-technology","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/blog\/95610","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/media\/95614"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/media?parent=95610"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/blog-category?post=95610"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/blog-language?post=95610"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}