	{"id":65852,"date":"2022-01-31T10:48:03","date_gmt":"2022-01-31T10:48:03","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=65852"},"modified":"2024-09-20T17:45:48","modified_gmt":"2024-09-20T16:45:48","slug":"data-ml-challenges-for-2022","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/fr\/blog\/data-ml-challenges-for-2022\/","title":{"rendered":"Data &amp; ML d\u00e9fis pour 2022"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Auteur<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2022\/01\/Bruce-DELATTRE-.png\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Bruce Delattre<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\"><p>Data Responsable scientifique \u00e0 Artefact<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:20px;--awb-padding-right:20px;--awb-padding-bottom:20px;--awb-padding-left:20px;--awb-overflow:hidden;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-top:1px;--awb-border-right:1px;--awb-border-bottom:1px;--awb-border-left:1px;--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\" rel=\"noopener noreferrer\" target=\"_blank\"><span class=\"fusion-column-inner-bg-image\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-row fusion-flex-align-items-center\"><div class=\"fusion-text fusion-text-2\"><p><u>Lisez notre article sur<\/u><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"4000\" height=\"992\" title=\"Moyen Blog\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" alt class=\"lazyload img-responsive wp-image-60582\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%274000%27%20height%3D%27992%27%20viewBox%3D%270%200%204000%20992%27%3E%3Crect%20width%3D%274000%27%20height%3D%27992%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-200x50.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-400x99.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-600x149.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-800x198.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-1200x298.png 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png 4000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 4000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-3\"><p>.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-4 description\"><p>Principales tendances 2021 data &amp; ML... et ce qu'elles signifient pour 2022<\/p>\n<p>L'ann\u00e9e 2021 a \u00e9t\u00e9 tr\u00e8s riche en actualit\u00e9s li\u00e9es \u00e0 data et \u00e0 l'IA. Et que nous r\u00e9serve l'avenir ? Dans cet article, nous avons s\u00e9lectionn\u00e9 quelques histoires et articles de blog que nous avons trouv\u00e9s perspicaces, pris du recul et essay\u00e9 de d\u00e9duire ce qu'il faut attendre de ces \u201csignes\u201d pr\u00e9coces pour 2022.<\/p>\n<p>Cet article a \u00e9t\u00e9 rendu possible gr\u00e2ce aux contributions d'Arthur Derennes, Robin Doumerc, Amale El Hamri, Beno\u00eet Goujon, Vincent Luciani et Hanania Ouazan.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-4 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">1 - Apprivoiser l'ind\u00e9cence des mod\u00e8les de fondation<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>2021 a eu son lot de nouveaux grands mod\u00e8les. Apr\u00e8s le GPT-3 (<a href=\"https:\/\/arxiv.org\/abs\/2005.14165\" target=\"_blank\" rel=\"noopener\">Brown et al, 2020<\/a>) l'ann\u00e9e pr\u00e9c\u00e9dente, vous avez peut-\u00eatre entendu parler de la <a href=\"https:\/\/openai.com\/blog\/clip\/\" target=\"_blank\" rel=\"noopener\">CLIP<\/a> ou, plus r\u00e9cemment, <a href=\"https:\/\/deepmind.com\/blog\/article\/language-modelling-at-scale\" target=\"_blank\" rel=\"noopener\">Marmotte<\/a>. Ces \u201cmod\u00e8les de base\u201d, en tant que <a href=\"https:\/\/arxiv.org\/abs\/2108.07258\" target=\"_blank\" rel=\"noopener\">Bommasani et al (2021)<\/a> (car leur architecture est souvent r\u00e9utilis\u00e9e, l\u00e9g\u00e8rement modifi\u00e9e pour s'adapter \u00e0 une t\u00e2che sp\u00e9cifique d'apprentissage automatique, ou parce qu'ils sont aussi souvent affin\u00e9s par l'apprentissage par transfert), poursuivent leur voyage et leurs progr\u00e8s, car il ne semble pas y avoir de limite au nombre de param\u00e8tres optimis\u00e9s ou data exploit\u00e9s pour les entra\u00eener. <strong>Ce qui est int\u00e9ressant, c'est que ces mod\u00e8les entra\u00eenent d'importants gains de productivit\u00e9<\/strong>, En tirant parti, comme le remarquent Bommasani et ses coauteurs, de la combinaison des \u00e9l\u00e9ments suivants <em>l'\u00e9mergence<\/em> et <em>homog\u00e9n\u00e9isation<\/em>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-6\"><p>Commen\u00e7ons par l'homog\u00e9n\u00e9isation : <strong>non seulement la plupart des mod\u00e8les que vous voyez dans la litt\u00e9rature sont adapt\u00e9s \u00e0 partir de ces architectures g\u00e9n\u00e9riques <\/strong>(pensez \u00e0 BERT qui est omnipr\u00e9sent de nos jours) ; <strong>mais souvent aussi les praticiens ne changent pas l'architecture<\/strong>, Ils se contentent d'adapter un \u201cgrand\u201d mod\u00e8le disponible \u00e0 une t\u00e2che en aval \u00e0 l'aide de l'apprentissage par transfert. Cette \u201cinvariance\u201d de l'architecture signifie que <strong>les nouvelles am\u00e9liorations apport\u00e9es \u00e0 un mod\u00e8le de fondation peuvent facilement \u00eatre transf\u00e9r\u00e9es \u00e0 tous ses mod\u00e8les enfants<\/strong>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-7\"><p>L'\u00e9mergence, ensuite, vient de la fa\u00e7on dont ils g\u00e8rent la formation de data. Form\u00e9s en auto-supervision, \u00e0 partir de data brutes qui n'ont pas \u00e9t\u00e9 \u00e9tiquet\u00e9es de mani\u00e8re sp\u00e9cifique, ils commencent \u00e0 montrer qu'ils peuvent r\u00e9pondre \u00e0 des besoins pour lesquels ils n'ont pas \u00e9t\u00e9 con\u00e7us \u00e0 l'origine (une capacit\u00e9 \u201czero-shot\u201d). <strong>Les t\u00e2ches complexes d'apprentissage automatique qui souffrent d'une tr\u00e8s faible disponibilit\u00e9 de data peuvent \u00eatre mieux r\u00e9solues en tirant parti de la \u201cconnaissance\u201d que ces mod\u00e8les extraient de gros morceaux de data.<\/strong>. Nous n'en sommes qu'aux premiers stades et les r\u00e9sultats sont souvent plus troublants que fructueux, mais le GPT-3, par exemple, apprend directement \u00e0 r\u00e9soudre une t\u00e2che \u00e0 partir d'une invite qu'il n'a pas vue pendant la formation (<em>du moins, th\u00e9oriquement, n'aurait pas d\u00fb voir...<\/em>). <strong>Cette \u00e9mergence de capacit\u00e9s non planifi\u00e9es signifie que nous pourrions \u00e9voluer vers plus d'efficacit\u00e9 et d'efficience. <\/strong><a href=\"https:\/\/ai.googleblog.com\/2022\/01\/google-research-themes-from-2021-and.html\" target=\"_blank\" rel=\"noopener\">capable et polyvalent<\/a><strong> l'apprentissage automatique. <\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-8\"><p>Ces avantages ne vont pas sans changements structurels. Comme il s'agit de mod\u00e8les de grande taille par nature, la liste des organisations et des entreprises capables de les cr\u00e9er est restreinte. <strong>Cela devrait certainement stimuler l'utilisation de l'apprentissage automatique par le biais d'API d'IA propri\u00e9taires ou d'interfaces rapides, en confiant aux ing\u00e9nieurs la formation et la maintenance des mod\u00e8les de base.<\/strong>. D'autre part, comme de plus en plus de mod\u00e8les d\u00e9pendront d'un seul parent, on peut s'attendre \u00e0 ce qu'il y ait davantage de r\u00e9glementation, d'enqu\u00eates \u00e9thiques et sociales sur ces mod\u00e8les (car les enfants h\u00e9ritent du biais de leur mod\u00e8le de base). <strong>Il y aura certainement de plus en plus de valeur \u00e0 travailler avec des talents connaissant les capacit\u00e9s, les limites et les biais cach\u00e9s derri\u00e8re ces interfaces, d'une mani\u00e8re ou d'une autre... \u00e0 commencer par leur empreinte carbone.<\/strong><\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">2 - Rendre l'IA durable<\/h2><\/div><div class=\"fusion-text fusion-text-9\"><p><strong>Il n'est pas surprenant que ces nouvelles formes d'IA aient un co\u00fbt \u00e9lev\u00e9 en termes d'\u00e9missions de carbone<\/strong>: <a href=\"https:\/\/arxiv.org\/pdf\/1906.02243.pdf\" target=\"_blank\" rel=\"noopener\">Strubell et al.<\/a> estime qu'un seul entra\u00eenement de l'ORET sur les GPU est \u00e0 peu pr\u00e8s \u00e9quivalent \u00e0 un vol NY-SF, tandis que l'entra\u00eenement de l'ORET sur les GPU est \u00e0 peu pr\u00e8s \u00e9quivalent \u00e0 un vol NY-SF. <a href=\"https:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=3873881\" target=\"_blank\" rel=\"noopener\">Taddeo et al.<\/a> \u00e9valuer qu'une seule formation GPT-3 \u00e9met autant de CO2 que 49 voitures au cours d'une ann\u00e9e.<\/p>\n<p>L'IA a d'abord \u00e9t\u00e9 consid\u00e9r\u00e9e comme un outil pr\u00e9cieux pour r\u00e9soudre les probl\u00e8mes li\u00e9s au changement climatique (voir les nombreuses id\u00e9es de la conf\u00e9rence NeurIPS \u201cTackling climate change with machine learning\u201d 2019). <a href=\"https:\/\/www.climatechange.ai\/events\/neurips2019\" target=\"_blank\" rel=\"noopener\">atelier<\/a>), mais de nombreux experts pointent \u00e9galement du doigt son empreinte carbone. <strong>\u201c<a href=\"https:\/\/link.springer.com\/article\/10.1007\/s43681-021-00043-6\" target=\"_blank\" rel=\"noopener\">IA durable<\/a>\u201dSelon Aimee van Wynsberghe, la notion de \"durabilit\u00e9\" devrait englober non seulement l'IA pour la durabilit\u00e9, mais aussi la durabilit\u00e9 de l'IA.<\/strong> (qui ne doit pas non plus se limiter aux pr\u00e9occupations \u00e9cologiques).<\/p>\n<\/div><div class=\"fusion-text fusion-text-10\"><p>Comme Abhishek Gupta <a href=\"https:\/\/thegradient.pub\/sustainable-ai\/\" target=\"_blank\" rel=\"noopener\">recommande<\/a>, travaillant en <strong>pour favoriser une IA durable, il faut explorer de nouvelles m\u00e9thodes de travail<\/strong>. TinyML pourrait <a href=\"https:\/\/arxiv.org\/pdf\/2003.04821.pdf\" target=\"_blank\" rel=\"noopener\">nous aider \u00e0 \u00e9viter le co\u00fbt \u00e9nerg\u00e9tique des calculs sans fil<\/a>, pendant que <a href=\"https:\/\/electricitymap.org\/\" target=\"_blank\" rel=\"noopener\">sensibilisation au carbone<\/a> devrait nous aider \u00e0 comprendre dans quelle zone g\u00e9ographique nous pourrions le mieux former et d\u00e9ployer nos mod\u00e8les d'apprentissage automatique. Une utilisation plus judicieuse du mat\u00e9riel et des services existants devrait \u00e9galement \u00eatre l'affaire de tous.<\/p>\n<p><strong>Quelles que soient les solutions utilis\u00e9es pour adopter une IA durable, nous nous attendons \u00e0 ce que les d\u00e9cideurs soient plus enclins \u00e0 r\u00e9fl\u00e9chir \u00e0 deux fois avant de lancer des projets d'IA.<\/strong>. Cela soul\u00e8ve la question de savoir <strong>mesure<\/strong> l'apprentissage automatique de l'impact sur l'environnement.<\/p>\n<\/div><div class=\"fusion-text fusion-text-11\"><p>Le d\u00e9veloppement de l'apprentissage automatique, en 2022, devrait \u00eatre accompagn\u00e9 d'un rapport plus syst\u00e9matique sur les \u00e9missions de CO2e \u00e0 c\u00f4t\u00e9 des mesures de performance (voir par exemple <a href=\"https:\/\/github.com\/mlco2\/codecarbon\" target=\"_blank\" rel=\"noopener\">codecarbone<\/a>), une plus grande transparence de la part des fournisseurs de cloud (voir l'empreinte carbone des BPC). <a href=\"https:\/\/cloud.google.com\/carbon-footprint\" target=\"_blank\" rel=\"noopener\">tableau de bord<\/a>) et, surtout, une r\u00e9flexion plus approfondie sur les avantages et les co\u00fbts de l'utilisation de l'IA. <strong>Les projets les plus convaincants seront ceux qui adopteront une approche holistique : il ne s'agit pas seulement de quantifier l'empreinte carbone de l'informatique, mais de la mettre en regard de l'efficacit\u00e9 apport\u00e9e par ces nouveaux produits.<\/strong>, sans oublier de tenir compte d'une \u00e9ventuelle <a href=\"https:\/\/en.wikipedia.org\/wiki\/Rebound_effect_(conservation)\" target=\"_blank\" rel=\"noopener\">effet de rebond<\/a>. Il ne suffit pas de mesurer l'empreinte carbone de ces grands mod\u00e8les : <strong>nous devrions prendre en compte l'ensemble du processus de bout en bout : formation, d\u00e9ploiement, suivi, ainsi que son impact sur les m\u00e9thodes de travail des personnes<\/strong>.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">3 - Ajouter une touche de zen \u00e0 vos MLOPs<\/h2><\/div><div class=\"fusion-text fusion-text-12\"><p><strong>Ceci est important car la production de l'apprentissage automatique devient de plus en plus complexe et sophistiqu\u00e9e.<\/strong>. Les MLOPs ont particuli\u00e8rement continu\u00e9 leur essor cette ann\u00e9e et ont eu leur part d'innovations ou de concepts \u00e0 la mode, comme Matt Turck <a href=\"https:\/\/mattturck.com\/data2021\/\" target=\"_blank\" rel=\"noopener\">explique<\/a>. Pensez simplement \u00e0 <a href=\"https:\/\/data-notes.co\/what-i-learned-from-attending-tectons-apply-conference-85635a03ff2e\" target=\"_blank\" rel=\"noopener\">caract\u00e9ristiques des magasins<\/a>, <a href=\"https:\/\/www.reuters.com\/business\/confluent-targets-over-8-bln-valuation-us-ipo-2021-06-16\/\" target=\"_blank\" rel=\"noopener\">streaming<\/a> et toutes les initiatives DataOps que nous aborderons juste en dessous.<\/p>\n<p>Si l'ann\u00e9e 2021 a \u00e9t\u00e9 une fois de plus une ann\u00e9e faste pour les <a href=\"https:\/\/ml-ops.org\/content\/motivation#mlops-definition\" target=\"_blank\" rel=\"noopener\">MLOPs<\/a>, Nous avons \u00e9galement commenc\u00e9 \u00e0 <strong>de la critique r\u00e9fl\u00e9chie \u00e0 l'encontre de son propre buzz<\/strong>. Et les arguments sont justes : le paysage des MLOPs est <a href=\"https:\/\/mattturck.com\/data2021\/\" target=\"_blank\" rel=\"noopener\">\u00e0 peine lisible,<\/a> englobant des centaines de concepts et d'outils, peut-\u00eatre souvent <a href=\"https:\/\/laszlo.substack.com\/p\/whats-wrong-with-mlops\" target=\"_blank\" rel=\"noopener\">surmortalit\u00e9<\/a> et <strong>on pourrait raisonnablement affirmer qu'un projet moyen <a href=\"https:\/\/en.wikipedia.org\/wiki\/You_aren%27t_gonna_need_it\" target=\"_blank\" rel=\"noopener\">n'aura pas n\u00e9cessairement besoin de tous les \u00e9l\u00e9ments<\/a><\/strong>. La majorit\u00e9 des \u201c<a href=\"https:\/\/towardsdatascience.com\/mlops-without-much-ops-d17f502f76e8\" target=\"_blank\" rel=\"noopener\">\u00e9chelle raisonnable<\/a>\u201dLes entreprises qui ne sont pas <a href=\"https:\/\/towardsdatascience.com\/ml-and-mlops-at-a-reasonable-scale-31d2c0782d9c\" target=\"_blank\" rel=\"noopener\">FAANG<\/a> (<em>c'est-\u00e0-dire.<\/em> pas d'\u00e9normes \u00e9quipes techniques, pas de ROI infini g\u00e9n\u00e9r\u00e9 par l'IA, des volumes raisonnables de data) <strong>devrait rester simple<\/strong>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-13\"><p><strong>Il reste difficile de pr\u00e9dire comment ce paysage \u00e9voluera<\/strong>Les outils sans code ou \u00e0 faible code continueront certainement \u00e0 se d\u00e9velopper et \u00e0 mettre ces fonctionnalit\u00e9s \u00e0 la disposition de tous. Les outils sans code ou \u00e0 faible code continueront certainement \u00e0 se d\u00e9velopper et \u00e0 mettre ces fonctionnalit\u00e9s \u00e0 la disposition de tous. Cependant, les choses peuvent changer, <strong>nous croyons \u00e9galement \u00e0 l'\u00e9mergence, dans les prochaines ann\u00e9es, de normes ouvertes et d'une \u201cpile ML canonique\u201d<\/strong> comme celui que l'Alliance pour l'infrastructure de l'IA a l'intention de mettre en place. <a href=\"https:\/\/towardsdatascience.com\/ml-and-mlops-at-a-reasonable-scale-31d2c0782d9c\" target=\"_blank\" rel=\"noopener\">construire<\/a> (avis de non-responsabilit\u00e9 : Artefact fait partie de l'Alliance).<\/p>\n<\/div><div class=\"fusion-text fusion-text-14\"><p><strong>Nous vous souhaitons donc d'ajouter une touche de <a href=\"https:\/\/en.wikipedia.org\/wiki\/Zen\" target=\"_blank\" rel=\"noopener\">Zen<\/a> \u00e0 vos MLOP en 2022<\/strong>. Cela signifie, tout d'abord, prendre du recul et <strong>\u00e9laguer votre pile pour ne garder que ce qui est vraiment important<\/strong>: l'efficacit\u00e9 de vos mod\u00e8les d'apprentissage automatique et la productivit\u00e9 de vos scientifiques data, par exemple avec un outil \u201c<a href=\"https:\/\/multithreaded.stitchfix.com\/blog\/2021\/02\/09\/aggressively-helpful-platform-teams\/\" target=\"_blank\" rel=\"noopener\">agressivement utile<\/a>\u201dL'\u00e9quipe de la plateforme Stitch Fix a adopt\u00e9 la m\u00eame mentalit\u00e9. Ensuite, comme la plupart des <a href=\"https:\/\/arxiv.org\/pdf\/2107.00079.pdf\" target=\"_blank\" rel=\"noopener\">anti-mod\u00e8les<\/a> d'un projet d'apprentissage automatique semblent provenir du c\u00f4t\u00e9 du data,<strong> de travailler \u00e0 la consolidation des fondements de votre projet : comment vous approvisionnez et traitez le data lui-m\u00eame<\/strong>. Comme le dit Ciro Greco, le data devrait en effet devenir un \u201c.\u201c<a href=\"https:\/\/towardsdatascience.com\/hagakure-for-mlops-the-four-pillars-of-ml-at-reasonable-scale-5a09bd073da\" target=\"_blank\" rel=\"noopener\">citoyen de premi\u00e8re classe<\/a>\u201d de votre pile de production.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">4 - Faire du data plus un produit qu'un simple intrant<\/h2><\/div><div class=\"fusion-text fusion-text-15\"><p>\u201cIl a toujours \u00e9t\u00e9 question de data\u201d devrait d\u00e9clarer 2021, avec le regain d'int\u00e9r\u00eat qu'il suscite, comme en t\u00e9moigne, bien s\u00fbr, le projet de loi sur la protection de l'environnement. <a href=\"https:\/\/www.forbes.com\/sites\/gilpress\/2021\/06\/16\/andrew-ng-launches-a-campaign-for-data-centric-ai\/?sh=3b1e4c3c74f5\" target=\"_blank\" rel=\"noopener\">Data-AI centr\u00e9e<\/a> lanc\u00e9 par Andrew Ng. <strong>Le data n'est pas seulement le carburant de la performance de votre mod\u00e8le d'apprentissage automatique, c'est aussi l\u00e0 que les probl\u00e8mes se posent, car un data d\u00e9s\u00e9quilibr\u00e9, biais\u00e9 ou mal \u00e9tiquet\u00e9 aura certainement un impact n\u00e9gatif sur les algorithmes en aval.<\/strong>. Pour un mod\u00e8le donn\u00e9 et fixe, nous devrions donc \u00eatre en mesure de gagner en qualit\u00e9 simplement en travaillant sur son entr\u00e9e, le data.<\/p>\n<\/div><div class=\"fusion-text fusion-text-16\"><p>Ce qui est int\u00e9ressant, c'est que ce mouvement devrait r\u00e9concilier tous les acteurs de la cha\u00eene de valeur, qu'il s'agisse de l'ing\u00e9nierie data et de ses r\u00e9cents appels \u00e0 l'am\u00e9lioration de la qualit\u00e9 des produits. <a href=\"https:\/\/databand.ai\/data-observability\/\" target=\"_blank\" rel=\"noopener\">DataOps<\/a> (et nous avons nous-m\u00eames pris un r\u00e9el plaisir cette ann\u00e9e \u00e0 inclure des outils tels que <a href=\"https:\/\/greatexpectations.io\/\" target=\"_blank\" rel=\"noopener\">Les grandes esp\u00e9rances<\/a> dans tous nos projets) aux scientifiques et analystes de data qui ne manqueront pas d'outils sophistiqu\u00e9s pour les aider dans leur travail. <a href=\"https:\/\/datacentricai.org\/\" target=\"_blank\" rel=\"noopener\">les m\u00e9thodologies<\/a> pour affiner la data disponible (augmentation, \u00e9tiquetage, correction des biais, \u00e9chantillonnage...). <strong>Bien entendu, nous pensons que cela ne sera pas possible sans un investissement clair de la part de la direction g\u00e9n\u00e9rale et l'application de r\u00e8gles explicites. <a href=\"https:\/\/marketing.artefact.com\/l\/597421\/2021-12-20\/hwlcq2?utm_source=ebook&amp;utm_medium=website&amp;utm_campaign=2021-11-FR-Ebook-Data-Governance\" target=\"_blank\" rel=\"noopener\">processus<\/a> de data governance pour identifier, puis structurer les diff\u00e9rents domaines et leurs propri\u00e9taires au sein de l'organisation. <\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-17\"><p>Ceci, combin\u00e9 au fait que data sera de plus en plus facile \u00e0 d\u00e9placer gr\u00e2ce \u00e0 des initiatives telles que <a href=\"https:\/\/consent.yahoo.com\/v2\/collectConsent?sessionId=3_cc-session_7581c65a-5999-46c3-9a14-3b8bc2674d2f\" target=\"_blank\" rel=\"noopener\">Airbyte's<\/a> et l'am\u00e9lioration continue des <a href=\"https:\/\/databricks.com\/blog\/2021\/05\/26\/introducing-delta-sharing-an-open-protocol-for-secure-data-sharing.html\" target=\"_blank\" rel=\"noopener\">data partage<\/a> technologies de notre pile data moderne permettraient \u00e0 la<strong> les entreprises doivent manifestement trouver de nouvelles <a href=\"https:\/\/towardsdatascience.com\/the-future-of-the-modern-data-stack-2de175b3c809\" target=\"_blank\" rel=\"noopener\">perspectives<\/a> du data lui-m\u00eame<\/strong>, Parall\u00e8lement \u00e0 ce que l'IA apporte d\u00e9j\u00e0 en termes d'automatisation et de connaissances.<\/p>\n<\/div><div class=\"fusion-text fusion-text-18\"><p>***<\/p>\n<p>Voil\u00e0, c'est fait ! En cette p\u00e9riode de r\u00e9solutions pour la nouvelle ann\u00e9e, nous vous souhaitons donc de dompter l'ind\u00e9cence des mod\u00e8les de fondation, de rendre l'IA durable, d'ajouter une touche de zen \u00e0 vos MLOP et enfin d'entretenir votre data comme un produit plut\u00f4t que de le consid\u00e9rer comme un simple intrant. Et vous ?<strong> Qu'est-ce qui vous a le plus surpris l'ann\u00e9e derni\u00e8re ? Que pensez-vous qu'il se passera cette ann\u00e9e ?\u00a0<\/strong><\/p>\n<\/div><\/div><\/div><\/div><\/article><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-5 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-4 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:40px;--awb-padding-right:40px;--awb-padding-bottom:40px;--awb-padding-left:40px;--awb-overflow:hidden;--awb-inner-bg-position:left center;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\" target=\"_blank\" rel=\"noopener\"><span class=\"fusion-column-inner-bg-image lazyload\" data-bg=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-column fusion-column-has-bg-image\" data-bg-url=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"moyen\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-center fusion-title-text fusion-title-size-three\" style=\"--awb-margin-top:20px;--awb-margin-bottom:0px;--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-center fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Moyen Blog par Artefact.<\/h3><\/div><div class=\"fusion-text fusion-text-19\" style=\"--awb-content-alignment:center;\"><p>Cet article a \u00e9t\u00e9 initialement publi\u00e9 sur <strong>Medium.com<\/strong>.<br \/>\nSuivez-nous sur notre Medium Blog !<\/p>\n<\/div><div style=\"text-align:center;\"><a class=\"fusion-button button-flat button-medium button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" target=\"_blank\" rel=\"noopener noreferrer\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Lire notre article<\/span><\/a><\/div><\/div><\/div><\/div><\/div><\/p>","protected":false},"excerpt":{"rendered":"<p>Principales tendances 2021 data &amp; ML... et ce qu'elles signifient pour 2022<\/p>","protected":false},"featured_media":68685,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[21939],"blog-language":[2991],"class_list":["post-65852","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/blog\/65852","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/media\/68685"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/media?parent=65852"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/blog-category?post=65852"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/fr\/wp-json\/wp\/v2\/blog-language?post=65852"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}