	{"id":65852,"date":"2022-01-31T10:48:03","date_gmt":"2022-01-31T10:48:03","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=65852"},"modified":"2024-09-20T17:45:48","modified_gmt":"2024-09-20T16:45:48","slug":"data-ml-challenges-for-2022","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/es\/blog\/data-ml-challenges-for-2022\/","title":{"rendered":"Data y retos ML para 2022"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Autor<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2022\/01\/Bruce-DELATTRE-.png\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Bruce Delattre<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\"><p>Data Director cient\u00edfico en Artefact<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:20px;--awb-padding-right:20px;--awb-padding-bottom:20px;--awb-padding-left:20px;--awb-overflow:hidden;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-top:1px;--awb-border-right:1px;--awb-border-bottom:1px;--awb-border-left:1px;--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\" rel=\"noopener noreferrer\" target=\"_blank\"><span class=\"fusion-column-inner-bg-image\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-row fusion-flex-align-items-center\"><div class=\"fusion-text fusion-text-2\"><p><u>Lea nuestro art\u00edculo sobre<\/u><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"4000\" height=\"992\" title=\"Mediano Blog\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" alt class=\"lazyload img-responsive wp-image-60582\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%274000%27%20height%3D%27992%27%20viewBox%3D%270%200%204000%20992%27%3E%3Crect%20width%3D%274000%27%20height%3D%27992%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-200x50.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-400x99.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-600x149.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-800x198.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-1200x298.png 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png 4000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 4000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-3\"><p>.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-4 description\"><p>Tendencias clave de 2021 en data y ML... y lo que significan para 2022<\/p>\n<p>El a\u00f1o 2021 ha sido bastante rico en noticias relacionadas con el data y la IA. \u00bfY qu\u00e9 ser\u00e1 lo pr\u00f3ximo? En este art\u00edculo, hemos seleccionado algunas historias y entradas de blog que nos han parecido perspicaces, hemos dado un paso atr\u00e1s y hemos intentado deducir qu\u00e9 cabe esperar de esas primeras \u201cse\u00f1ales\u201d para 2022.<\/p>\n<p>Este art\u00edculo ha sido posible gracias a las aportaciones de Arthur Derennes, Robin Doumerc, Amale El Hamri, Beno\u00eet Goujon, Vincent Luciani y Hanania Ouazan.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-4 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">1 - Domar la indecencia de los modelos de fundaci\u00f3n<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>2021 tuvo su raci\u00f3n de nuevos grandes modelos. Despu\u00e9s del GPT-3 (<a href=\"https:\/\/arxiv.org\/abs\/2005.14165\" target=\"_blank\" rel=\"noopener\">Brown et al., 2020<\/a>) el a\u00f1o anterior, puede que haya o\u00eddo hablar de <a href=\"https:\/\/openai.com\/blog\/clip\/\" target=\"_blank\" rel=\"noopener\">CLIP<\/a> o, m\u00e1s recientemente, <a href=\"https:\/\/deepmind.com\/blog\/article\/language-modelling-at-scale\" target=\"_blank\" rel=\"noopener\">Gopher<\/a>. Estos \u201cmodelos fundacionales\u201d, como <a href=\"https:\/\/arxiv.org\/abs\/2108.07258\" target=\"_blank\" rel=\"noopener\">Bommasani et al. (2021)<\/a> denominan (ya que su arquitectura se reutiliza a menudo, se modifica ligeramente para adaptarla a una tarea espec\u00edfica de Aprendizaje Autom\u00e1tico, o tambi\u00e9n se suelen afinar a\u00fan m\u00e1s mediante el aprendizaje por transferencia), siguen su camino y progresan, ya que no parece haber ning\u00fan l\u00edmite al n\u00famero de par\u00e1metros optimizados o data aprovechados para entrenarlos. <strong>Lo interesante es que estos modelos traen consigo grandes ganancias de productividad<\/strong>, aprovechando, como observan Bommasani y sus coautores, la combinaci\u00f3n de <em>emergencia<\/em> y <em>homogeneizaci\u00f3n<\/em>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-6\"><p>Empecemos por la homogeneizaci\u00f3n: <strong>no s\u00f3lo la mayor\u00eda de los modelos que se ven en la literatura est\u00e1n adaptados de estas arquitecturas gen\u00e9ricas <\/strong>(piense en el BERT, omnipresente hoy en d\u00eda); <strong>pero a menudo tambi\u00e9n los profesionales no cambian la arquitectura<\/strong>, se limitan a ajustar un modelo \u201cgrande\u201d disponible a una tarea posterior mediante el aprendizaje por transferencia. Esta \u201cinvariancia\u201d de la arquitectura significa que <strong>las nuevas mejoras de un modelo base pueden fluir f\u00e1cilmente a todos sus modelos hijos<\/strong>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-7\"><p>La emergencia, a continuaci\u00f3n, proviene de la forma en que manejan el entrenamiento data. Entrenados bajo autosupervisi\u00f3n, bas\u00e1ndose en data brutos que no han sido etiquetados de forma espec\u00edfica, est\u00e1n empezando a demostrar que pueden responder a necesidades para las que no fueron dise\u00f1ados en un principio (una capacidad de \u201cdisparo cero\u201d). <strong>Las tareas complejas de aprendizaje autom\u00e1tico que adolecen de una escasa disponibilidad de data pueden resolverse mejor aprovechando el \u201cconocimiento\u201d que estos modelos extraen de grandes trozos de data<\/strong>. A\u00fan estamos en las primeras fases y los resultados suelen ser m\u00e1s inquietantes que satisfactorios, pero GPT-3, por ejemplo, aprende directamente a resolver una tarea a partir de una indicaci\u00f3n que no ha visto durante el entrenamiento (<em>al menos, te\u00f3ricamente no deber\u00eda haber visto...<\/em>). <strong>Esta aparici\u00f3n de capacidades no planificadas significa que podr\u00edamos avanzar hacia m\u00e1s <\/strong><a href=\"https:\/\/ai.googleblog.com\/2022\/01\/google-research-themes-from-2021-and.html\" target=\"_blank\" rel=\"noopener\">capaz y de uso general<\/a><strong> aprendizaje autom\u00e1tico. <\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-8\"><p>Estas ventajas no se consiguen sin cambios estructurales. Al ser grandes por naturaleza, la lista de organizaciones y empresas capaces de crear estos modelos es restringida. <strong>Esto deber\u00eda impulsar definitivamente el uso del aprendizaje autom\u00e1tico a trav\u00e9s de API de IA propias o interfaces r\u00e1pidas, abstrayendo el entrenamiento y el mantenimiento de los modelos de base a los ingenieros<\/strong>. Por otro lado, a medida que m\u00e1s modelos dependan de un \u00fanico progenitor, cabe esperar una mayor regulaci\u00f3n e investigaci\u00f3n \u00e9tica y social de estos modelos (ya que los ni\u00f1os heredan el sesgo de su modelo fundacional). <strong>Definitivamente, cada vez ser\u00e1 m\u00e1s valioso trabajar con talentos que conozcan la capacidad, los l\u00edmites y los sesgos que se esconden tras estas interfaces, de una forma u otra... empezando por su huella de carbono.<\/strong><\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">2 - Hacer que la IA sea sostenible<\/h2><\/div><div class=\"fusion-text fusion-text-9\"><p><strong>No es de extra\u00f1ar que estas nuevas formas de IA tengan un alto coste en t\u00e9rminos de emisiones de carbono<\/strong>: <a href=\"https:\/\/arxiv.org\/pdf\/1906.02243.pdf\" target=\"_blank\" rel=\"noopener\">Strubell et al.<\/a> estiman que un solo entrenamiento de BERT en GPU equivale aproximadamente a un vuelo de NY a SF, mientras que <a href=\"https:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=3873881\" target=\"_blank\" rel=\"noopener\">Taddeo et al.<\/a> evaluar una sola formaci\u00f3n GPT-3 para emitir tanto CO2 como 49 coches durante un a\u00f1o.<\/p>\n<p>La IA se vio por primera vez como una herramienta valiosa para resolver problemas relacionados con el cambio clim\u00e1tico (v\u00e9anse las numerosas ideas del NeurIPS \u201cTackling climate change with machine learning\u201d 2019 <a href=\"https:\/\/www.climatechange.ai\/events\/neurips2019\" target=\"_blank\" rel=\"noopener\">taller<\/a>), pero muchos expertos apuntan tambi\u00e9n a su huella de carbono. <strong>\u201c<a href=\"https:\/\/link.springer.com\/article\/10.1007\/s43681-021-00043-6\" target=\"_blank\" rel=\"noopener\">IA sostenible<\/a>\u201d, como dice Aimee van Wynsberghe, deber\u00eda abarcar no s\u00f3lo la IA para la sostenibilidad sino tambi\u00e9n la sostenibilidad de la IA<\/strong> (que tampoco deber\u00edan limitarse a las preocupaciones ecol\u00f3gicas).<\/p>\n<\/div><div class=\"fusion-text fusion-text-10\"><p>Como Abhishek Gupta <a href=\"https:\/\/thegradient.pub\/sustainable-ai\/\" target=\"_blank\" rel=\"noopener\">recomienda<\/a>, trabajando en <strong>Favorecer una IA sostenible significa explorar nuevas formas de trabajo<\/strong>. TinyML podr\u00eda <a href=\"https:\/\/arxiv.org\/pdf\/2003.04821.pdf\" target=\"_blank\" rel=\"noopener\">nos ayudan a evitar el coste energ\u00e9tico del c\u00f3mputo inal\u00e1mbrico<\/a>, mientras <a href=\"https:\/\/electricitymap.org\/\" target=\"_blank\" rel=\"noopener\">conciencia del carbono<\/a> deber\u00eda ayudarnos a comprender en qu\u00e9 ubicaci\u00f3n geogr\u00e1fica podr\u00edamos entrenar y desplegar mejor nuestros modelos de aprendizaje autom\u00e1tico. Un uso m\u00e1s sensato del hardware y los servicios existentes tambi\u00e9n deber\u00eda ser sencillamente una preocupaci\u00f3n de todos.<\/p>\n<p><strong>Sean cuales sean las soluciones utilizadas para adoptar una IA sostenible, esperamos que los responsables de la toma de decisiones se lo piensen dos veces antes de lanzar proyectos de IA.<\/strong>. Esto plantea el reto de <strong>medici\u00f3n<\/strong> aprendizaje autom\u00e1tico impacto medioambiental.<\/p>\n<\/div><div class=\"fusion-text fusion-text-11\"><p>El desarrollo del aprendizaje autom\u00e1tico, en 2022, deber\u00eda ir acompa\u00f1ado de una notificaci\u00f3n m\u00e1s sistem\u00e1tica de las emisiones de CO2e junto a las m\u00e9tricas de rendimiento (v\u00e9ase por ejemplo <a href=\"https:\/\/github.com\/mlco2\/codecarbon\" target=\"_blank\" rel=\"noopener\">codecarbon<\/a>), m\u00e1s transparencia por parte de los proveedores de cloud (v\u00e9ase la huella de carbono GCP <a href=\"https:\/\/cloud.google.com\/carbon-footprint\" target=\"_blank\" rel=\"noopener\">salpicadero<\/a>) y, sobre todo, una reflexi\u00f3n m\u00e1s profunda sobre los beneficios y los costes de aprovechar la IA. <strong>Los proyectos m\u00e1s convincentes ser\u00e1n los que adopten un enfoque hol\u00edstico: no s\u00f3lo cuantificar la huella de carbono de la computaci\u00f3n sino sopesarla frente a la eficiencia que aportan estos nuevos productos<\/strong>, sin olvidar tener en cuenta un potencial <a href=\"https:\/\/en.wikipedia.org\/wiki\/Rebound_effect_(conservation)\" target=\"_blank\" rel=\"noopener\">efecto rebote<\/a>. No basta con medir la huella de carbono de estos grandes modelos: <strong>debemos tener en cuenta todo el proceso de principio a fin: formaci\u00f3n, despliegue, seguimiento y tambi\u00e9n su impacto en la forma de trabajar de las personas<\/strong>.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">3 - A\u00f1adir un toque zen a sus MLOP<\/h2><\/div><div class=\"fusion-text fusion-text-12\"><p><strong>Esto es importante a medida que la parte de producci\u00f3n del aprendizaje autom\u00e1tico se vuelve cada vez m\u00e1s intrincada y sofisticada<\/strong>. En particular, los MLOP siguieron en auge este a\u00f1o y tuvieron su buena raci\u00f3n de innovaciones o conceptos en boga como Matt Turck <a href=\"https:\/\/mattturck.com\/data2021\/\" target=\"_blank\" rel=\"noopener\">explica<\/a>. Piense simplemente en <a href=\"https:\/\/data-notes.co\/what-i-learned-from-attending-tectons-apply-conference-85635a03ff2e\" target=\"_blank\" rel=\"noopener\">caracter\u00edsticas tiendas<\/a>, <a href=\"https:\/\/www.reuters.com\/business\/confluent-targets-over-8-bln-valuation-us-ipo-2021-06-16\/\" target=\"_blank\" rel=\"noopener\">streaming<\/a> capacidades y todas las iniciativas DataOps que cubriremos justo a continuaci\u00f3n.<\/p>\n<p>Aunque 2021 fue de nuevo un a\u00f1o de auge para <a href=\"https:\/\/ml-ops.org\/content\/motivation#mlops-definition\" target=\"_blank\" rel=\"noopener\">MLOPs<\/a>, Tambi\u00e9n hemos empezado a <strong>presenciar una cr\u00edtica reflexiva contra su propio zumbido<\/strong>. Y los argumentos son justos: el panorama de los MLOP es <a href=\"https:\/\/mattturck.com\/data2021\/\" target=\"_blank\" rel=\"noopener\">apenas legible,<\/a> que abarca cientos de conceptos y herramientas, tal vez a menudo <a href=\"https:\/\/laszlo.substack.com\/p\/whats-wrong-with-mlops\" target=\"_blank\" rel=\"noopener\">matando en exceso<\/a> y <strong>se podr\u00eda argumentar razonablemente que un proyecto medio <a href=\"https:\/\/en.wikipedia.org\/wiki\/You_aren%27t_gonna_need_it\" target=\"_blank\" rel=\"noopener\">no necesariamente las necesitar\u00e1 todas<\/a><\/strong>. La mayor\u00eda de los \u201c<a href=\"https:\/\/towardsdatascience.com\/mlops-without-much-ops-d17f502f76e8\" target=\"_blank\" rel=\"noopener\">escala razonable<\/a>\u201d empresas que no son <a href=\"https:\/\/towardsdatascience.com\/ml-and-mlops-at-a-reasonable-scale-31d2c0782d9c\" target=\"_blank\" rel=\"noopener\">FAANG<\/a> (<em>es decir.<\/em> sin enormes equipos t\u00e9cnicos, sin un ROI infinito generado por la IA, vol\u00famenes razonables de data) <strong>debe mantener la sencillez<\/strong>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-13\"><p><strong>Sigue siendo dif\u00edcil predecir c\u00f3mo evolucionar\u00e1 este panorama<\/strong>: sin duda debemos esperar que aparezcan m\u00e1s startups y tambi\u00e9n cierta homogeneizaci\u00f3n y consolidaci\u00f3n detr\u00e1s de los grandes actores. Sin duda, las herramientas sin c\u00f3digo o de bajo c\u00f3digo seguir\u00e1n creciendo y pondr\u00e1n esas caracter\u00edsticas al alcance de todos. Sin embargo, las cosas pueden cambiar, <strong>tambi\u00e9n creemos realmente en la aparici\u00f3n en los pr\u00f3ximos a\u00f1os de est\u00e1ndares abiertos y de una \u201cpila de ML can\u00f3nica\u201d<\/strong> como la que la Alianza para la Infraestructura de la IA pretende <a href=\"https:\/\/towardsdatascience.com\/ml-and-mlops-at-a-reasonable-scale-31d2c0782d9c\" target=\"_blank\" rel=\"noopener\">construya<\/a> (descargo de responsabilidad: Artefact forma parte de la Alianza).<\/p>\n<\/div><div class=\"fusion-text fusion-text-14\"><p><strong>As\u00ed que deseamos que a\u00f1ada un toque de <a href=\"https:\/\/en.wikipedia.org\/wiki\/Zen\" target=\"_blank\" rel=\"noopener\">Zen<\/a> a sus MLOP en 2022<\/strong>. Significa, en primer lugar, dar un paso atr\u00e1s y <strong>podar su pila a lo que realmente importa<\/strong>: la eficacia de sus modelos de aprendizaje autom\u00e1tico y la productividad de sus cient\u00edficos data, por ejemplo con un \u201c<a href=\"https:\/\/multithreaded.stitchfix.com\/blog\/2021\/02\/09\/aggressively-helpful-platform-teams\/\" target=\"_blank\" rel=\"noopener\">agresivamente \u00fatil<\/a>\u201d como la que ha adoptado el equipo de la plataforma Stitch Fix. Entonces, como la mayor\u00eda de los <a href=\"https:\/\/arxiv.org\/pdf\/2107.00079.pdf\" target=\"_blank\" rel=\"noopener\">antipatrones<\/a> de un proyecto de aprendizaje autom\u00e1tico parecen venir del lado del data,<strong> trabajar en la consolidaci\u00f3n de los cimientos de su proyecto: c\u00f3mo se abastece y procesa el propio data<\/strong>. En palabras de Ciro Greco, el data deber\u00eda convertirse de hecho en un \u201c<a href=\"https:\/\/towardsdatascience.com\/hagakure-for-mlops-the-four-pillars-of-ml-at-reasonable-scale-5a09bd073da\" target=\"_blank\" rel=\"noopener\">ciudadano de primera clase<\/a>\u201d de su pila de producci\u00f3n.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">4 - Hacer del data m\u00e1s un producto que una simple entrada<\/h2><\/div><div class=\"fusion-text fusion-text-15\"><p>\u201cSiempre se ha tratado del data\u201d deber\u00eda declarar 2021, con su renovado inter\u00e9s por \u00e9l, como demuestra, por supuesto, el <a href=\"https:\/\/www.forbes.com\/sites\/gilpress\/2021\/06\/16\/andrew-ng-launches-a-campaign-for-data-centric-ai\/?sh=3b1e4c3c74f5\" target=\"_blank\" rel=\"noopener\">Data-AI centrada<\/a> movimiento lanzado por Andrew Ng. <strong>El data no s\u00f3lo es el combustible del rendimiento de su modelo de aprendizaje autom\u00e1tico, sino tambi\u00e9n donde surgen los problemas, ya que un data desequilibrado, sesgado o mal etiquetado tendr\u00e1 sin duda un impacto perjudicial en los algoritmos posteriores.<\/strong>. As\u00ed pues, para un modelo dado y fijo, deber\u00edamos ser capaces de ganar calidad simplemente trabajando sobre su entrada, el data.<\/p>\n<\/div><div class=\"fusion-text fusion-text-16\"><p>Lo interesante es que este movimiento deber\u00eda reconciliar a todos a lo largo de la cadena de valor, desde el lado de la ingenier\u00eda data y sus recientes llamamientos a nutrir <a href=\"https:\/\/databand.ai\/data-observability\/\" target=\"_blank\" rel=\"noopener\">DataOps<\/a> pr\u00e1cticas (y nosotros mismos nos dimos un verdadero placer este a\u00f1o en incluir herramientas como <a href=\"https:\/\/greatexpectations.io\/\" target=\"_blank\" rel=\"noopener\">Grandes esperanzas<\/a> en todos nuestros proyectos) a los cient\u00edficos y analistas data que no carecer\u00e1n de sofisticados <a href=\"https:\/\/datacentricai.org\/\" target=\"_blank\" rel=\"noopener\">metodolog\u00edas<\/a> para perfeccionar el data en cuesti\u00f3n (aumento, etiquetado, correcci\u00f3n de sesgos, muestreo...). <strong>Por supuesto, pensamos que esto no ser\u00e1 posible sin una inversi\u00f3n clara por parte de la alta direcci\u00f3n y la aplicaci\u00f3n de medidas expl\u00edcitas de <a href=\"https:\/\/marketing.artefact.com\/l\/597421\/2021-12-20\/hwlcq2?utm_source=ebook&amp;utm_medium=website&amp;utm_campaign=2021-11-FR-Ebook-Data-Governance\" target=\"_blank\" rel=\"noopener\">procesa<\/a> de data governance para identificar primero y estructurar despu\u00e9s los diferentes dominios y sus propietarios dentro de la organizaci\u00f3n. <\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-17\"><p>Esto, combinado con el hecho de que el data ser\u00e1 cada vez m\u00e1s f\u00e1cil de desplazar gracias a iniciativas como <a href=\"https:\/\/consent.yahoo.com\/v2\/collectConsent?sessionId=3_cc-session_7581c65a-5999-46c3-9a14-3b8bc2674d2f\" target=\"_blank\" rel=\"noopener\">Airbyte<\/a> y la mejora continua de <a href=\"https:\/\/databricks.com\/blog\/2021\/05\/26\/introducing-delta-sharing-an-open-protocol-for-secure-data-sharing.html\" target=\"_blank\" rel=\"noopener\">data compartir<\/a> tecnolog\u00edas en nuestra moderna pila data permitir\u00eda<strong> empresas obviamente para encontrar nuevos <a href=\"https:\/\/towardsdatascience.com\/the-future-of-the-modern-data-stack-2de175b3c809\" target=\"_blank\" rel=\"noopener\">perspectivas<\/a> del propio data<\/strong>, en paralelo a lo que ya aporta la IA en t\u00e9rminos de automatizaci\u00f3n y conocimientos.<\/p>\n<\/div><div class=\"fusion-text fusion-text-18\"><p>***<\/p>\n<p>Eso es. En este periodo de prop\u00f3sitos de A\u00f1o Nuevo, le deseamos por tanto que domestique la indecencia de los modelos de cimentaci\u00f3n, haga sostenible la IA, a\u00f1ada un toque zen a sus MLOP y, por \u00faltimo, nutra su data como un producto m\u00e1s que considerarlo simplemente como un insumo. \u00bfY usted?<strong> \u00bfQu\u00e9 fue lo que m\u00e1s le sorprendi\u00f3 el a\u00f1o pasado? \u00bfQu\u00e9 espera que ocurra este a\u00f1o?\u00a0<\/strong><\/p>\n<\/div><\/div><\/div><\/div><\/article><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-5 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-4 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:40px;--awb-padding-right:40px;--awb-padding-bottom:40px;--awb-padding-left:40px;--awb-overflow:hidden;--awb-inner-bg-position:left center;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\" target=\"_blank\" rel=\"noopener\"><span class=\"fusion-column-inner-bg-image lazyload\" data-bg=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-column fusion-column-has-bg-image\" data-bg-url=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"medio\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-center fusion-title-text fusion-title-size-three\" style=\"--awb-margin-top:20px;--awb-margin-bottom:0px;--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-center fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Medio Blog por Artefact.<\/h3><\/div><div class=\"fusion-text fusion-text-19\" style=\"--awb-content-alignment:center;\"><p>Este art\u00edculo se public\u00f3 inicialmente en <strong>Medium.com<\/strong>.<br \/>\n\u00a1S\u00edganos en nuestro Medium Blog !<\/p>\n<\/div><div style=\"text-align:center;\"><a class=\"fusion-button button-flat button-medium button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" target=\"_blank\" rel=\"noopener noreferrer\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Lea nuestro art\u00edculo<\/span><\/a><\/div><\/div><\/div><\/div><\/div><\/p>","protected":false},"excerpt":{"rendered":"<p>Tendencias clave de 2021 en data y ML... y lo que significan para 2022<\/p>","protected":false},"featured_media":68685,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[21939],"blog-language":[2991],"class_list":["post-65852","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/blog\/65852","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/media\/68685"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/media?parent=65852"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/blog-category?post=65852"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/blog-language?post=65852"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}