{"id":95610,"date":"2024-02-08T16:25:33","date_gmt":"2024-02-08T16:25:33","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=blog&#038;p=95610"},"modified":"2024-09-20T17:46:02","modified_gmt":"2024-09-20T16:46:02","slug":"why-you-need-llmops","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/es\/blog\/why-you-need-llmops\/","title":{"rendered":"\u00bfPor qu\u00e9 necesitas LLMOps?"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Autor<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/meryam-assermouh.jpg\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-text-color:var(--awb-color7);--awb-margin-bottom-small:8px;--awb-font-size:18px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;Josefin Sans&quot;;font-style:normal;font-weight:600;margin:0;font-size:1em;--fontSize:18;line-height:1.5;\">Meryam Assermouh<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\" style=\"--awb-font-size:14px;--awb-line-height:1.6;--awb-letter-spacing:2px;--awb-text-transform:uppercase;--awb-text-color:var(--awb-color7);--awb-text-font-family:&quot;Roboto&quot;;--awb-text-font-style:normal;--awb-text-font-weight:400;\"><p>Data Engineer <a href=\"https:\/\/www.artefact.com\/es\/\">en Artefact Francia<\/a><\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">TL;DR<\/h2><\/div><div class=\"fusion-text fusion-text-2\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Este art\u00edculo presenta LLMOps, una rama especializada que fusiona DevOps y MLOps para <strong>gestionar los retos que plantean los grandes modelos ling\u00fc\u00edsticos<\/strong> (LLMs). Los LLM, como el GPT de OpenAI, utilizan textos extensos data para tareas como la generaci\u00f3n de textos y la traducci\u00f3n de idiomas. Los LLMO abordan cuestiones como <strong>personalizaci\u00f3n, cambios de API, deriva data, evaluaci\u00f3n de modelos y supervisi\u00f3n<\/strong> a trav\u00e9s de herramientas como LangSmith, TruLens y W&amp;B Prompts. Garantiza la adaptabilidad, la evaluaci\u00f3n y la supervisi\u00f3n de los LLM en escenarios reales, ofreciendo una soluci\u00f3n integral para las organizaciones que aprovechan estos modelos ling\u00fc\u00edsticos avanzados.<\/p>\n<\/div><div class=\"fusion-text fusion-text-3\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>Para guiarle a trav\u00e9s de este debate, comenzaremos revisando los principios fundacionales de DevOps y MLOps, y despu\u00e9s nos centraremos en LLMOps, comenzando con una breve introducci\u00f3n a los LLM y su utilizaci\u00f3n por parte de las organizaciones. A continuaci\u00f3n, profundizaremos en los principales retos operativos que plantea la tecnolog\u00eda LLM y en c\u00f3mo los LLMOps los abordan de forma eficaz.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Principios fundamentales para LLMOps : DevOps y MLOps<\/h2><\/div><div class=\"fusion-text fusion-text-4\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>DevOps, abreviatura de Desarrollo y Operaciones, es un conjunto de pr\u00e1cticas cuyo objetivo es automatizar el proceso de entrega de software, haci\u00e9ndolo m\u00e1s eficiente, fiable y escalable. Los principios b\u00e1sicos de DevOps incluyen: colaboraci\u00f3n, automatizaci\u00f3n, pruebas continuas, supervisi\u00f3n y orquestaci\u00f3n del despliegue.<\/p>\n<\/div><div class=\"fusion-text fusion-text-5\" style=\"--awb-font-size:20px;--awb-line-height:1.6;--awb-letter-spacing:var(--awb-typography4-letter-spacing);--awb-text-transform:var(--awb-typography4-text-transform);--awb-text-color:var(--awb-color5);--awb-text-font-family:var(--awb-typography4-font-family);--awb-text-font-weight:var(--awb-typography4-font-weight);--awb-text-font-style:var(--awb-typography4-font-style);\"><p>MLOps, abreviatura de Machine Learning Operations (operaciones de aprendizaje autom\u00e1tico), es una extensi\u00f3n de las pr\u00e1cticas DevOps adaptada espec\u00edficamente a la gesti\u00f3n del ciclo de vida de los modelos de aprendizaje autom\u00e1tico. Aborda los retos \u00fanicos que plantea la naturaleza iterativa y experimental del desarrollo del aprendizaje autom\u00e1tico. Introduce tareas adicionales como el versionado y la gesti\u00f3n de data, as\u00ed como la experimentaci\u00f3n y el entrenamiento de modelos.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">LLMOps: Gesti\u00f3n del despliegue y mantenimiento de grandes modelos ling\u00fc\u00edsticos<\/h2><\/div><div class=\"fusion-text fusion-text-6\"><p>LLMOps, abreviatura de Large Language Model Operations (Operaciones con grandes modelos ling\u00fc\u00edsticos), es una rama especializada de MLOps dise\u00f1ada espec\u00edficamente para gestionar los retos y requisitos exclusivos de la gesti\u00f3n de grandes modelos ling\u00fc\u00edsticos (LLM).<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Pero primero, \u00bfqu\u00e9 son exactamente los LLM?<\/h2><\/div><div class=\"fusion-text fusion-text-7\"><p>Los LLM son un tipo de modelo de aprendizaje profundo que utiliza cantidades masivas de texto data para estimar miles de millones de par\u00e1metros. Estos par\u00e1metros permiten a los LLM comprender y generar textos de calidad humana, traducir idiomas, resumir informaci\u00f3n compleja y realizar diversas tareas de procesamiento del lenguaje natural.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">C\u00f3mo utilizan las organizaciones los LLM<\/h2><\/div><div class=\"fusion-text fusion-text-8\"><p>Dado que entrenar a los LLM desde cero es extremadamente caro y lleva mucho tiempo, las organizaciones optan por modelos b\u00e1sicos preentrenados, como GPT de OpenAI o LaMDA de Google AI, como punto de partida. Estos modelos, al estar ya entrenados sobre grandes cantidades de data, poseen amplios conocimientos y pueden realizar diversas tareas, como generar texto, traducir idiomas y escribir distintos tipos de contenidos creativos. Para personalizar a\u00fan m\u00e1s el resultado del LLM a tareas o dominios espec\u00edficos, las organizaciones emplean t\u00e9cnicas como la ingenier\u00eda de prompt, la generaci\u00f3n aumentada por recuperaci\u00f3n (RAG) y el ajuste fino. La ingenier\u00eda de instrucciones implica la elaboraci\u00f3n de instrucciones claras y concisas que gu\u00eden al LLM hacia el resultado deseado, mientras que la RAG fundamenta el modelo en informaci\u00f3n adicional procedente de fuentes externas data, mejorando su rendimiento y relevancia. El ajuste fino, por su parte, implica ajustar los par\u00e1metros del LLM utilizando data adicionales espec\u00edficos para las necesidades de la organizaci\u00f3n. El esquema que figura a continuaci\u00f3n ofrece una visi\u00f3n general del flujo de trabajo del LLMOps, ilustrando c\u00f3mo se integran estas t\u00e9cnicas en el proceso global.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"text-align:center;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"1336\" height=\"463\" title=\"sch\u00e9ma LLMOps art\u00edculo medio\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article.png\" alt class=\"lazyload img-responsive wp-image-95612\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271336%27%20height%3D%27463%27%20viewBox%3D%270%200%201336%20463%27%3E%3Crect%20width%3D%271336%27%20height%3D%27463%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-200x69.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-400x139.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-600x208.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-800x277.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article-1200x416.png 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-LLMOps-medium-article.png 1336w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1336px\" \/><\/span><\/div><div class=\"fusion-title title fusion-title-8 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Por qu\u00e9 necesitamos LLMOps<\/h2><\/div><div class=\"fusion-text fusion-text-9\"><p>Los r\u00e1pidos avances de la tecnolog\u00eda LLM han sacado a la luz varios retos operativos que requieren enfoques especializados.<\/p>\n<p>Algunos de estos retos incluyen :<\/p>\n<\/div><ul style=\"--awb-iconcolor:var(--awb-color7);--awb-textcolor:var(--awb-color7);--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons paddingList dark-text\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>La necesidad de personalizaci\u00f3n<\/strong>: Aunque los LLM est\u00e1n preentrenados en cantidades masivas de data, la personalizaci\u00f3n es esencial para un rendimiento \u00f3ptimo en tareas espec\u00edficas. Esto ha llevado al desarrollo de nuevas t\u00e9cnicas de personalizaci\u00f3n, como <strong>ingenier\u00eda r\u00e1pida<\/strong>, generaci\u00f3n aumentada por recuperaci\u00f3n (<strong>RAG<\/strong>) y <strong>puesta a punto<\/strong>. RAG ayuda a fundamentar el modelo en la informaci\u00f3n m\u00e1s precisa al proporcionarle una base de conocimientos externa, mientras que el ajuste fino es m\u00e1s adecuado cuando queremos que el modelo realice tareas espec\u00edficas o se adhiera a un formato de respuesta concreto, como JSON o SQL. La elecci\u00f3n entre RAG y ajuste fino depende de si pretendemos aumentar los conocimientos del modelo o mejorar su rendimiento en una tarea espec\u00edfica.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Cambios en la API<\/strong>: A diferencia de los modelos de ML tradicionales, a menudo se accede a los LLM a trav\u00e9s de API de terceros, que pueden modificarse o incluso quedar obsoletos, lo que requiere una supervisi\u00f3n y adaptaci\u00f3n continuas. Por ejemplo, <a href=\"https:\/\/platform.openai.com\/docs\/deprecations\" target=\"_blank\" rel=\"noopener\">Abrir la documentaci\u00f3n de la IA<\/a> menciona expl\u00edcitamente que sus modelos est\u00e1n sujetos a actualizaciones peri\u00f3dicas, lo que puede requerir que los usuarios actualicen su software o migren a modelos o puntos finales m\u00e1s nuevos.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Data deriva<\/strong>, se refiere a un cambio en las propiedades estad\u00edsticas del data de entrada, que se produce con frecuencia en la producci\u00f3n cuando el data encontrado se desv\u00eda del data con el que se entrenaron los LLM. Esto puede llevar a la generaci\u00f3n de informaci\u00f3n inexacta o desfasada. Por ejemplo, con el modelo GPT-3.5, su informaci\u00f3n se limit\u00f3 hasta septiembre de 2021 antes de que <a href=\"https:\/\/www.zdnet.com\/article\/chatgpt-is-no-longer-as-clueless-about-recent-events\/\" target=\"_blank\" rel=\"noopener\">la fecha l\u00edmite se ampli\u00f3 hasta enero de 2022<\/a>. En consecuencia, no pudo responder a preguntas sobre acontecimientos m\u00e1s recientes, lo que provoc\u00f3 la frustraci\u00f3n de los usuarios.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Evaluaci\u00f3n del modelo<\/strong>: En el aprendizaje autom\u00e1tico tradicional, nos basamos en m\u00e9tricas como la exactitud, la precisi\u00f3n y el recuerdo para evaluar nuestros modelos. Sin embargo, la evaluaci\u00f3n de los LLM es bastante m\u00e1s intrincada, sobre todo cuando no se dispone de la verdad sobre el terreno data y cuando se trata de salidas de lenguaje natural en lugar de valores num\u00e9ricos.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Supervisi\u00f3n<\/strong>: La supervisi\u00f3n continua de los LLM y de las aplicaciones basadas en ellos es crucial. Tambi\u00e9n es m\u00e1s complicado porque implica m\u00faltiples aspectos que deben tenerse en cuenta para garantizar la eficacia y fiabilidad globales de estos modelos ling\u00fc\u00edsticos. Discutiremos estos aspectos con m\u00e1s detalle en la siguiente secci\u00f3n.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-title title fusion-title-9 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">C\u00f3mo aborda LLMOps estos retos<\/h2><\/div><div class=\"fusion-text fusion-text-10\"><p>LLMOps se basa en los cimientos de MLOps al tiempo que introduce componentes especializados adaptados a los LLM :<\/p>\n<\/div><ul style=\"--awb-iconcolor:var(--awb-color7);--awb-textcolor:var(--awb-color7);--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-2 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Gesti\u00f3n r\u00e1pida de la ingenier\u00eda y la puesta a punto<\/strong>: LLMOps proporciona herramientas como <strong>sistemas r\u00e1pidos de control de versiones<\/strong> para realizar un seguimiento y gestionar diferentes versiones de los avisos. Tambi\u00e9n se integra con <strong>marcos de ajuste<\/strong> para automatizar y optimizar el proceso de puesta a punto. Un ejemplo destacado de estas herramientas es LangSmith, un marco dise\u00f1ado espec\u00edficamente para gestionar los flujos de trabajo del LLM. Sus completas funciones abarcan <a href=\"https:\/\/docs.smith.langchain.com\/cookbook\/hub-examples\/retrieval-qa-chain-versioned\" target=\"_blank\" rel=\"noopener\">versionado r\u00e1pido<\/a>, permitiendo la experimentaci\u00f3n controlada y la reproducibilidad. Adem\u00e1s, LangSmith facilita <a href=\"https:\/\/docs.smith.langchain.com\/cookbook\/fine-tuning-examples\" target=\"_blank\" rel=\"noopener\">puesta a punto<\/a> de LLMs utilizando ejecuciones'data tras un eventual filtrado y enriquecimiento para mejorar el rendimiento del modelo.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Gesti\u00f3n de cambios de la API<\/strong>: LLMOps establece procesos para <strong>supervisi\u00f3n<\/strong> Cambios en la API, <strong>alertando a<\/strong> operadores ante posibles perturbaciones, y <strong>habilitar las reversiones<\/strong> si es necesario.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Adaptaci\u00f3n del modelo a los cambios data<\/strong>: LLMOps facilita la adaptaci\u00f3n de los LLM a los panoramas evolutivos de data, asegurando que los modelos sigan siendo relevantes y eficaces a medida que cambian los patrones de data. Esto podr\u00eda lograrse mediante <strong>seguimiento de las distribuciones de data y activaci\u00f3n de los procesos de adaptaci\u00f3n<\/strong> cuando se detecten cambios significativos. Estos procesos pueden incluir:<br \/>\n-&gt; <strong>Reentrenamiento o puesta a punto<\/strong>: Dependiendo de la magnitud de la deriva data y de los recursos disponibles, se puede recurrir al reentrenamiento o al ajuste fino para mitigar su impacto.<br \/>\n-&gt; <strong>Adaptaci\u00f3n del dominio<\/strong>: Puesta a punto del LLM en un dataset del dominio de destino.<br \/>\n-&gt; <strong>Destilaci\u00f3n de conocimientos<\/strong>: Formar un modelo m\u00e1s peque\u00f1o aprovechando los conocimientos y la experiencia de un modelo m\u00e1s grande, potente y actualizado.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Evaluaci\u00f3n espec\u00edfica del LLM<\/strong>: El LLMOps emplea nuevas herramientas de evaluaci\u00f3n adaptadas a los LLM. Entre ellas se incluyen:<br \/>\n-&gt; <strong>M\u00e9tricas basadas en texto<\/strong>, como la perplejidad; una medida estad\u00edstica de lo bien que el modelo es capaz de predecir la siguiente palabra de una secuencia. As\u00ed como las m\u00e9tricas BLEU y ROUGE, que comparan el texto generado por la m\u00e1quina con uno o varios textos de referencia generados por humanos. Se utilizan habitualmente en tareas de traducci\u00f3n y resumen.<br \/>\n-&gt; <strong>An\u00e1lisis de las incrustaciones<\/strong> (representaciones vectoriales de palabras o frases), para evaluar la capacidad del modelo de comprender las palabras espec\u00edficas del contexto y captar las similitudes sem\u00e1nticas. Las t\u00e9cnicas de visualizaci\u00f3n y agrupaci\u00f3n pueden ayudarnos tambi\u00e9n en la detecci\u00f3n de sesgos.<br \/>\n-&gt; <strong>Evaluador LLM<\/strong>: Utilizar otros LLM para evaluar nuestro modelo. Por ejemplo, esto puede hacerse atribuyendo una puntuaci\u00f3n a la salida del modelo evaluado basada en m\u00e9tricas predefinidas, como la fluidez, la coherencia, la relevancia y la precisi\u00f3n factual.<br \/>\n-&gt; <strong>Integraci\u00f3n de la retroalimentaci\u00f3n humana<\/strong>: LLMOps incorpora mecanismos para recopilar e incorporar la retroalimentaci\u00f3n humana en el ciclo de vida del ML, mejorando el rendimiento del LLM y abordando los sesgos.<br \/>\n<a href=\"https:\/\/www.trulens.org\/trulens_eval\/core_concepts_feedback_functions\/#feedback-functions\" target=\"_blank\" rel=\"noopener\">TruLens<\/a> es una herramienta que permite la integraci\u00f3n de estas evaluaciones en las aplicaciones LLM a trav\u00e9s de un enfoque program\u00e1tico conocido como Funciones de retroalimentaci\u00f3n.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Seguimiento espec\u00edfico del LLM<\/strong>: LLMOps integra una supervisi\u00f3n continua para realizar un seguimiento de las m\u00e9tricas de rendimiento de LLM, identificar posibles problemas y detectar desviaciones o sesgos conceptuales. Esto incluye:<br \/>\n-&gt; <strong>Supervisi\u00f3n funcional<\/strong>; mediante el seguimiento del n\u00famero de solicitudes, el tiempo de respuesta, el uso de tokens, las tasas de error y el coste.<br \/>\n-&gt; <strong>Seguimiento puntual<\/strong>; para garantizar la legibilidad y detectar la toxicidad y otras formas de abuso. <a href=\"https:\/\/docs.wandb.ai\/guides\/prompts_platform\" target=\"_blank\" rel=\"noopener\">W&amp;B Prompts<\/a> es un conjunto de herramientas dise\u00f1adas para supervisar las aplicaciones basadas en LLM. Puede utilizarse para analizar las entradas y salidas de sus LLM, visualizar los resultados intermedios y almacenar y gestionar de forma segura sus avisos.<br \/>\n-&gt; <strong>Seguimiento de la respuesta<\/strong>; garantizar la pertinencia y la coherencia del modelo. Esto incluye evitar la generaci\u00f3n de contenidos alucinantes o ficticios, as\u00ed como garantizar la exclusi\u00f3n de material nocivo o inapropiado. La transparencia puede ayudarnos a comprender mejor la respuesta del modelo. Puede establecerse revelando las fuentes de respuesta (en GAR) o incitando al modelo a justificar su razonamiento (cadena de pensamiento).<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-11\"><p>Esta supervisi\u00f3n data puede utilizarse para mejorar la eficacia operativa. Podemos mejorar la gesti\u00f3n de costes implementando alertas sobre el uso de tokens y empleando estrategias como el almacenamiento en cach\u00e9 de respuestas anteriores. Esto nos permite reutilizarlas para consultas similares sin invocar de nuevo al LLM. Adem\u00e1s, podemos minimizar la latencia optando por modelos m\u00e1s peque\u00f1os siempre que sea factible y limitando el n\u00famero de tokens generados.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-10 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-bottom-small:8px;--awb-font-size:30px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:&quot;PT Serif&quot;;font-style:normal;font-weight:700;margin:0;letter-spacing:1.6px;font-size:1em;--fontSize:30;line-height:1.47;\">Conclusi\u00f3n<\/h2><\/div><div class=\"fusion-text fusion-text-12\"><p>En este art\u00edculo, exploramos la aparici\u00f3n de LLMOps, un descendiente de DevOps y MLOps, dise\u00f1ado espec\u00edficamente para abordar los retos operativos que plantean los grandes modelos ling\u00fc\u00edsticos. Concluyamos con una comparaci\u00f3n visual de estas tres metodolog\u00edas, ilustrando su alcance en el contexto de las empresas usuarias de LLM, que aprovechan estos modelos para crear productos y resolver problemas empresariales.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"text-align:center;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"927\" height=\"727\" title=\"sch\u00e9ma 2 LLMOps art\u00edculo mediano\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article.png\" alt class=\"lazyload img-responsive wp-image-95613\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27927%27%20height%3D%27727%27%20viewBox%3D%270%200%20927%20727%27%3E%3Crect%20width%3D%27927%27%20height%3D%27727%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article-200x157.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article-400x314.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article-600x471.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article-800x627.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2024\/02\/schema-2-LLMOps-medium-article.png 927w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 927px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-13\"><p>Aunque las tres metodolog\u00edas comparten pr\u00e1cticas comunes como CI\/CD, versionado y evaluaci\u00f3n, cada una tiene \u00e1reas de enfoque distintas. DevOps abarca todo el ciclo de vida del desarrollo de software, desde el desarrollo hasta el despliegue y el mantenimiento. MLOps ampl\u00eda DevOps para abordar los retos espec\u00edficos de los modelos de aprendizaje autom\u00e1tico, incluida la automatizaci\u00f3n de la formaci\u00f3n, el despliegue y la supervisi\u00f3n de los modelos. LLMOps, la \u00faltima iteraci\u00f3n de estas metodolog\u00edas, se centra espec\u00edficamente en los LLM. Aunque las empresas usuarias de LLM no necesitan desarrollar sus propios modelos, siguen enfrent\u00e1ndose a retos operativos, como la gesti\u00f3n de los cambios de API y la personalizaci\u00f3n de los modelos mediante t\u00e9cnicas como la ingenier\u00eda r\u00e1pida y el ajuste fino.<\/p>\n<\/div><\/div><\/div><\/div><\/article><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center\" style=\"--awb-padding-top:40px;--awb-padding-right:40px;--awb-padding-bottom:40px;--awb-padding-left:40px;--awb-overflow:hidden;--awb-bg-position:left center;--awb-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper lazyload fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-column fusion-column-has-bg-image\" data-bg-url=\"https:\/\/artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\" data-bg=\"https:\/\/artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-3 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"medio\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-title title fusion-title-11 fusion-sep-none fusion-title-center fusion-title-text fusion-title-size-three\" style=\"--awb-margin-top:20px;--awb-margin-bottom:0px;--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-center fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Medio Blog por Artefact.<\/h3><\/div><div class=\"fusion-text fusion-text-14\" style=\"--awb-content-alignment:center;\"><p>Este art\u00edculo se public\u00f3 inicialmente en Medium.com.<br \/>\n\u00a1S\u00edganos en nuestro Medium Blog !<\/p>\n<\/div><div style=\"text-align:center;\"><a class=\"fusion-button button-flat button-medium button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" style=\"--button_text_transform:var(--awb-custom_typography_2-text-transform);--button_typography-letter-spacing:var(--awb-custom_typography_2-letter-spacing);--button_typography-font-family:var(--awb-custom_typography_2-font-family);--button_typography-font-weight:var(--awb-custom_typography_2-font-weight);--button_typography-font-style:var(--awb-custom_typography_2-font-style);\" target=\"_blank\" rel=\"noopener noreferrer\" data-hover=\"text_slide_down\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/why-you-need-llmops-48c0925827de#c82e-c015f09e2d46\"><div class=\"awb-button-text-transition  awb-button__hover-content--centered\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Lea nuestro art\u00edculo<\/span><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Lea nuestro art\u00edculo<\/span><\/div><\/a><\/div><\/div><\/div><\/div><\/div><\/p>","protected":false},"excerpt":{"rendered":"<p>Este art\u00edculo presenta LLMOps, una rama especializada que fusiona DevOps y MLOps para gestionar los retos que plantean los modelos de lenguaje a gran escala (LLM)\u2026<\/p>","protected":false},"featured_media":95614,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[2995,21939],"blog-language":[2991],"class_list":["post-95610","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-ai-technology","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/blog\/95610","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/media\/95614"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/media?parent=95610"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/blog-category?post=95610"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/es\/wp-json\/wp\/v2\/blog-language?post=95610"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}