Artículo escrito para el blog Medium por los expertos de Artefact en colaboración con la comunidad francesa de empresas tecnológicas.
La abundancia y diversidad de respuestas a ChatGPT y otras IA generativas, ya sean escépticas o entusiastas, demuestran los cambios que están provocando y el impacto que están teniendo mucho más allá de los círculos tecnológicos habituales. Esto contrasta fuertemente con las generaciones anteriores de IA, que eran esencialmente predictivas y generalmente objeto de artículos o tesis confinadas al ámbito de la investigación y la innovación.
Para las empresas, las IA generativas también son diferentes de las artificial intelligence anteriores. Si las comparamos con las tecnologías más similares, como el procesamiento del lenguaje natural (PLN) para corpus textuales o la visión por ordenador para data audiovisuales, las IA generativas aportan cuatro grandes cambios de los que las empresas se están dando cuenta a medida que experimentan con ellas.
En primer lugar, en comparación con la IA anterior, la IA generativa acelera significativamente el despliegue de casos de uso en el sentido de que acelera la prueba de concepto. En segundo lugar, abren un nuevo abanico de posibilidades, permitiendo una mejora más fácil, eficaz y menos costosa de la data no estructurada. Además, los resultados obtenidos con la IA generativa son nuevos en términos de calidad, cantidad y diversidad en comparación con los modelos utilizados anteriormente. Todos estos factores nos obligan a responder a las mayores expectativas de los usuarios finales, alimentadas por el bombo publicitario que rodea a esta tecnología. A continuación desarrollamos estos cuatro puntos.
La IA generativa permite probar más rápidamente el valor añadido de los casos de uso
En el campo de la IA generativa, el despliegue de casos de uso suele ser más rápido y menos laborioso que con las IA anteriores. El enfoque adoptado con la IA generativa se compara a menudo con el montaje de Legos, en el que los componentes preexistentes pueden combinarse para crear nuevos resultados. Esta facilidad de experimentación e implementación puede permitir ciclos de desarrollo más cortos. Además, un modo de interacción conversacional con los usuarios también acelera la adopción.
Un caso de uso data puede reducirse a un problema empresarial, data, un modelo y una solicitud. Tradicionalmente, la creación y optimización del modelo representa la parte más compleja y lenta del proceso. Con la IA generativa, este paso se simplifica. La IA generativa proporciona modelos preentrenados y listos para usar, lo que permite a las empresas beneficiarse de conocimientos avanzados sin invertir mucho tiempo en desarrollar y perfeccionar los modelos. En la práctica, los modelos (como el GPT 4.0 de Azure) son accesibles “a la carta” o pueden desplegarse a través de API (como Gemini Pro BARD de Google). Algunos proveedores ofrecen incluso modelos especialmente afinados para dominios específicos, como la generación de textos jurídicos, médicos o financieros.
Una vez desplegado el modelo, la única tarea que queda por hacer es “aterrizar” el modelo de IA generativa, es decir, anclar los resultados generados por el modelo a la información del mundo real para constreñir al modelo a responder dentro de un perímetro determinado. Esto implica a menudo añadir restricciones o información adicional para guiar al modelo hacia la producción de resultados que sean coherentes y relevantes en un contexto específico. Sin embargo, esto dista mucho del tiempo que se tarda en entrenar los modelos de IA que hemos estado utilizando hasta ahora.
Tomemos el ejemplo de un caso de uso de análisis textual de un centro de llamadas para ilustrar nuestro punto de vista. Según un estudio Artefact, para desarrollar este tipo de caso de uso utilizando modelos basados en IA previa, se tardaba generalmente entre tres y cuatro semanas desde el momento en que se recuperaba y se hacía utilizable la data. Hoy, gracias a la IA generativa, este proceso sólo lleva una semana, un factor de aceleración de más de tres. El principal reto consiste en elegir la clasificación empresarial adecuada para adaptar el modelo.
La IA generativa amplía el alcance de la IA a data antes poco utilizados o mal utilizados
Algunos yacimientos sólo son rentables cuando los precios del petróleo se disparan. El mismo principio puede aplicarse al data. Ciertos data no estructurados pueden explotarse ahora gracias a la IA generativa, lo que abre todo un nuevo campo de data explotables para entrenar o afinar modelos, y ofrece numerosas perspectivas para aplicaciones especializadas en dominios específicos.
Y existe una promesa emergente: la de las IA generativas capaces de manejar y combinar cualquier tipo de data en sus procesos de entrenamiento, obviando el largo y tedioso trabajo de estructurar y mejorar la calidad de la data de la empresa para hacerla utilizable. Una promesa aún no cumplida, según las observaciones actuales.
La IA generativa no sólo se ha beneficiado de un verdadero avance en los mecanismos de atención. También se ha beneficiado de la potencia cada vez mayor -y necesaria- de las máquinas.
Los mecanismos de atención funcionan un poco como la capacidad de una persona para centrarse en una parte importante de una imagen o un texto cuando intenta comprender o crear algo. Imagine que intenta dibujar un paisaje a partir de una fotografía. En lugar de mirar toda la imagen a la vez, se centra en ciertas partes que le parecen importantes, como las montañas o los árboles. Esto le ayuda a comprender mejor los detalles importantes y a crear un dibujo más preciso. Del mismo modo, los mecanismos de atención permiten al modelo centrarse en partes específicas de una imagen o un texto al generar contenidos. En lugar de procesar toda la entrada a la vez, el modelo puede centrarse en las partes más relevantes e importantes para producir resultados más precisos y significativos. Esto le permite aprender a crear imágenes, texto u otros tipos de contenido de forma más eficaz y realista.
Los mecanismos de atención se paralelizan muy bien. El uso de múltiples mecanismos de atención proporciona una representación más rica y robusta de data, lo que permite mejorar el rendimiento en diversas tareas como la traducción automática, la generación de textos, la síntesis del habla, la generación de imágenes y muchas otras.
Como resultado, casos de uso que parecían imposibles no hace mucho tiempo se han vuelto ahora totalmente accesibles. Es el caso, por ejemplo, del cálculo del tiempo de palabra en los medios de comunicación durante las campañas presidenciales. Hace sólo dos años, calcular con precisión el tiempo de palabra de cada candidato era una operación tediosa. Hoy, gracias al uso de la IA generativa, es posible.
En cuanto a las capacidades de computación, hace seis años, OpenAI publicó un análisis que mostraba que, desde 2012, la cantidad de computación utilizada en las sesiones de entrenamiento de IA más significativas ha ido aumentando exponencialmente, con un tiempo de duplicación de 3,4 meses (para comparar, la Ley de Moore tenía un periodo de duplicación de dos años). Desde 2012, esta medida ha aumentado más de 300.000 veces (un periodo de duplicación de dos años sólo produciría un aumento de siete veces).
Los modelos de IA generativa suelen requerir enormes cantidades de potencia de cálculo para su entrenamiento, sobre todo porque los modelos están diseñados para ser generalistas y necesitan grandes cantidades de contenido para entrenarse. Para procesar grandes conjuntos de data y ejecutar complejos algoritmos de optimización se necesitan potentes recursos de cálculo, como las GPU o TPU de gama alta. La nueva GPU NVIDIA A100 Tensor Core parece proporcionar una aceleración sin precedentes. Según Nvidia, la A100 ofrece un rendimiento hasta 20 veces superior al de la generación anterior y puede particionarse en siete instancias de GPU para adaptarse dinámicamente a las demandas cambiantes. También presume, al parecer, del mayor ancho de banda de memoria del mundo, con más de dos terabytes por segundo (TB/s) para ejecutar los modelos más grandes y los conjuntos data.
Cabe señalar que las mejoras en la informática han sido un elemento clave en el progreso de la artificial intelligence. Mientras esta tendencia continúe, debemos estar preparados para las implicaciones de los sistemas que superan con creces las capacidades actuales y que ampliarán aún más los límites, todo ello sopesando el valor que aportan estos sistemas frente a los costes que suponen, especialmente en términos de energía y medio ambiente. Trataremos estos puntos en un próximo artículo.
La IA generativa mejora la diversidad, calidad y cantidad de los resultados obtenidos
La IA generativa se diferencia claramente de la IA anterior por su impacto en los resultados generados por sus modelos. No sólo ha aumentado la cantidad de resultados generados, sino también su calidad y diversidad. Sin embargo, todos estos aspectos positivos deben atemperarse por una menor reproducibilidad de los modelos de IA generativa.
Si consideramos la imagen de un rompecabezas, el análisis del data puede compararse a su ensamblaje, en el que cada pieza del data representa una pieza que hay que ordenar para revelar una imagen coherente. La IA desempeña un papel fundamental al intentar completar el data que falta utilizando la información disponible para inferir y recrear esas piezas que faltan. La IA generativa va más allá de simplemente completar los data existentes creando nuevos data inspirados en lo que ya existe. Este proceso amplía las capacidades de análisis y permite descubrir nueva información a partir de los data existentes, lo que pone en primer plano el aspecto generativo.

A diferencia de las generaciones anteriores de IA, que tienden a producir resultados a menudo similares, los modelos de IA generativa son capaces de generar una mayor diversidad de resultados explorando distintas variaciones y alternativas. Esta mayor diversidad permite generar contenidos más ricos y diversificados, pasando de lo cuantitativo a lo cualitativo y abarcando una gama más amplia de necesidades y preferencias.
OpenAI estuvo recientemente en Hollywood para mostrar su último modelo llamado “Sora”, capaz de generar vídeos a partir de texto. “Oír que puede hacer todas estas cosas es una cosa, pero ver realmente las capacidades fue asombroso”, dijo el productor de Hollywood Mike Perry, destacando la diversidad y la calidad de las capacidades que ofrece la IA generativa.
Sin embargo, debido a su capacidad para explorar un espacio más amplio de posibilidades, los modelos de IA generativa pueden ser menos reproducibles que las IA anteriores, y la precisión de los resultados se ve comprometida. En concreto, es más difícil reproducir exactamente los mismos resultados cada vez que se ejecuta el modelo, lo que puede plantear retos en términos de fiabilidad y previsibilidad en determinadas aplicaciones de misión crítica.
Esta limitación constituye un reto importante para las aplicaciones de la IA generativa que requieren respuestas precisas. Y es un área en la que las empresas están trabajando en sus desarrollos actuales: especializar mejor los modelos en dominios muy específicos para mejorar la precisión de las respuestas, y combinar la robustez de los modelos basados en reglas o consultas sobre data estructurados con la facilidad de uso e interacción con los usuarios de las IA generativas conectando estas últimas a las salidas de los primeros.
Mayores expectativas de los usuarios finales
Cuando se trata de gestionar las expectativas y la relación de los usuarios finales con la tecnología, la IA generativa presenta varios retos específicos. Debido a su capacidad para producir resultados rápidamente, la IA generativa puede suscitar expectativas especialmente altas. A la inversa, la aparición de alucinaciones y resultados indeseables puede minar en gran medida la confianza de los usuarios en estas soluciones.
La IA generativa es capaz de producir resultados rápidamente y de forma automatizada, lo que puede dar a los usuarios finales la impresión de que la tecnología es capaz de resolver todos sus problemas de forma instantánea y eficaz. Esto puede dar lugar a expectativas desproporcionadas sobre las capacidades reales de la IA generativa, y a decepción si los resultados no satisfacen plenamente esas elevadas expectativas.
La IA generativa no es, por supuesto, perfecta y a veces puede producir resultados inesperados o indeseables, como contenidos incoherentes, falsos o inapropiados. La aparición de estos resultados indeseables puede provocar una pérdida de confianza del usuario final en la tecnología, poniendo en duda su fiabilidad y utilidad. También puede plantear problemas de seguridad y privacidad data cuando los resultados inesperados comprometen la integridad de la información generada por la IA generativa.
En febrero de 2023, el chatbot de Google Bard (rebautizado Gemini) proporcionó información incorrecta cuando se le preguntó sobre los descubrimientos del telescopio espacial James Webb de la NASA. Afirmó erróneamente que el telescopio había tomado las primeras fotos de un exoplaneta. Esta afirmación es incorrecta, ya que las primeras fotos de un exoplaneta datan de 2004, mientras que el telescopio James Webb no se lanzó hasta 2021 (fuente: equipo de CNET Francia, 2024).
Por lo tanto, es crucial que los usuarios finales de los sistemas de IA generativa sean conscientes de sus limitaciones. Por ello, la mayoría de las empresas que despliegan estas soluciones se esfuerzan por apoyar a los usuarios en su utilización: formándoles en el arte de la incitación, explicándoles las limitaciones de estos sistemas, aclarándoles qué expectativas pueden o no pueden cumplirse y recordándoles las normas aplicables en materia de protección data.
Más de un año después del lanzamiento de ChatGPT, las expectativas en torno a esta nueva tecnología son más altas que nunca. Sin embargo, el valor asociado a ella aún no se ha materializado en casos de uso tangibles. En nuestro próximo artículo, trataremos temas relacionados con la adopción de la tecnología por parte de las empresas y su difusión por toda la organización.
Bajo la dirección de:

BLOG





