Artículo escrito para el blog Medium por expertos de Artefact en colaboración con la comunidad francesa de empresas tecnológicas.
La abundancia y diversidad de respuestas a ChatGPT y otras IA generativas, ya sean escépticas o entusiastas, demuestran los cambios que están provocando y el impacto que están teniendo mucho más allá de los círculos tecnológicos habituales. Esto contrasta fuertemente con las generaciones anteriores de AI, que eran esencialmente predictivas y generalmente objeto de artículos o tesis confinadas al ámbito de la investigación y la innovación.
Para las empresas, la AI generativa también es diferente de las inteligencias artificiales anteriores. Si las comparamos con las tecnologías más similares, como el procesamiento del lenguaje natural (PLN) para corpus textuales o la visión por ordenador para audiovisuales data, las IA generativas aportan cuatro grandes cambios de los que las empresas se están dando cuenta a medida que experimentan con ellas.
En primer lugar, en comparación con los anteriores AI, los AI generativos aceleran significativamente el despliegue de casos de uso en el sentido de que aceleran la prueba de concepto. En segundo lugar, abren un nuevo abanico de posibilidades, al permitir una mejora más fácil, eficiente y menos costosa de la información no estructurada data. Además, los resultados obtenidos con AI generativa son nuevos en términos de calidad, cantidad y diversidad en comparación con los modelos utilizados anteriormente. Todos estos factores nos obligan a responder a las crecientes expectativas de los usuarios finales, alimentadas por el bombo publicitario que rodea a esta tecnología. A continuación desarrollamos estos cuatro puntos.
Generative AI permite probar más rápidamente el valor añadido de los casos de uso
En el campo de la AI generativa, la implementación de casos de uso suele ser más rápida y menos laboriosa que con las IA anteriores. El enfoque adoptado con AI generativa se compara a menudo con el montaje de Legos, en el que los componentes preexistentes pueden combinarse para crear nuevos resultados. Esta facilidad de experimentación e implementación puede permitir ciclos de desarrollo más cortos. Además, un modo de interacción conversacional con los usuarios también acelera la adopción.
Un caso de uso de data puede reducirse a un problema empresarial, data, un modelo y una solicitud. Tradicionalmente, la creación y optimización del modelo representa la parte más compleja y lenta del proceso. Con AI, este paso se simplifica. Generative AI proporciona modelos preentrenados y listos para usar, lo que permite a las empresas beneficiarse de conocimientos avanzados sin invertir mucho tiempo en desarrollar y perfeccionar modelos. En la práctica, los modelos (como GPT 4.0 de Azure) son accesibles "a la carta" o pueden desplegarse a través de API (como Gemini Pro BARD de Google). Algunos proveedores incluso ofrecen modelos especialmente afinados para dominios específicos, como la generación de textos jurídicos, médicos o financieros.
Una vez desplegado el modelo, lo único que queda por hacer es "aterrizar" el modelo generativo AI , es decir, anclar los resultados generados por el modelo a la información del mundo real para constreñir al modelo a responder dentro de un perímetro determinado. Esto suele implicar añadir restricciones o información adicional para guiar al modelo hacia la producción de resultados que sean coherentes y relevantes en un contexto específico. Sin embargo, esto dista mucho del tiempo que se tarda en entrenar los modelos de AI que hemos venido utilizando hasta ahora.
Tomemos el ejemplo de un caso de uso de análisis literal de un centro de llamadas para ilustrar nuestro punto de vista. Según un estudio de Artefact , para desarrollar este tipo de caso de uso utilizando modelos basados en AI anteriores, generalmente se tardaba entre tres y cuatro semanas desde el momento en que se recuperaba el data y se hacía utilizable. Hoy en día, gracias a AI generativo, este proceso sólo lleva una semana, lo que supone un factor de aceleración de más de tres. El principal reto consiste en elegir la clasificación empresarial adecuada para adaptar el modelo.
Generative AI amplía el alcance de AI a temas poco o mal utilizados hasta ahora. data
Algunos yacimientos sólo son rentables cuando los precios del petróleo se disparan. El mismo principio puede aplicarse a data. Determinados data no estructurados pueden ahora explotarse gracias a AI generativo, lo que abre todo un nuevo campo de data explotables para entrenar o afinar modelos, y ofrece numerosas perspectivas para aplicaciones especializadas en dominios específicos.
Y hay una promesa emergente: la de las IA generativas capaces de manejar y combinar cualquier tipo de data en sus procesos de entrenamiento, obviando el largo y tedioso trabajo de estructurar y mejorar la calidad de Compañia data para hacerla utilizable. Una promesa aún no cumplida, según las observaciones actuales.
Generative AI no sólo se ha beneficiado de un verdadero avance en los mecanismos de atención. También se ha beneficiado de la potencia cada vez mayor -y necesaria- de las máquinas.
Los mecanismos de atención funcionan un poco como la capacidad de una persona para centrarse en una parte importante de una imagen o un texto cuando intenta comprender o crear algo. Imagine que intenta dibujar un paisaje a partir de una fotografía. En lugar de mirar toda la imagen a la vez, te centras en determinadas partes que parecen importantes, como las montañas o los árboles. Esto le ayuda a comprender mejor los detalles importantes y a crear un dibujo más preciso. Del mismo modo, los mecanismos de atención permiten al modelo centrarse en partes concretas de una imagen o un texto al generar contenidos. En lugar de procesar toda la entrada a la vez, el modelo puede centrarse en las partes más relevantes e importantes para producir resultados más precisos y significativos. Esto le permite aprender a crear imágenes, textos u otros tipos de contenidos de forma más eficaz y realista.
Los mecanismos de atención se paralelizan muy bien. El uso de múltiples mecanismos de atención proporciona una representación más rica y robusta de data, lo que permite mejorar el rendimiento en diversas tareas como la traducción automática, la generación de textos, la síntesis de voz, la generación de imágenes y muchas otras.
Como resultado, casos de uso que parecían imposibles no hace mucho se han hecho ahora plenamente accesibles. Es el caso, por ejemplo, del cálculo del tiempo de palabra en los medios de comunicación durante las campañas presidenciales. Hace apenas dos años, calcular con precisión el tiempo de palabra de cada candidato era una operación tediosa. Hoy, gracias al uso de AI, es posible.
En cuanto a las capacidades de computación, hace seis años, OpenAI publicó un análisis que mostraba que, desde 2012, la cantidad de computación utilizada en las sesiones de entrenamiento más significativas de AI ha ido aumentando exponencialmente, con un tiempo de duplicación de 3,4 meses (para comparar, la Ley de Moore tenía un periodo de duplicación de dos años). Desde 2012, esta medida se ha multiplicado por más de 300.000 (un periodo de duplicación de dos años solo produciría un aumento de siete veces).
Los modelos generativos de AI suelen requerir enormes cantidades de potencia de cálculo para su entrenamiento, sobre todo porque los modelos están diseñados para ser generalistas y necesitan grandes cantidades de contenido para entrenarse. Para procesar grandes conjuntos de datos y ejecutar complejos algoritmos de optimización se necesitan potentes recursos de cálculo, como las GPU o TPU de gama alta. La nueva GPU NVIDIA A100 Tensor Core parece proporcionar una aceleración sin precedentes. Según Nvidia, la A100 Servicios ofrece un rendimiento hasta 20 veces superior al de la generación anterior y puede particionarse en siete instancias de GPU para adaptarse dinámicamente a los cambios de demanda. También presume de tener el ancho de banda de memoria más rápido del mundo, con más de dos terabytes por segundo (TB/s) para ejecutar los modelos y conjuntos de datos más grandes.
Cabe señalar que las mejoras informáticas han sido un elemento clave en el progreso de Inteligencia Artificial. Mientras esta tendencia continúe, debemos estar preparados para las implicaciones de sistemas que superan con creces las capacidades actuales y que ampliarán aún más los límites, todo ello sopesando el valor que aportan estos sistemas frente a los costes en que incurren, especialmente en términos de energía y medio ambiente. Trataremos estos puntos en un próximo artículo.
Generativa AI mejora la diversidad, calidad y cantidad de los resultados obtenidos.
Generative AI se diferencia claramente de la anterior AI por su impacto en los resultados generados por sus modelos. No sólo ha aumentado la cantidad de resultados generados, sino también su calidad y diversidad. Sin embargo, todos estos aspectos positivos deben atenuarse por una menor reproducibilidad de los modelos generativos de AI .
Si consideramos la imagen de un rompecabezas, el análisis de data puede compararse a su ensamblaje, donde cada pieza de data representa una pieza que hay que ordenar para revelar una imagen coherente. AI desempeña un papel fundamental al tratar de completar lo que falta data utilizando la información disponible para inferir y recrear esas piezas que faltan. El AI generativo va más allá de simplemente completar el data existente creando un nuevo data inspirado en lo que ya existe. Este proceso amplía las capacidades de análisis y permite descubrir nueva información a partir de data ya existente, lo que pone en primer plano el aspecto generativo.
A diferencia de las generaciones anteriores de AI, que tienden a producir resultados a menudo similares, los modelos generativos de AI son capaces de generar una mayor diversidad de resultados explorando distintas variaciones y alternativas. Esta mayor diversidad permite generar contenidos más ricos y diversificados, pasando de lo cuantitativo a lo cualitativo y abarcando un abanico más amplio de necesidades y preferencias.
OpenAI estuvo recientemente en Hollywood para mostrar su último modelo, llamado "Sora", capaz de generar vídeos a partir de texto. "Oír que puede hacer todas estas cosas es una cosa, pero ver realmente las capacidades fue asombroso", dijo el productor de Hollywood Mike Perry, destacando la diversidad y calidad de las capacidades que ofrece la generativa AI.
Sin embargo, debido a su capacidad para explorar un espacio más amplio de posibilidades, los modelos generativos de AI pueden ser menos reproducibles que las IA anteriores, y la precisión de los resultados se ve comprometida. En concreto, es más difícil reproducir exactamente los mismos resultados cada vez que se ejecuta el modelo, lo que puede plantear problemas de fiabilidad y previsibilidad en determinadas aplicaciones de misión crítica.
Esta limitación constituye un reto importante para las aplicaciones de AI generativa que requieren respuestas precisas. Y es un área en la que las empresas están trabajando en sus desarrollos actuales: especializar mejor los modelos en dominios muy específicos para mejorar la precisión de las respuestas, y combinar la robustez de los modelos basados en reglas o consultas en data estructurado con la facilidad de uso e interacción con los usuarios de las IA generativas conectando estas últimas a las salidas de los primeros.
Mayores expectativas de los usuarios finales
Cuando se trata de gestionar las expectativas y la relación de los usuarios finales con la tecnología, la generativa AI presenta varios retos específicos. Debido a su capacidad para producir resultados rápidamente, la AI generativa puede suscitar expectativas especialmente altas. A la inversa, la aparición de alucinaciones y resultados indeseables puede minar enormemente la confianza de los usuarios en estas soluciones.
Generative AI es capaz de producir resultados rápidamente y de forma automatizada, lo que puede dar a los usuarios finales la impresión de que la tecnología es capaz de resolver todos sus problemas de forma instantánea y eficaz. Esto puede dar lugar a expectativas desproporcionadas sobre las capacidades reales de AI generativa, y a decepción si los resultados no satisfacen plenamente esas elevadas expectativas.
Por supuesto, la tecnología generativa AI no es perfecta y a veces puede producir resultados inesperados o indeseables, como contenidos incoherentes, falsos o inapropiados. La aparición de estos resultados indeseables puede hacer perder la confianza del usuario final en la tecnología y poner en entredicho su fiabilidad y utilidad. También puede plantear problemas de seguridad y privacidad data cuando resultados inesperados comprometen la integridad de la información generada por AI.
En febrero de 2023, el chatbot de Google Bard (rebautizado Gemini) proporcionó información incorrecta cuando se le preguntó sobre los descubrimientos del telescopio espacial James Webb de la NASA. Afirmó erróneamente que el telescopio había tomado las primeras fotos de un exoplaneta. Esta afirmación es incorrecta, ya que las primeras fotos de un exoplaneta datan de 2004, mientras que el telescopio James Webb no se lanzó hasta 2021 (fuente: equipo de CNET France, 2024).
Por ello, es fundamental que los usuarios finales de los sistemas generativos de AI sean conscientes de sus limitaciones. Por ello, la mayoría de las empresas que despliegan estas soluciones se esfuerzan por apoyar a los usuarios en su utilización: formándoles en el arte del prompting, explicándoles las limitaciones de estos sistemas, aclarándoles qué expectativas pueden o no pueden cumplirse y recordándoles las normas aplicables en materia de protección data .
Más de un año después del lanzamiento de ChatGPT, las expectativas en torno a esta nueva tecnología son más altas que nunca. Sin embargo, el valor asociado a ella aún no se ha materializado en casos de uso tangibles. En nuestro próximo artículo, trataremos temas relacionados con la adopción empresarial de la tecnología y su difusión por toda la organización.
Bajo la dirección de: