Artigo escrito para o blog Medium por especialistas do Artefact em colaboração com a French Tech Corporate Community.
A abundância e a diversidade de respostas ao ChatGPT e a outras IAs generativas, sejam elas céticas ou entusiastas, demonstram as mudanças que elas estão provocando e o impacto que estão tendo muito além dos círculos tecnológicos habituais. Isso contrasta fortemente com as gerações anteriores de AI, que eram essencialmente preditivas e, em geral, objeto de artigos ou teses confinadas ao âmbito da pesquisa e da inovação.
AI Para as empresas, a IA generativa também é diferente das inteligências artificiais anteriores. Se as compararmos com as tecnologias mais semelhantes, como o processamento de linguagem natural (NLP) para corpora de texto ou a visão computacional para audiovisual data, as IAs generativas trazem quatro grandes mudanças que as empresas estão percebendo à medida que as experimentam.
Primeiro, em comparação com o AI anterior, o AI generativo acelera significativamente a implantação de casos de uso, no sentido de que acelera a prova de conceito. Em segundo lugar, eles abrem um novo campo de possibilidades, permitindo um aprimoramento mais fácil, mais eficiente e menos dispendioso do data não estruturado. Além disso, os resultados obtidos com a AI generativa são novos em termos de qualidade, quantidade e diversidade em comparação com os modelos usados anteriormente. Todos esses fatores significam que precisamos atender às expectativas elevadas dos usuários finais, alimentadas pelo hype em torno dessa tecnologia. Desenvolvemos esses quatro pontos a seguir.
O Generative AI permite testes mais rápidos do valor agregado dos casos de uso
No campo da IA generativa AI, a implantação de casos de uso costuma ser mais rápida e menos trabalhosa do que com as IAs anteriores. A abordagem adotada com a AI generativa é frequentemente comparada à montagem de Legos, em que componentes pré-existentes podem ser combinados para criar novos resultados. Essa facilidade de experimentação e implementação pode permitir ciclos de desenvolvimento mais curtos. Além disso, um modo de interação de conversação com os usuários também acelera a adoção.
Um caso de uso do data pode ser reduzido a um problema comercial, data, um modelo e um prompt. Tradicionalmente, a criação e a otimização do modelo representam a parte mais complexa e demorada do processo. Com o modelo generativo AI, essa etapa se torna mais simples. O Generative AI fornece modelos pré-treinados e prontos para uso, permitindo que as empresas se beneficiem da experiência avançada sem investir tempo significativo no desenvolvimento e no refinamento de modelos. Na prática, os modelos (como o GPT 4.0 do Azure) são acessíveis "sob demanda" ou podem ser implantados por meio de APIs (como o Gemini Pro BARD do Google). Alguns provedores oferecem até mesmo modelos especialmente ajustados para domínios específicos, como a geração de textos jurídicos, médicos ou financeiros.
AI Depois que o modelo é implantado, a única tarefa restante é "fundamentar" o modelo generativo, ou seja, ancorar os resultados gerados pelo modelo às informações do mundo real para restringir o modelo a responder dentro de um determinado perímetro. Isso geralmente envolve o acréscimo de restrições ou informações adicionais para orientar o modelo no sentido de produzir resultados que sejam coerentes e relevantes em um contexto específico. No entanto, isso está muito longe do tempo necessário para treinar os modelos AI que estamos usando até agora.
Vamos usar o exemplo de um caso de uso de análise literal de call center para ilustrar nosso argumento. De acordo com um estudo realizado em Artefact , para desenvolver esse tipo de caso de uso usando modelos baseados em AI anteriores, geralmente eram necessárias de três a quatro semanas a partir do momento em que o data era recuperado e tornado utilizável. Hoje, graças à tecnologia generativa AI, esse processo leva apenas uma semana, um fator de aceleração de mais de três. O principal desafio é escolher a classificação comercial adequada para adaptar o modelo.
O Generative AI amplia o escopo do AI para um uso anteriormente pouco ou mal utilizado data
Alguns campos de petróleo só são lucrativos quando os preços do petróleo disparam. O mesmo princípio pode ser aplicado ao data. Certas data não estruturadas podem agora ser extraídas graças à AI generativa, abrindo um campo totalmente novo de data exploração para treinamento ou ajuste fino de modelos e oferecendo inúmeras perspectivas para aplicativos especializados em domínios específicos.
E há uma promessa emergente: a de IAs generativas capazes de manipular e combinar qualquer tipo de data em seus processos de treinamento, ignorando o trabalho demorado e tedioso de estruturar e melhorar a qualidade da empresa data para torná-la utilizável. Uma promessa ainda não cumprida, com base nas observações atuais.
O Generative AI não se beneficiou apenas de um avanço real nos mecanismos de atenção. Ela também se beneficiou do poder cada vez maior - e necessário - das máquinas.
Os mecanismos de atenção funcionam um pouco como a capacidade de uma pessoa de se concentrar em uma parte importante de uma imagem ou texto ao tentar entender ou criar algo. Imagine tentar desenhar uma paisagem a partir de uma fotografia. Em vez de olhar para toda a imagem de uma só vez, você se concentra em determinadas partes que parecem importantes, como montanhas ou árvores. Isso o ajuda a entender melhor os detalhes importantes e a criar um desenho mais preciso. Da mesma forma, os mecanismos de atenção permitem que o modelo se concentre em partes específicas de uma imagem ou texto ao gerar conteúdo. Em vez de processar toda a entrada de uma só vez, o modelo pode se concentrar nas partes mais relevantes e importantes para produzir resultados mais precisos e significativos. Isso permite que ele aprenda a criar imagens, textos ou outros tipos de conteúdo de forma mais eficiente e realista.
Os mecanismos de atenção são muito bem paralelizados. O uso de vários mecanismos de atenção proporciona uma representação mais rica e robusta do data, o que leva a um melhor desempenho em várias tarefas, como tradução automática, geração de texto, síntese de fala, geração de imagens e muitas outras.
Como resultado, casos de uso que pareciam impossíveis até pouco tempo atrás agora se tornaram totalmente acessíveis. Esse é o caso, por exemplo, do cálculo do tempo de fala na mídia durante as campanhas presidenciais. Há apenas dois anos, calcular com precisão o tempo de fala de cada candidato era uma operação tediosa. Hoje, graças ao uso da tecnologia generativa AI, isso é possível.
Com relação aos recursos de computação, há seis anos, a OpenAI publicou uma análise mostrando que, desde 2012, o volume de computação usado nas sessões de treinamento mais significativas do AI vem aumentando exponencialmente, com um tempo de duplicação de 3,4 meses (para comparação, a Lei de Moore teve um período de duplicação de dois anos). Desde 2012, essa medida aumentou em mais de 300.000 vezes (um período de duplicação de dois anos produziria apenas um aumento de sete vezes).
Os modelos generativos de AI geralmente exigem enormes quantidades de capacidade de computação para treinamento, especialmente porque os modelos são projetados para serem generalistas e precisam de grandes quantidades de conteúdo para treinamento. Recursos de computação poderosos, como GPUs ou TPUs de ponta, são necessários para processar grandes conjuntos de dados e executar algoritmos de otimização complexos. A nova GPU NVIDIA A100 Tensor Core parece proporcionar uma aceleração sem precedentes. De acordo com a Nvidia, a A100 oferece desempenho até 20 vezes maior do que a geração anterior e pode ser dividida em sete instâncias de GPU para se adaptar dinamicamente às demandas variáveis. Ela também se orgulha de ter a largura de banda de memória mais rápida do mundo, com mais de dois terabytes por segundo (TB/s) para executar os maiores modelos e conjuntos de dados.
Deve-se observar que as melhorias na computação têm sido um elemento fundamental para o progresso do artificial intelligence. Enquanto essa tendência continuar, devemos estar preparados para as implicações de sistemas que excedem em muito os recursos atuais e que ampliarão ainda mais os limites, ao mesmo tempo em que ponderamos o valor que esses sistemas trazem em relação aos custos em que incorrem, especialmente em termos de energia e meio ambiente. Discutiremos esses pontos em um artigo futuro.
Generative AI melhora a diversidade, a qualidade e a quantidade dos resultados obtidos
A AI generativa difere claramente da AI anterior em seu impacto sobre os resultados gerados por seus modelos. Não apenas a quantidade de resultados gerados aumentou, mas também sua qualidade e diversidade. No entanto, todos esses aspectos positivos devem ser atenuados por uma menor reprodutibilidade dos modelos AI generativos.
Se considerarmos a imagem de um quebra-cabeça, a análise data pode ser comparada à sua montagem, em que cada peça do data representa uma peça a ser organizada para revelar uma imagem coerente. O AI desempenha um papel fundamental na tentativa de preencher o data que falta, usando as informações disponíveis para inferir e recriar as peças que faltam. O AI generativo vai além de simplesmente completar o data existente, criando um novo data inspirado no que já existe. Esse processo expande os recursos de análise e permite que novas informações sejam descobertas a partir de data informações existentes, trazendo o aspecto generativo para o primeiro plano.
Diferentemente das gerações anteriores de AI, que tendem a produzir resultados geralmente semelhantes, os modelos generativos de AI são capazes de gerar uma maior diversidade de resultados ao explorar diferentes variações e alternativas. Essa maior diversidade possibilita a geração de conteúdo mais rico e diversificado, passando do quantitativo para o qualitativo e abrangendo uma gama mais ampla de necessidades e preferências.
A OpenAI esteve recentemente em Hollywood para apresentar seu modelo mais recente, chamado "Sora", capaz de gerar vídeos a partir de texto. "Ouvir que ele pode fazer todas essas coisas é uma coisa, mas ver de fato os recursos foi surpreendente", disse o produtor de Hollywood Mike Perry, destacando a diversidade e a qualidade dos recursos oferecidos pela geração AI.
Entretanto, devido à sua capacidade de explorar um espaço mais amplo de possibilidades, os modelos generativos de AI podem ser menos reproduzíveis do que as IAs anteriores, e a precisão dos resultados fica comprometida. Em termos concretos, é mais difícil reproduzir exatamente os mesmos resultados toda vez que o modelo é executado, o que pode representar desafios em termos de confiabilidade e previsibilidade em determinados aplicativos de missão crítica.
Essa limitação constitui um grande desafio para os aplicativos de geração de AI que exigem respostas precisas. E é uma área em que as empresas estão trabalhando em seus desenvolvimentos atuais: especializar melhor os modelos em domínios altamente específicos para melhorar a precisão das respostas e combinar a robustez dos modelos baseados em regras ou consultas em data estruturado com a facilidade de uso e interação com os usuários de IAs generativas, conectando esses últimos aos resultados dos primeiros.
Expectativas mais elevadas dos usuários finais
Quando se trata de gerenciar as expectativas e o relacionamento dos usuários finais com a tecnologia, a AI generativa apresenta vários desafios específicos. Devido à sua capacidade de produzir resultados rapidamente, a tecnologia generativa AI pode gerar expectativas particularmente altas. Por outro lado, a ocorrência de alucinações e resultados indesejáveis pode minar muito a confiança do usuário nessas soluções.
A AI generativa é capaz de produzir resultados rapidamente e de forma automatizada, o que pode dar aos usuários finais a impressão de que a tecnologia é capaz de resolver todos os seus problemas de forma instantânea e eficiente. Isso pode levar a expectativas desproporcionais sobre os recursos reais da tecnologia generativa AI e à decepção se os resultados não atenderem totalmente a essas altas expectativas.
É claro que a AI generativa não é perfeita e, às vezes, pode produzir resultados inesperados ou indesejáveis, como conteúdo inconsistente, falso ou inadequado. A ocorrência de tais resultados indesejáveis pode levar a uma perda de confiança do usuário final na tecnologia, questionando sua confiabilidade e utilidade. AI Também podem gerar preocupações com relação à segurança e à privacidade quando resultados inesperados comprometem a integridade das informações geradas pelo data gerador01 .
Em fevereiro de 2023, o chatbot Bard do Google (renomeado Gemini) forneceu informações incorretas quando perguntado sobre as descobertas do Telescópio Espacial James Webb da NASA. Ele afirmou erroneamente que o telescópio havia tirado as primeiras fotos de um exoplaneta. Essa afirmação está incorreta, pois as primeiras fotos de um exoplaneta datam de 2004, enquanto o Telescópio James Webb só foi lançado em 2021 (fonte: equipe da CNET France, 2024).
Portanto, é fundamental que os usuários finais dos sistemas generativos AI estejam cientes de suas limitações. Portanto, a maioria das empresas que implementam essas soluções se esforça para dar suporte aos usuários em seu uso: treinamento na arte de solicitar, explicar as limitações desses sistemas, esclarecer quais expectativas podem ou não ser atendidas e lembrá-los das regras aplicáveis em termos de proteção do data .
Mais de um ano após o lançamento do ChatGPT, as expectativas em relação a essa nova tecnologia estão mais altas do que nunca. No entanto, o valor associado a ela ainda não se materializou em casos de uso tangíveis. Em nosso próximo artigo, discutiremos tópicos relacionados à adoção da tecnologia pelas empresas e como ela é disseminada por toda a organização.
Sob a liderança de: