Artigo escrito para o blog Medium pelos especialistas do Artefact em colaboração com a French Tech Corporate Community.

A abundância e a diversidade de respostas ao ChatGPT e a outras IAs generativas, sejam elas céticas ou entusiastas, demonstram as mudanças que elas estão provocando e o impacto que estão tendo muito além dos círculos tecnológicos habituais. Isso contrasta fortemente com as gerações anteriores de IA, que eram essencialmente preditivas e, em geral, objeto de artigos ou teses confinadas ao âmbito da pesquisa e da inovação.

Para as empresas, a IA generativa também é diferente dos artificial intelligences anteriores. Se as compararmos com as tecnologias mais semelhantes, como o processamento de linguagem natural (PLN) para corpora de texto ou a visão computacional para data audiovisual, as IAs generativas trazem quatro grandes mudanças que as empresas estão percebendo à medida que as experimentam.

Primeiro, em comparação com a IA anterior, a IA generativa acelera significativamente a implantação de casos de uso, no sentido de que acelera a prova de conceito. Em segundo lugar, ela abre um novo campo de possibilidades, permitindo um aprimoramento mais fácil, mais eficiente e menos dispendioso do data não estruturado. Além disso, os resultados obtidos com a IA generativa são novos em termos de qualidade, quantidade e diversidade em comparação com os modelos usados anteriormente. Todos esses fatores significam que precisamos atender às expectativas elevadas dos usuários finais, alimentadas pelo hype em torno dessa tecnologia. Desenvolvemos esses quatro pontos a seguir.

A IA geradora permite testar mais rapidamente o valor agregado dos casos de uso

No campo da IA generativa, a implantação de casos de uso costuma ser mais rápida e menos trabalhosa do que com as IAs anteriores. A abordagem adotada com a IA generativa é frequentemente comparada à montagem de Legos, em que componentes pré-existentes podem ser combinados para criar novos resultados. Essa facilidade de experimentação e implementação pode permitir ciclos de desenvolvimento mais curtos. Além disso, um modo de interação conversacional com os usuários também acelera a adoção.

Um caso de uso data pode ser reduzido a um problema comercial, data, um modelo e um prompt. Tradicionalmente, a criação e a otimização do modelo representam a parte mais complexa e demorada do processo. Com a IA generativa, essa etapa se torna mais simples. A IA generativa fornece modelos pré-treinados e prontos para uso, permitindo que as empresas se beneficiem da experiência avançada sem investir tempo significativo no desenvolvimento e no refinamento de modelos. Na prática, os modelos (como o GPT 4.0 do Azure) são acessíveis “sob demanda” ou podem ser implantados por meio de APIs (como o Gemini Pro BARD do Google). Alguns provedores oferecem até mesmo modelos especialmente ajustados para domínios específicos, como a geração de textos jurídicos, médicos ou financeiros.

Depois que o modelo é implantado, a única tarefa que resta é “fundamentar” o modelo de IA generativo, ou seja, ancorar os resultados gerados pelo modelo às informações do mundo real para restringir o modelo a responder dentro de um determinado perímetro. Isso geralmente envolve o acréscimo de restrições ou informações adicionais para orientar o modelo no sentido de produzir resultados que sejam coerentes e relevantes em um contexto específico. No entanto, isso está muito longe do tempo que leva para treinar os modelos de IA que usamos até agora.

Vamos usar o exemplo de um caso de uso de análise literal de call center para ilustrar nosso argumento. De acordo com um estudo Artefact, para desenvolver esse tipo de caso de uso usando modelos baseados em IA anterior, geralmente levava de três a quatro semanas a partir do momento em que o data era recuperado e tornado utilizável. Hoje, graças à IA generativa, esse processo leva apenas uma semana, um fator de aceleração de mais de três. O principal desafio é escolher a classificação comercial adequada para adaptar o modelo.

A IA generativa amplia o escopo da IA para data anteriormente pouco usado ou mal usado

Alguns campos de petróleo só são lucrativos quando os preços do petróleo disparam. O mesmo princípio pode ser aplicado ao data. Determinado data não estruturado pode agora ser extraído graças à IA generativa, abrindo um campo totalmente novo de data explorável para treinamento ou ajuste fino de modelos e oferecendo inúmeras perspectivas para aplicativos especializados em domínios específicos.

E há uma promessa emergente: a de IAs generativas capazes de manipular e combinar qualquer tipo de data em seus processos de treinamento, ignorando o trabalho demorado e tedioso de estruturar e melhorar a qualidade do data da empresa para torná-lo utilizável. Uma promessa ainda não cumprida, com base nas observações atuais.

A IA geradora não se beneficiou apenas de um avanço real nos mecanismos de atenção. Ela também se beneficiou do poder cada vez maior - e necessário - das máquinas.

Os mecanismos de atenção funcionam um pouco como a capacidade de uma pessoa de se concentrar em uma parte importante de uma imagem ou texto ao tentar entender ou criar algo. Imagine tentar desenhar uma paisagem a partir de uma fotografia. Em vez de olhar para toda a imagem de uma só vez, o senhor se concentra em determinadas partes que parecem importantes, como montanhas ou árvores. Isso ajuda o senhor a entender melhor os detalhes importantes e a criar um desenho mais preciso. Da mesma forma, os mecanismos de atenção permitem que o modelo se concentre em partes específicas de uma imagem ou texto ao gerar conteúdo. Em vez de processar toda a entrada de uma só vez, o modelo pode se concentrar nas partes mais relevantes e importantes para produzir resultados mais precisos e significativos. Isso permite que ele aprenda a criar imagens, textos ou outros tipos de conteúdo de forma mais eficiente e realista.

Os mecanismos de atenção são muito bem paralelizados. O uso de vários mecanismos de atenção proporciona uma representação mais rica e robusta do data, o que leva a um melhor desempenho em várias tarefas, como tradução automática, geração de texto, síntese de fala, geração de imagens e muitas outras.

Como resultado, casos de uso que pareciam impossíveis até pouco tempo atrás agora se tornaram totalmente acessíveis. Esse é o caso, por exemplo, do cálculo do tempo de fala na mídia durante as campanhas presidenciais. Há apenas dois anos, calcular com precisão o tempo de fala de cada candidato era uma operação tediosa. Hoje, graças ao uso da IA generativa, isso é possível.

Com relação aos recursos de computação, há seis anos, a OpenAI publicou uma análise mostrando que, desde 2012, o volume de computação usado nas sessões de treinamento de IA mais significativas vem aumentando exponencialmente, com um tempo de duplicação de 3,4 meses (para comparação, a Lei de Moore teve um período de duplicação de dois anos). Desde 2012, essa medida aumentou em mais de 300.000 vezes (um período de duplicação de dois anos produziria apenas um aumento de sete vezes).

Os modelos de IA generativa geralmente exigem enormes quantidades de capacidade de computação para treinamento, especialmente porque os modelos são projetados para serem generalistas e precisam de grandes quantidades de conteúdo para treinamento. Recursos de computação poderosos, como GPUs ou TPUs de ponta, são necessários para processar grandes conjuntos de data e executar algoritmos de otimização complexos. A nova GPU NVIDIA A100 Tensor Core parece oferecer uma aceleração sem precedentes. De acordo com a Nvidia, a A100 oferece desempenho até 20 vezes maior do que a geração anterior e pode ser dividida em sete instâncias de GPU para se adaptar dinamicamente às demandas variáveis. Ela também ostenta a largura de banda de memória mais rápida do mundo, com mais de dois terabytes por segundo (TB/s) para executar os maiores modelos e conjuntos data.

Deve-se observar que as melhorias na computação têm sido um elemento fundamental para o progresso do artificial intelligence. Enquanto essa tendência continuar, devemos estar preparados para as implicações dos sistemas que excedem em muito os recursos atuais e que ampliarão ainda mais os limites, ao mesmo tempo em que ponderamos o valor que esses sistemas trazem em relação aos custos em que incorrem, especialmente em termos de energia e meio ambiente. Discutiremos esses pontos em um artigo futuro.

A IA generativa melhora a diversidade, a qualidade e a quantidade dos resultados obtidos

A IA generativa difere claramente da IA anterior em seu impacto sobre os resultados gerados por seus modelos. Não apenas a quantidade de resultados gerados aumentou, mas também sua qualidade e diversidade. No entanto, todos esses aspectos positivos devem ser atenuados por uma menor reprodutibilidade dos modelos de IA generativa.

Se considerarmos a imagem de um quebra-cabeça, a análise do data pode ser comparada à sua montagem, em que cada peça do data representa uma peça a ser organizada para revelar uma imagem coerente. A IA desempenha um papel fundamental na tentativa de preencher o data que falta, usando as informações disponíveis para inferir e recriar as peças que faltam. A IA generativa vai além de simplesmente completar o data existente, criando um novo data inspirado no que já existe. Esse processo expande os recursos de análise e permite que novas informações sejam descobertas a partir do data existente, trazendo o aspecto generativo para o primeiro plano.

Ao contrário das gerações anteriores de IA, que tendem a produzir resultados geralmente semelhantes, os modelos de IA generativa são capazes de gerar uma maior diversidade de resultados ao explorar diferentes variações e alternativas. Essa maior diversidade possibilita a geração de conteúdo mais rico e diversificado, passando do quantitativo para o qualitativo e abrangendo uma gama mais ampla de necessidades e preferências.

A OpenAI esteve recentemente em Hollywood para apresentar seu modelo mais recente, chamado “Sora”, capaz de gerar vídeos a partir de texto. “Ouvir que ele pode fazer todas essas coisas é uma coisa, mas ver de fato os recursos foi surpreendente”, disse o produtor de Hollywood Mike Perry, destacando a diversidade e a qualidade dos recursos oferecidos pela IA generativa.

Entretanto, devido à sua capacidade de explorar um espaço mais amplo de possibilidades, os modelos de IA generativa podem ser menos reproduzíveis do que as IAs anteriores, e a precisão dos resultados fica comprometida. Em termos concretos, é mais difícil reproduzir exatamente os mesmos resultados toda vez que o modelo é executado, o que pode representar desafios em termos de confiabilidade e previsibilidade em determinados aplicativos de missão crítica.

Essa limitação constitui um grande desafio para os aplicativos de IA generativa que exigem respostas precisas. E é uma área em que as empresas estão trabalhando em seus desenvolvimentos atuais: especializar melhor os modelos em domínios altamente específicos para melhorar a precisão das respostas e combinar a robustez dos modelos baseados em regras ou consultas em data estruturado com a facilidade de uso e a interação com os usuários de IAs generativas, conectando esses últimos aos resultados dos primeiros.

Expectativas mais elevadas dos usuários finais

Quando se trata de gerenciar as expectativas e o relacionamento dos usuários finais com a tecnologia, a IA generativa apresenta vários desafios específicos. Devido à sua capacidade de produzir resultados rapidamente, a IA generativa pode gerar expectativas particularmente altas. Por outro lado, a ocorrência de alucinações e resultados indesejáveis pode minar muito a confiança do usuário nessas soluções.

A IA generativa é capaz de produzir resultados rapidamente e de forma automatizada, o que pode dar aos usuários finais a impressão de que a tecnologia é capaz de resolver todos os seus problemas de forma instantânea e eficiente. Isso pode levar a expectativas desproporcionais sobre os recursos reais da IA generativa e à decepção se os resultados não atenderem totalmente a essas altas expectativas.

É claro que a IA generativa não é perfeita e, às vezes, pode produzir resultados inesperados ou indesejáveis, como conteúdo inconsistente, falso ou inadequado. A ocorrência de tais resultados indesejáveis pode levar a uma perda de confiança do usuário final na tecnologia, questionando sua confiabilidade e utilidade. Também pode gerar preocupações com relação à segurança e à privacidade quando resultados inesperados comprometem a integridade das informações geradas pela IA generativa.

Em fevereiro de 2023, o chatbot Bard do Google (renomeado Gemini) forneceu informações incorretas quando perguntado sobre as descobertas do Telescópio Espacial James Webb da NASA. Ele afirmou erroneamente que o telescópio havia tirado as primeiras fotos de um exoplaneta. Essa afirmação está incorreta, pois as primeiras fotos de um exoplaneta datam de 2004, enquanto o Telescópio James Webb só foi lançado em 2021 (fonte: equipe da CNET France, 2024).

Portanto, é fundamental que os usuários finais dos sistemas de IA generativa estejam cientes de suas limitações. Portanto, a maioria das empresas que implementam essas soluções se esforça para dar suporte aos usuários em seu uso: treinamento na arte de solicitar, explicar as limitações desses sistemas, esclarecer quais expectativas podem ou não ser atendidas e lembrá-los das regras aplicáveis em termos de proteção data.

Mais de um ano após o lançamento do ChatGPT, as expectativas em relação a essa nova tecnologia estão mais altas do que nunca. No entanto, o valor associado a ela ainda não se materializou em casos de uso tangíveis. Em nosso próximo artigo, discutiremos tópicos relacionados à adoção da tecnologia pelas empresas e como ela é disseminada por toda a organização.

Sob a liderança de:

  • Guillaume Lame - Diretor de Data - Natixis

  • Antoine Le Feuvre - VP de Soluções Digitais - Suez

Média Blog por Artefact.

Este artigo foi publicado inicialmente no Medium.com.
Siga-nos em nosso Medium Blog !