Artefact Research Center
Preenchendo a lacuna entre o meio acadêmico e as aplicações industriais.

Pesquisa sobre modelos mais transparentes e éticos para promover a adoção AI .

Exemplos de AI
- O AppleCard concede hipotecas com base em critérios racistas
- O Lensa AI as selfies das mulheres
- Classificação racista de imagens no Facebook retratando afro-americanos como macacos
- O chatbot da Microsoft no Twitter está se tornando nazista, sexista e agressivo
- O ChatGPT que escreve um código afirmando que os bons cientistas são homens brancos
Desafio atual
AI são precisos e fáceis de implementar em muitos casos de uso, mas continuam sendo incontroláveis devido às caixas pretas e às questões éticas.
A missãoResearch Center Artefact .
Um ecossistema completo que faz a ponte entre
a pesquisa fundamental e as aplicações industriais concretas.


Emmanuel MALHERBE
Chefe de Pesquisa
Área de pesquisa: Aprendizado profundo, Aprendizado de máquina
Tendo iniciado sua carreira com um doutorado em modelos de PLN adaptados ao recrutamento online, Emmanuel sempre buscou um equilíbrio eficaz entre a pesquisa pura e aplicações de impacto. Sua experiência em pesquisa inclui previsão de séries temporais em 5G para a Huawei Technologies e modelos de visão computacional para clientes de cabeleireiro e maquiagem na L’Oréal. Antes de ingressar Artefact, ele trabalhou em Xangai como chefe de AI da L’Oréal Ásia. Hoje, sua posição na Artefact uma oportunidade perfeita e um ambiente ideal para fazer a ponte entre o meio acadêmico e a indústria, além de promover sua pesquisa voltada para o mundo real e, ao mesmo tempo, causar impacto em aplicações industriais.
LeiaResearch Center últimasResearch Center Artefact
Áreas de pesquisa transversais
Com nosso posicionamento único, nosso objetivo é abordar os desafios gerais da AI, seja na modelagem estatística ou na pesquisa em gestão.
Essas questões são transversais a todas as nossas disciplinas e alimentam nossa pesquisa.
Um ecossistema completo que faz a ponte entre a pesquisa fundamental e as aplicações concretas na indústria.

Assuntos
Trabalhamos em diversos temas de doutorado na interseção entre casos de uso industrial e as limitações da tecnologia de ponta.
Para cada tema, trabalhamos em colaboração com professores universitários e temos acesso a data industriais data nos permitem abordar as principais áreas de pesquisa em um determinado cenário do mundo real.
1 — Previsão e definição de preços
Modele as séries temporais como um todo utilizando um modelo de previsão multivariável e controlável. Essa modelagem nos permitirá abordar o planejamento de preços e promoções, identificando os parâmetros ótimos que aumentam a previsão de vendas. Com essa abordagem holística, nosso objetivo é captar a canibalização e a complementaridade entre os produtos. Isso nos permitirá controlar a previsão com a garantia de que as projeções se mantenham consistentes.
2 — Pontuação explicável e controlável
Uma família amplamente utilizada de modelos de aprendizado de máquina baseia-se em árvores de decisão: florestas aleatórias e boosting. Embora sua precisão seja frequentemente de ponta, esses modelos sofrem com a sensação de caixa preta, oferecendo controle limitado ao usuário. Nosso objetivo é aumentar sua explicabilidade e transparência, geralmente melhorando a estimativa dos valores SHAP no caso de conjuntos de dados desequilibrados. Também pretendemos oferecer algumas garantias para esses modelos, por exemplo, para amostras fora do conjunto de treinamento ou permitindo melhores restrições monotônicas.
3 — Otimização do sortimento
O sortimento é um dos principais desafios comerciais para os varejistas, que surge na hora de selecionar o conjunto de produtos a ser vendido nas lojas. Utilizando grandes conjuntos de dados industriais e redes neurais, nosso objetivo é construir modelos mais robustos e interpretáveis, capazes de captar melhor as escolhas dos clientes diante de um sortimento de produtos. Lidar com a canibalização e as complementaridades entre produtos, bem como compreender melhor os segmentos de clientes, é fundamental para encontrar um conjunto mais ideal de produtos para uma loja.
4 — AI nas empresas
O desafio para uma melhor adoção da AI empresas consiste, por um lado, em aprimorar os AI e, por outro, em compreender os aspectos humanos e organizacionais. Na intersecção entre a pesquisa qualitativa em gestão e a pesquisa social, este eixo busca explorar onde as empresas enfrentam dificuldades ao adotar AI . Os modelos existentes sobre adoção de inovações não são inteiramente adequados para inovações em aprendizado de máquina, pois existem diferenças específicas no que diz respeito à regulamentação, à capacitação de pessoas ou a preconceitos quando se trata de AI, e ainda mais no caso AI generativa.
5 — Sustentabilidade Data
O projeto utilizará métodos de pesquisa qualitativos e quantitativos e abordará duas questões centrais: Como as empresas podem medir de forma eficaz o desempenho em sustentabilidade social e ambiental? Por que as medidas de sustentabilidade muitas vezes não conseguem promover mudanças significativas nas práticas organizacionais?
Por um lado, o projeto visa explorar métricas data e identificar indicadores para alinhar os procedimentos organizacionais aos objetivos de sustentabilidade social e ambiental. Por outro lado, o projeto se concentrará em transformar essas medidas de sustentabilidade em ações concretas dentro das empresas.
6 — Preconceito na visão computacional
Quando um modelo faz uma previsão com base em uma imagem, por exemplo, mostrando um rosto, ele tem acesso a informações confidenciais, como etnia, gênero ou idade, que podem influenciar seu raciocínio. Nosso objetivo é desenvolver uma estrutura para medir matematicamente esse viés e propor metodologias para reduzi-lo durante o treinamento do modelo. Além disso, nossa abordagem detectaria estatisticamente áreas de forte viés para explicar, compreender e controlar onde esses modelos reforçam o viés presente nos data.
7 — LLM para recuperação de informações
Uma das principais aplicações dos LLMs ocorre quando eles são combinados com um corpus de documentos, que representam algum conhecimento ou informação do setor. Nesse caso, há uma etapa de recuperação de informações, na qual os LLMs apresentam algumas limitações, como o tamanho do texto de entrada, que é muito pequeno para a indexação de documentos. Da mesma forma, o efeito de alucinação também pode ocorrer na resposta final, o que pretendemos detectar utilizando o documento recuperado e a incerteza do modelo no momento da inferência.
Pesquisadores em regime de meio período Artefact
Além de nossa equipe dedicada à pesquisa, contamos com vários colaboradores que dedicam parte de seu tempo à pesquisa científica e à publicação de artigos. O fato de também atuarem como consultores os inspira a abordar problemas reais enfrentados por nossos clientes.
Publicações
Artigos do blog Medium escritos por nossos especialistas em tecnologia.
O futuro da AI agentiva AI dos grafos de conhecimento?
À medida que as empresas se apressam para implementar AI, a maioria descobre que sua data nunca foi projetada para o raciocínio autônomo. Hoje, até 80% das AI ...
Enriquecendo a experiência do "faça você mesmo": como a ADEO usa AI conectar conteúdo e conhecimento
A otimização do sortimento é um processo fundamental no varejo que envolve a seleção da combinação ideal de produtos para atender à demanda dos consumidores, levando em conta os diversos aspectos logísticos...
MotherDuck explicada: como a solução AI análise de última geração se integra à sua Data
O MotherDuck amplia o desempenho analítico do DuckDB para a cloud recursos colaborativos, oferecendo um desempenho quatro vezes mais rápido que o BigQuery e economia de custos em relação data tradicionais por meio de...
Otimização de sortimento com modelos de escolha discreta em Python
A otimização do sortimento é um processo fundamental no varejo que envolve a seleção da combinação ideal de produtos para atender à demanda dos consumidores, levando em conta os diversos aspectos logísticos...
O alinhamento de preferências é sempre a melhor opção para melhorar a tradução baseada em LLM? Uma análise empírica
As métricas neurais para avaliação da tradução automática (MT) têm ganhado cada vez mais destaque devido à sua correlação superior com os julgamentos humanos, em comparação com as métricas lexicais tradicionais
Choice-Learn: Modelagem de escolha em grande escala para contextos operacionais sob a perspectiva do aprendizado de máquina
Os modelos de escolha discreta têm como objetivo prever as decisões de escolha tomadas por indivíduos a partir de um conjunto de alternativas, denominado “assortimento”. Entre os casos de uso mais conhecidos estão a previsão de...
A era da AI generativa: o que está mudando
A abundância e a diversidade das reações ao ChatGPT e a outras IAs generativas, sejam elas céticas ou entusiásticas, demonstram as mudanças que elas estão provocando e o impacto...
Como Artefact desenvolver um sistema de carreira justo e simples para engenheiros de software
No setor de tecnologia de hoje, dinâmico e em constante evolução, a trajetória profissional pode muitas vezes parecer um caminho sinuoso em meio a uma densa floresta de oportunidades. Com a rápida...
Por que você precisa do LLMOps
Este artigo apresenta o LLMOps, uma área especializada que combina DevOps e MLOps para lidar com os desafios impostos pelos Grandes Modelos de Linguagem (LLMs)...
Explorando o potencial da Linguagem de Expressão LangChain (LCEL): da prova de conceito à produção
Em menos de um ano, o LangChain tornou-se uma das bibliotecas Python mais utilizadas para interagir com LLMs, mas o LangChain era basicamente uma biblioteca...
Como fizemos a reconciliação de IDs de perfil usando o Treasure Data e SQL
Neste artigo, explicamos os desafios da reconciliação de identidades e demonstramos nossa abordagem para criar um perfil de identidade unificado na Data do Cliente, especificamente...
Snowday ’23 da Snowflake: rumo ao sucesso Data
Ao refletirmos sobre as ideias compartilhadas durante o evento “Snowday”, realizado nos dias 1º e 2 de novembro, uma enxurrada de revelações empolgantes sobre o futuro de...




















































