Artefact Centro di ricerca
Colmare il divario tra le applicazioni accademiche e quelle industriali.
Ricerca di modelli più trasparenti ed etici per favorire l'adozione dell'IA da parte delle imprese.
Esempi di pregiudizi dell'IA
- AppleCard concede mutui in base a criteri razzisti
- Lensa AI sessualizza i selfie delle donne
- Classificazione razzista delle immagini di Facebook con afroamericani come scimmie
- Il chatbot di Microsoft per Twitter diventa nazista, sessista e aggressivo
- ChatGPT che scrive un codice che afferma che i bravi scienziati sono maschi bianchi
Sfida attuale
I modelli di intelligenza artificiale sono accurati e facili da implementare in molti casi d'uso, ma rimangono incontrollabili a causa delle scatole nere e delle questioni etiche.
La missione del Centro di ricerca Artefact .
Un ecosistema completo che colma il divario tra la
ricerca fondamentale e le applicazioni industriali tangibili.
Emmanuel MALHERBE
Responsabile della ricerca
Campo di ricerca: Apprendimento profondo, apprendimento automatico
A partire da un dottorato di ricerca sui modelli NLP adattati all'e-recruitment, Emmanuel ha sempre cercato un equilibrio efficiente tra ricerca pura e applicazioni d'impatto. La sua esperienza di ricerca comprende la previsione di serie temporali 5G per Huawei Technologies e modelli di computer vision per clienti di parrucchieri e truccatori presso l'Oréal. Prima di entrare in Artefact, ha lavorato a Shanghai come responsabile della ricerca sull'intelligenza artificiale per L'Oréal Asia. Oggi, la sua posizione presso Artefact rappresenta un'opportunità perfetta e un ambiente ideale per colmare il divario tra il mondo accademico e l'industria e per promuovere la sua ricerca nel mondo reale con un impatto sulle applicazioni industriali.
Un ecosistema completo che colma il divario tra la ricerca fondamentale e le applicazioni tangibili dell'industria.
Campi di ricerca trasversali
Con il nostro posizionamento unico, miriamo ad affrontare le sfide generali dell'IA, che si tratti di modellizzazione statistica o di ricerca gestionale.
Queste domande sono trasversali a tutte le nostre materie e alimentano la nostra ricerca.
Soggetti
Lavoriamo su diversi argomenti di dottorato all'intersezione tra i casi d'uso industriali e i limiti dello stato dell'arte.
Per ogni argomento, lavoriamo in collaborazione con professori universitari e abbiamo accesso a dati industriali che ci permettono di affrontare le principali aree di ricerca in un determinato scenario reale.
1 - Previsioni e prezzi
Modellare le serie temporali nel loro complesso con un modello di previsione multivariato e controllabile. Tale modellazione ci permetterà di affrontare la pianificazione dei prezzi e delle promozioni trovando i parametri ottimali che aumentano le previsioni di vendita. Con questo approccio olistico, miriamo a cogliere la cannibalizzazione e la complementarità tra i prodotti. Questo ci permetterà di controllare le previsioni con la garanzia che le previsioni siano coerenti.
2 - Punteggio spiegabile e controllabile
Una famiglia ampiamente utilizzata di modelli di apprendimento automatico si basa sugli alberi decisionali: foreste casuali, boosting. Sebbene la loro accuratezza sia spesso allo stato dell'arte, questi modelli soffrono di una sensazione di black-box, dando un controllo limitato all'utente. Il nostro obiettivo è aumentare la loro spiegabilità e trasparenza, in particolare migliorando la stima dei valori SHAP nel caso di insiemi di dati non bilanciati. Vogliamo anche fornire alcune garanzie per tali modelli, ad esempio per i campioni fuori allenamento o consentendo migliori vincoli monotonici.
3 - Ottimizzazione dell'assortimento
L'assortimento è un problema commerciale importante per i rivenditori che si presenta quando si seleziona l'insieme di prodotti da vendere nei negozi. Utilizzando grandi insiemi di dati industriali e reti neurali, ci proponiamo di costruire modelli più robusti e interpretabili che catturino meglio le scelte dei clienti di fronte a un assortimento di prodotti. La gestione della cannibalizzazione e delle complementarietà tra i prodotti, così come una migliore comprensione dei cluster di clienti, sono fondamentali per trovare un insieme di prodotti più ottimale in un negozio.
4 - Adozione dell'IA nelle aziende
La sfida di una migliore adozione dell'IA nelle aziende consiste nel migliorare i modelli di IA da un lato e nel comprendere gli aspetti umani e organizzativi dall'altro. All'incrocio tra la ricerca qualitativa sulla gestione e la ricerca sociale, questo asse cerca di esplorare i punti in cui le aziende incontrano difficoltà nell'adozione degli strumenti di IA. I quadri di riferimento esistenti sull'adozione dell'innovazione non sono del tutto adatti alle innovazioni dell'apprendimento automatico, poiché esistono differenze tipiche in materia di regolamentazione, formazione delle persone o pregiudizi quando si tratta di IA, e ancor più di IA generativa.
5 - Sostenibilità guidata dai dati
Il progetto si avvarrà di metodi di ricerca qualitativi e quantitativi e affronterà due domande chiave: Come possono le aziende misurare efficacemente le performance di sostenibilità sociale e ambientale? Perché le misure di sostenibilità spesso non riescono a produrre cambiamenti significativi nelle pratiche organizzative?
Da un lato, il progetto mira a esplorare metriche basate sui dati e a identificare indicatori per allineare le procedure organizzative agli obiettivi di sostenibilità sociale e ambientale. Dall'altro, il progetto si concentrerà sulla trasformazione di queste misure di sostenibilità in azioni concrete all'interno delle aziende.
6 - Bias nella visione artificiale
Quando un modello fa una previsione basata su un'immagine, ad esempio quella di un volto, ha accesso a informazioni sensibili, come l'etnia, il sesso o l'età, che possono influenzare il suo ragionamento. Il nostro obiettivo è sviluppare una struttura per misurare matematicamente tali distorsioni e proporre metodologie per ridurle durante l'addestramento del modello. Inoltre, il nostro approccio individuerebbe statisticamente le zone di forte distorsione per spiegare, comprendere e controllare dove tali modelli rafforzano la distorsione presente nei dati.
7 - LLM per il reperimento di informazioni
Una delle principali applicazioni dei LLM è quando vengono accoppiati con un corpus di documenti, che rappresentano alcune conoscenze o informazioni industriali. In questo caso, c'è una fase di recupero delle informazioni, per la quale gli LLM mostrano alcuni limiti, come la dimensione del testo in ingresso, che è troppo piccola per indicizzare i documenti. Allo stesso modo, l'effetto allucinazione può verificarsi anche nella risposta finale, che vogliamo rilevare utilizzando il documento recuperato e l'incertezza del modello al momento dell'inferenza.
Artefactricercatori part-time
Oltre al nostro team dedicato alla ricerca, abbiamo diversi collaboratori che dedicano tempo alla ricerca scientifica e alla pubblicazione di articoli. Lavorando anche come consulenti, si ispirano ai problemi del mondo reale incontrati dai nostri clienti.
Pubblicazioni
Articoli del blog Medium dei nostri esperti di tecnologia.
L'era dell'IA generativa: cosa sta cambiando
L'abbondanza e la diversità delle risposte a ChatGPT e ad altre IA generative, sia scettiche che entusiaste, dimostrano i cambiamenti che stanno portando e l'impatto...
Come Artefact è riuscito a sviluppare un sistema di carriera equo e semplice per gli ingegneri informatici
Nell'industria tecnologica di oggi, dinamica e in continua evoluzione, una carriera può spesso sembrare un percorso tortuoso attraverso una fitta foresta di opportunità. Con la rapida...
Perché avete bisogno di LLMOps
Questo articolo presenta LLMOps, un ramo specializzato che fonde DevOps e MLOps per gestire le sfide poste dai Large Language Models (LLM)...
Liberare la potenza di LangChain Expression Language (LCEL): dalla prova di concetto alla produzione
LangChain è diventata una delle librerie Python più utilizzate per interagire con gli LLM in meno di un anno, ma LangChain era soprattutto una libreria...
Come abbiamo gestito la riconciliazione dell'ID del profilo utilizzando Treasure Data Unification e SQL
In questo articolo spieghiamo le sfide della riconciliazione degli ID e dimostriamo il nostro approccio per creare un ID profilo unificato in Customer Data Platform, in particolare...
Snowflake's Snowday '23: il successo della scienza dei dati a palla di neve
Mentre riflettiamo sulle intuizioni condivise durante l'evento "Snowday" dell'1 e 2 novembre, una cascata di interessanti rivelazioni sul futuro...