Artefact 研究中心

弥合学术界与产业应用之间的间隙

class="lazyload
class="lazyload

研究更具透明度和伦理性的模式,以促进人工智能在商业领域的应用。

ARTEFACT 研究中心

人工智能偏见的例子

  • AppleCard根据种族主义标准发放抵押贷款
  • Lensa AI让女性自拍变得性感
  • Facebook 根据种族主义进行图片分类,将非洲裔美国人识别为猴子
  • 微软推特聊天机器人变得纳粹、性别歧视和咄咄逼人
  • ChatGPT编写的代码声称优秀的科学家是白人男性

当前的挑战

AI在许多用例中都是准确并且易于部署的,但由于黑盒子和道德问题,仍然很难完全掌控。

Artefact 研究中心的使命

一个完整的生态系统,弥合了
基础研究与实际工业应用之间的鸿沟。

Artefact ”的使命。
埃马纽埃尔·马勒贝

埃马纽埃尔·马勒贝

研究负责人

研究领域:深度学习、机器学习

从攻读适用于电子招聘的自然语言处理(NLP)模型的博士学位开始,Emmanuel一直在纯粹的研究和有影响力的应用之间寻求有效的平衡。他的研究经验包括为华为公司提供5G时间序列预测,以及为欧莱雅的美发和化妆客户提供计算机视觉模型。加入Artefact之前,他曾在上海担任欧莱雅亚洲AI研究负责人。目前,他在Artefact的职位提供了一个绝佳的机会和的环境,来弥合学术界和行业之间的差距,在影响行业应用的同时促进他的现实研究。

阅读我们最新的Artefact 研究中心”新闻

横向研究领域

凭借我们独特的定位,我们致力于解决人工智能领域面临的普遍挑战,无论是统计建模还是管理研究。
这些问题贯穿于我们所有研究领域,并为我们的研究提供动力。

控制与问责

Control &
问责制

  • 可控模型,可保证预测结果
  • 与需求规划人员对接
  • 分类管理者
  • 根据最佳模型输入做出决策:即使在无训练集情况下,也能实现可靠的预测
  • 例如:确保输入变量的单调性
可解释性和透明度

可解释性
& 透明度

  • 预测的解释
  • 面向非技术用户的界面和可视化
  • 根据行业调整模型模块和组件
  • 在特征工程之前,对可理解的输入进行可视化处理
偏见与不确定性

偏差与
不确定性

  • 丰富预测内容,做出更好的决策
  • 客户需要的非对称不确定性(与高斯不确定性相比
  • 适用于时间序列和分类优化
人工智能在商业应用中的障碍与推动因素

人工智能在商业应用中的障碍与推动因素

  • 组织的研究
  • 顶尖CAC 40指数的利益相关者和决策者访谈
  • AI伦理、公平性和可解释性的影响
  • AI应用的治理、标准和法规

以一个完整的生态系统,在基础研究和实际行业应用之间架起桥梁

以一个完整的生态系统,在基础研究和实际行业应用之间架起桥梁

科目

我们致力于多个博士研究课题,这些课题处于工业应用场景与当前技术前沿的交汇点。
针对每个研究方向,我们均与大学教授开展合作,并能获取工业数据,这使我们能够在特定的实际应用场景中攻克主要的研究难题。

1 — 预测与定价

用可控的多元预测模型对时间序列进行整体建模。通过这种建模,我们可以找到提高销售预测的最佳参数,从而解决定价和促销规划问题。通过这种整体方法,我们的目标是捕捉产品之间的兼并和互补。这将使我们能够控制预测,并保证预测保持一致。

穆罕默德·查蒂巴

穆罕默德·查蒂巴

研究科学家
预测与定价

Artefact
巴黎第一大学(潘提翁-索邦大学)

研究领域
-
深度学习、优化、统计

让-马克·巴代

让-马克·巴代

教授

SAMM实验室

巴黎第一大学(潘提翁-索邦大学)

研究领域
-
随机过程、统计学、概率论

约瑟夫·林基维奇

约瑟夫·林基维奇

副教授

SAMM实验室

巴黎第一大学(潘提翁-索邦大学)

研究领域
-
时间序列、神经网络、统计学

2 — 可解释且可控的评分

广泛使用的机器学习模型系列以决策树为基础:随机森林算法和提升方法。虽然这些模型的准确性往往达到了最先进的水平,但它们却给人一种黑盒子的感觉,用户在其中的控制能力有限。我们的目标是提高这些模型的可解释性和透明度,特别是在不平衡数据集的情况下改进 SHAP 值的估算。我们还致力于为此类模型提供一些保证,例如,针对训练外样本或通过更好地实现单调性约束。

阿卜杜拉耶·萨科

阿卜杜拉耶·萨科

研究科学家
基于决策树的模型

Artefact
索邦大学

研究领域
-
统计学、可解释的AI

埃尔万·斯科内特

埃尔万·斯科内特

教授

LPSM 实验室

索邦大学

研究领域
-
随机森林算法、可解释性、缺失值

3 — 产品组合优化

商品组合是零售商在选择店内销售商品时面临的一个主要商业问题。利用大型行业数据集和神经网络,我们的目标是建立更稳健、更可解释的模型,以更好地捕捉顾客在面对各种产品时的选择。处理产品之间的兼并和互补问题,以及更好地了解客户集群,是在商店中找到更优化的产品组合的关键。

文森特·奥里奥

文森特·奥里奥

研究科学家
分类组合优化

Artefact
苏佩莱克学院
巴黎萨克雷大学

研究领域
-
深度学习、
运筹学

文森特·穆索

文森特·穆索

教授

MICS 实验室

苏佩莱克学院
巴黎萨克雷大学

研究领域
-
偏好学习、多标准决策分析、
运筹学

安托万·德西尔

安托万·德西尔

副教授

TOM 实验室

INSEAD

研究领域
-
选择建模、分类优化、运筹学

阿里·奥瓦德

阿里·奥瓦德

助理教授

管理科学与运营

伦敦商学院

研究领域
-
动态匹配、选择建模、分类和库存优化、近似算法、运筹学

4 — 企业中人工智能的应用

在企业更好地采用AI面临的挑战一方面是改进AI模型,另一方面是了解人和组织方面的问题。在定性管理研究和社会研究的交叉轴心上,我们试图探索企业在采用AI工具时面临的困难。现有的创新采用框架并不完全适用于机器学习创新,因为在AI方面存在监管、人员培训或偏见等典型差异,尤其是在Gen AI方面。

拉拉·阿卜杜勒·哈利姆

拉拉·阿卜杜勒·哈利姆

研究科学家
AI在商业中的应用

Artefact
巴黎综合理工学院

研究领域
-
管理研究、创新

塞西尔·沙马雷

塞西尔·沙马雷

教授

CRG 实验室

巴黎综合理工学院

研究领域
-
创新、市场营销、定性社会研究

5 — 数据驱动的可持续发展

该项目将采用定性和定量研究方法,解决两个关键问题: 公司如何有效衡量社会和环境可持续性绩效?为什么可持续性措施常常未能给组织实践带来重大变化?

一方面,该项目旨在探索数据驱动的衡量标准,并确定指标,使组织程序与社会和环境可持续发展目标保持一致。另一方面,该项目将侧重于把这些可持续发展措施转化为公司内部的具体行动。

瓦利德·莫坎塔尔

瓦利德·莫坎塔尔

研究科学家
可持续方向

Artefact
ESCP商学院

研究领域
-
管理研究、经济学

戈尔吉·克尔列夫

戈尔吉·克尔列夫

副教授

可持续发展部门

ESCP商学院

研究领域
-
可持续性、社会创新、
组织理论

6 — 计算机视觉中的偏见

当模型根据图像(例如显示人脸的图像)进行预测时,它可以获取敏感信息,例如种族、性别或年龄,这些信息可能会使其推理产生偏差。我们的目标是开发一个框架来从数学角度衡量这种偏差,并提出在模型训练过程中减少这种偏差的方法。此外,我们的方法将从统计学角度检测出强烈偏差的区域,以解释、理解和控制此类模型在哪些方面强化了数据中存在的偏差。

维罗妮卡·希洛娃

维罗妮卡·希洛娃

研究科学家
计算机视觉偏差

Artefact
图卢兹第三大学

研究领域
-
深度学习、
计算机视觉、偏差

洛朗·里塞尔

洛朗·里塞尔

CNRS 研究工程师

Toulouse 数学研究所

图卢兹第三大学
法国国家科学研究中心

研究领域
-
可解释机器学习、图像分析、可解释和稳健AI

让-米歇尔·卢贝斯

让-米歇尔·卢贝斯

教授

Toulouse 数学研究所

图卢兹第三大学
ANITI

研究领域
-
无偏学习、可解释人工智能、最优传输及统计学应用、机器学习

7 — 信息检索领域的法律硕士(LLM)

大型语言模型(LLMs)的一个主要应用是与一组文档语料库配对,这些文档代表着一些工业知识或信息。在这种情况下,存在一个信息检索步骤,LLMs在其中显示出一些限制,比如输入文本的大小对于文档索引来说太小。同样,在最终答案中也可能出现“幻觉效应”,我们的目标是利用检索到的文档和推断时的模型不确定性来检测这种效应。

伊波利特·吉塞罗-布克莱夫

伊波利特·吉塞罗-布克莱夫

研究科学家
面向信息检索的大型语言模型

Artefact
苏佩莱克学院
巴黎萨克雷大学

研究领域
-
深度学习、自然语言处理

皮埃尔·科隆博

皮埃尔·科隆博

副教授

MICS 实验室

苏佩莱克学院
巴黎萨克雷大学

研究领域
-
大型语言模型、人工智能中的偏差、模型评估

塞琳·于德洛

塞琳·于德洛

教授

MICS 实验室

苏佩莱克学院
巴黎萨克雷大学

研究领域
-
知识表示、语义解释、神经网络

Artefact兼职研究员

除了专门从事研究的团队,我们还有几位合作者,他们花了一些时间从事科学研究并发表论文。通过顾问工作,他们也能从客户遇到的实际问题中得到启发。

伊波利特·吉塞罗-布克莱夫

迈克尔·沃尔斯克

自2022年5月以来,我一直是德国Artefact公司数据科学与工程团队的负责人,在这里,我将自己的计算机科学学术背景(拥有机器学习和信息检索方面的博士学位)应用于解决Artefact公司客户的业务问题。我的工作不仅包括领导团队,还包括激励团队将前沿的AI研究与实际应用相结合。我热衷于将复杂的AI概念变得通俗易懂,并努力利用技术实现创新的业务解决方案和有意义的社会影响。

Artefact

研究领域

大型语言模型在信息检索与自然语言处理中的应用

机器学习、检索与排序中的可解释模型

面向复杂、任务导向型信息需求的检索

伊波利特·吉塞罗-布克莱夫

埃文·赫维茨

埃文拥有人工智能工程博士学位,在攻读期间,他运用人工智能技术,结合多种交易策略,对主动管理型投资组合进行了优化。他在学术界从事过研究工作,并合著了《人工智能与经济理论:市场中的天网》一书。 此后,他转而为标普普氏(S&P Platts)开发基于强化学习的绿色能源解决方案,随后加入Preqin,负责处理和分析另类投资数据。他Artefact 服务于零售、网络安全、SaaS、工程、教育及房地产等多个行业,客户范围涵盖中小企业直至富时100指数(FTSE100)成分股公司。

Artefact

研究领域

强化学习

机器学习

金融与游戏

伊波利特·吉塞罗-布克莱夫

乔治·塞沃拉

乔治因在动物学习数学建模方面的研究成果,获得了剑桥大学理论神经科学博士学位。 乔治在深度学习领域拥有10年的研究经验,目前正将其应用于工业实践。自离开学术界以来,乔治涉足了从喷气发动机到抗生素耐药性等广泛的行业和问题领域。他还曾从事国家安全领域的工作数年,致力于开发一款产品,以应对因人工智能不当使用而导致的歧视问题。了解更多信息请访问 www.cevora.xyz

Artefact

研究领域

神经科学

深度学习

机器学习

伊波利特·吉塞罗-布克莱夫

萨维奥·罗扎里奥

萨维奥拥有伦敦帝国理工学院实验激光等离子体物理学博士学位,在攻读期间,他运用机器学习方法优化了高度非线性等离子体加速器系统的实验配置。 他曾在安永(EY)税务研发部门任职,利用大型语言模型开发了适用于多地区合规监控的机器学习解决方案。他Artefact 加入Artefact ,为富时250指数(FTSE250)企业提供了涵盖零售、交通和房地产等多个行业的端到端数据科学解决方案。

Artefact

研究领域

机器学习

非线性优化

物理学

伊波利特·吉塞罗-布克莱夫

尼尔森·皮斯

尼尔森职业生涯的前十年主要活跃于股票和商品市场,期间他在场外交易市场运用量化交易策略。2021年获得数据科学理学硕士学位后,他Artefact英国办事处担任数据科学家,负责处理多个领域的数据科学问题,尤其擅长金融市场和交易领域的人工智能应用。

Artefact

出版物

我们技术专家撰写的Medium博客文章。

代理式人工智能的未来将依赖于知识图谱吗?

随着企业争相将人工智能投入实际应用,大多数企业发现,其数据基础设施原本并非为自主推理而设计。如今,多达80%的人工智能实施项目……

丰富DIY体验:ADEO如何利用人工智能将内容与知识相连接

商品组合优化是零售业中的一个关键环节,它涉及精心策划最理想的产品组合,以满足消费者需求,同时还要考虑诸多物流因素……

MotherDuck 详解:这款生成式人工智能 分析解决方案如何融入您的数据架构

MotherDuck 将 DuckDB 的分析性能cloud 协作功能,其性能比 BigQuery 快 4 倍,且通过……相比传统数据仓库能节省成本……

使用 Python 中的离散选择模型进行产品组合优化

商品组合优化是零售业中的一个关键环节,它涉及精心策划最理想的产品组合,以满足消费者需求,同时还要考虑诸多物流因素……

“偏好对齐”是否总是提升基于大型语言模型的翻译质量的最佳选择?一项实证分析

由于与人类评判相比,神经网络指标与机器翻译(MT)评估结果的相关性更高,因此这类指标的重要性日益凸显

Choice-Learn:基于机器学习视角的大规模选择建模及其在运营场景中的应用

离散选择模型旨在预测个人从一系列备选方案(称为“组合”)中做出的选择决策。其著名的应用案例包括预测……

生成式人工智能时代:正在发生的变化

针对ChatGPT及其他生成式人工智能的反应既丰富又多样,无论持怀疑态度还是热情洋溢,都彰显了它们所带来的变革及其影响……

Artefact 是如何为软件工程师Artefact 一个既公平又简单的职业发展体系的

在当今充满活力且日新月异的科技行业中,职业发展之路往往如同在机遇的密林中蜿蜒前行。随着快速……

为什么需要大型语言模型操作 (LLMOps)

本文介绍了 LLMOps,这是一个融合了 DevOps 和 MLOps 的专门分支,旨在应对大型语言模型(LLMs)带来的挑战……

释放 LangChain 表达式语言(LCEL)的强大功能:从概念验证到生产环境

在不到一年的时间里,LangChain 已成为与大型语言模型(LLM)交互最常用的 Python 库之一,但 LangChain 主要是一个库……

我们如何使用Treasure Data Unification和SQL处理配置文件命名的统一问题

在本文中,我们将阐述身份信息核对面临的挑战,并展示我们在客户数据平台(CDP)中创建统一用户ID的方法,具体而言……

Snowflake的 Snowday'23:滚雪球般地取得数据科学的成功

当我们回顾11月1日至2日“Snowday”活动期间分享的见解时,关于……未来的诸多令人振奋的发现接踵而至……