ARTEFACT 研究中心
Artefact 研究中心:架起学术领域与行业应用之间的桥梁。
研究更可控、更透明、更合乎道德的模式促进未来的AI商业应用。
商业现状
近年来,AI在企业中的应用停滞不前。为了说明这一点,以下是受访者中表示其组织已在至少一种角色中采用AI的比例(以百分比表示)。
来源:麦肯锡2022年AI现状报告
不可信的AI例子
- AppleCard根据种族主义标准发放抵押贷款
- Lensa AI让女性自拍变得性感
- Facebook 根据种族主义进行图片分类,将非洲裔美国人识别为猴子
- 微软推特聊天机器人变得纳粹、性别歧视和咄咄逼人
- ChatGPT编写的代码声称优秀的科学家是白人男性
当前的挑战
AI在许多用例中都是准确并且易于部署的,但由于黑盒子和道德问题,仍然很难完全掌控。
Artefact 研究中心的使命。
以一个完整的生态系统,在基础研究和实际行业应用之间架起桥梁。
Emmanuel MALHERBE
研究负责人
研究领域:深度学习、机器学习
从攻读适用于电子招聘的自然语言处理(NLP)模型的博士学位开始,Emmanuel一直在纯粹的研究和有影响力的应用之间寻求有效的平衡。他的研究经验包括为华为公司提供5G时间序列预测,以及为欧莱雅的美发和化妆客户提供计算机视觉模型。加入Artefact之前,他曾在上海担任欧莱雅亚洲AI研究负责人。今天,他在Artefact的职位是一个理想的机会和的环境,可以弥合学术界和行业之间的差距,在影响行业应用的同时促进他的现实世界研究。
以一个完整的生态系统,在基础研究和实际行业应用之间架起桥梁。
横向研究领域。
凭借我们独特的定位,我们的目标是解决AI的普遍挑战,无论是统计建模还是管理研究。这些问题贯穿于我们的所有主题,也促进了我们的研究。
主题方向
我们研究的几个博士课题涉及行业用例和最前沿限制的交叉领域。对每个课题,我们都与大学教授合作,并能获得行业数据,从而在特定的现实世界场景中解决主要研究领域的问题。
1 - 预测与定价
用可控的多元预测模型对时间序列进行整体建模。通过这种建模,我们可以找到提高销售预测的最佳参数,从而解决定价和促销规划问题。通过这种整体方法,我们的目标是捕捉产品之间的兼并和互补。这将使我们能够控制预测,并保证预测保持一致。
2 - 可解释和可控制的评分
广泛使用的机器学习模型系列以决策树为基础:随机森林算法和提升方法。虽然这些模型的准确性往往达到了最先进的水平,但它们却给人一种黑盒子的感觉,用户在其中的控制能力有限。我们的目标是提高这些模型的可解释性和透明度,特别是在不平衡数据集的情况下改进 SHAP 值的估算。我们还致力于为此类模型提供一些保证,例如,针对训练外样本或通过更好地实现单调性约束。
3 - 分类组合优化
商品组合是零售商在选择店内销售商品时面临的一个主要商业问题。利用大型行业数据集和神经网络,我们的目标是建立更稳健、更可解释的模型,以更好地捕捉顾客在面对各种产品时的选择。处理产品之间的兼并和互补问题,以及更好地了解客户集群,是在商店中找到更优化的产品组合的关键。
4 - AI在商业中的应用
在企业更好地采用AI面临的挑战一方面是改进AI模型,另一方面是了解人和组织方面的问题。在定性管理研究和社会研究的交叉轴心上,我们试图探索企业在采用AI工具时面临的困难。现有的创新采用框架并不完全适用于机器学习创新,因为在AI方面存在监管、人员培训或偏见等典型差异,尤其是在Gen AI方面。
5 - 数据驱动的可持续性。
The project will mobilize qualitative and quantitative research methods and address two key questions: How can companies effectively measure social and environmental sustainability performance? Why do sustainability measures often fail to bring about significant changes in organizational practices?
On the one hand, the project aims to explore data-driven metrics and identify indicators to align organizational procedures with social and environmental sustainability objectives. On the other hand, the project will focus on transforming these sustainability measures into concrete actions within companies
6 - 计算机视觉偏差
当模型根据图像(例如显示人脸的图像)进行预测时,它可以获取敏感信息,例如种族、性别或年龄,这些信息可能会使其推理产生偏差。我们的目标是开发一个框架来从数学角度衡量这种偏差,并提出在模型训练过程中减少这种偏差的方法。此外,我们的方法将从统计学角度检测出强烈偏差的区域,以解释、理解和控制此类模型在哪些方面强化了数据中存在的偏差。
7 - 用于信息检索的大型语言模型(LLM)
大型语言模型(LLMs)的一个主要应用是与一组文档语料库配对,这些文档代表着一些工业知识或信息。在这种情况下,存在一个信息检索步骤,LLMs在其中显示出一些限制,比如输入文本的大小对于文档索引来说太小。同样,在最终答案中也可能出现“幻觉效应”,我们的目标是利用检索到的文档和推断时的模型不确定性来检测这种效应。
Artefact的兼任研究人员。
除了专门从事研究的团队,我们还有几位合作者,他们花了一些时间从事科学研究并发表论文。通过顾问工作,他们也能从客户遇到的实际问题中得到启发。