Artefact 研究中心
弥合学术界与产业应用之间的间隙

研究更具透明度和伦理性的模式,以促进人工智能在商业领域的应用。

人工智能偏见的例子
- AppleCard根据种族主义标准发放抵押贷款
- Lensa AI让女性自拍变得性感
- Facebook 根据种族主义进行图片分类,将非洲裔美国人识别为猴子
- 微软推特聊天机器人变得纳粹、性别歧视和咄咄逼人
- ChatGPT编写的代码声称优秀的科学家是白人男性
当前的挑战
AI在许多用例中都是准确并且易于部署的,但由于黑盒子和道德问题,仍然很难完全掌控。
Artefact 研究中心的使命
一个完整的生态系统,弥合了
基础研究与实际工业应用之间的鸿沟。


埃马纽埃尔·马勒贝
研究负责人
研究领域:深度学习、机器学习
从攻读适用于电子招聘的自然语言处理(NLP)模型的博士学位开始,Emmanuel一直在纯粹的研究和有影响力的应用之间寻求有效的平衡。他的研究经验包括为华为公司提供5G时间序列预测,以及为欧莱雅的美发和化妆客户提供计算机视觉模型。加入Artefact之前,他曾在上海担任欧莱雅亚洲AI研究负责人。目前,他在Artefact的职位提供了一个绝佳的机会和的环境,来弥合学术界和行业之间的差距,在影响行业应用的同时促进他的现实研究。
阅读我们最新的Artefact 研究中心”新闻
横向研究领域
凭借我们独特的定位,我们致力于解决人工智能领域面临的普遍挑战,无论是统计建模还是管理研究。
这些问题贯穿于我们所有研究领域,并为我们的研究提供动力。
以一个完整的生态系统,在基础研究和实际行业应用之间架起桥梁

科目
我们致力于多个博士研究课题,这些课题处于工业应用场景与当前技术前沿的交汇点。
针对每个研究方向,我们均与大学教授开展合作,并能获取工业数据,这使我们能够在特定的实际应用场景中攻克主要的研究难题。
1 — 预测与定价
用可控的多元预测模型对时间序列进行整体建模。通过这种建模,我们可以找到提高销售预测的最佳参数,从而解决定价和促销规划问题。通过这种整体方法,我们的目标是捕捉产品之间的兼并和互补。这将使我们能够控制预测,并保证预测保持一致。
2 — 可解释且可控的评分
广泛使用的机器学习模型系列以决策树为基础:随机森林算法和提升方法。虽然这些模型的准确性往往达到了最先进的水平,但它们却给人一种黑盒子的感觉,用户在其中的控制能力有限。我们的目标是提高这些模型的可解释性和透明度,特别是在不平衡数据集的情况下改进 SHAP 值的估算。我们还致力于为此类模型提供一些保证,例如,针对训练外样本或通过更好地实现单调性约束。
3 — 产品组合优化
商品组合是零售商在选择店内销售商品时面临的一个主要商业问题。利用大型行业数据集和神经网络,我们的目标是建立更稳健、更可解释的模型,以更好地捕捉顾客在面对各种产品时的选择。处理产品之间的兼并和互补问题,以及更好地了解客户集群,是在商店中找到更优化的产品组合的关键。
4 — 企业中人工智能的应用
在企业更好地采用AI面临的挑战一方面是改进AI模型,另一方面是了解人和组织方面的问题。在定性管理研究和社会研究的交叉轴心上,我们试图探索企业在采用AI工具时面临的困难。现有的创新采用框架并不完全适用于机器学习创新,因为在AI方面存在监管、人员培训或偏见等典型差异,尤其是在Gen AI方面。
5 — 数据驱动的可持续发展
该项目将采用定性和定量研究方法,解决两个关键问题: 公司如何有效衡量社会和环境可持续性绩效?为什么可持续性措施常常未能给组织实践带来重大变化?
一方面,该项目旨在探索数据驱动的衡量标准,并确定指标,使组织程序与社会和环境可持续发展目标保持一致。另一方面,该项目将侧重于把这些可持续发展措施转化为公司内部的具体行动。
6 — 计算机视觉中的偏见
当模型根据图像(例如显示人脸的图像)进行预测时,它可以获取敏感信息,例如种族、性别或年龄,这些信息可能会使其推理产生偏差。我们的目标是开发一个框架来从数学角度衡量这种偏差,并提出在模型训练过程中减少这种偏差的方法。此外,我们的方法将从统计学角度检测出强烈偏差的区域,以解释、理解和控制此类模型在哪些方面强化了数据中存在的偏差。
7 — 信息检索领域的法律硕士(LLM)
大型语言模型(LLMs)的一个主要应用是与一组文档语料库配对,这些文档代表着一些工业知识或信息。在这种情况下,存在一个信息检索步骤,LLMs在其中显示出一些限制,比如输入文本的大小对于文档索引来说太小。同样,在最终答案中也可能出现“幻觉效应”,我们的目标是利用检索到的文档和推断时的模型不确定性来检测这种效应。
Artefact兼职研究员
除了专门从事研究的团队,我们还有几位合作者,他们花了一些时间从事科学研究并发表论文。通过顾问工作,他们也能从客户遇到的实际问题中得到启发。
出版物
我们技术专家撰写的Medium博客文章。
代理式人工智能的未来将依赖于知识图谱吗?
随着企业争相将人工智能投入实际应用,大多数企业发现,其数据基础设施原本并非为自主推理而设计。如今,多达80%的人工智能实施项目……
丰富DIY体验:ADEO如何利用人工智能将内容与知识相连接
商品组合优化是零售业中的一个关键环节,它涉及精心策划最理想的产品组合,以满足消费者需求,同时还要考虑诸多物流因素……
MotherDuck 详解:这款生成式人工智能 分析解决方案如何融入您的数据架构
MotherDuck 将 DuckDB 的分析性能cloud 协作功能,其性能比 BigQuery 快 4 倍,且通过……相比传统数据仓库能节省成本……
使用 Python 中的离散选择模型进行产品组合优化
商品组合优化是零售业中的一个关键环节,它涉及精心策划最理想的产品组合,以满足消费者需求,同时还要考虑诸多物流因素……
“偏好对齐”是否总是提升基于大型语言模型的翻译质量的最佳选择?一项实证分析
由于与人类评判相比,神经网络指标与机器翻译(MT)评估结果的相关性更高,因此这类指标的重要性日益凸显
Choice-Learn:基于机器学习视角的大规模选择建模及其在运营场景中的应用
离散选择模型旨在预测个人从一系列备选方案(称为“组合”)中做出的选择决策。其著名的应用案例包括预测……
生成式人工智能时代:正在发生的变化
针对ChatGPT及其他生成式人工智能的反应既丰富又多样,无论持怀疑态度还是热情洋溢,都彰显了它们所带来的变革及其影响……
Artefact 是如何为软件工程师Artefact 一个既公平又简单的职业发展体系的
在当今充满活力且日新月异的科技行业中,职业发展之路往往如同在机遇的密林中蜿蜒前行。随着快速……
为什么需要大型语言模型操作 (LLMOps)
本文介绍了 LLMOps,这是一个融合了 DevOps 和 MLOps 的专门分支,旨在应对大型语言模型(LLMs)带来的挑战……
释放 LangChain 表达式语言(LCEL)的强大功能:从概念验证到生产环境
在不到一年的时间里,LangChain 已成为与大型语言模型(LLM)交互最常用的 Python 库之一,但 LangChain 主要是一个库……
我们如何使用Treasure Data Unification和SQL处理配置文件命名的统一问题
在本文中,我们将阐述身份信息核对面临的挑战,并展示我们在客户数据平台(CDP)中创建统一用户ID的方法,具体而言……
Snowflake的 Snowday'23:滚雪球般地取得数据科学的成功
当我们回顾11月1日至2日“Snowday”活动期间分享的见解时,关于……未来的诸多令人振奋的发现接踵而至……




















































