Trustworthy AI: new challenges and data-driven solutions

阅读法文版文章

与 artificial intelligence 大规模使用相关的风险主要在于人类偏见和成见的再现。要创造符合道德规范的人工智能，开发人员必须从技术、法律和人文角度出发，通过设计创造出data-driven、值得信赖的人工智能解决方案。.

科幻小说中充斥着叛逆人工智能的故事，在这些故事中，机器按照自己邪恶的价值体系行事。还记得《太空漫游》中的 HAL 9000 或《终结者》中的天网吗？但在现实生活中，人工智能系统和算法已经广泛融入到网上购物、申请贷款或咨询社交网络等日常活动中。虽然人工智能背信弃义的案例仍然是作家们的幻想，但人工智能的漂移和故障已经司空见惯，而且往往会产生非常真实的后果。.

用道德与陈规定型观念作斗争

我们都见过人工智能生成的图像，比如 Dall-E 2。创建一张泰迪熊在水下听音乐的图片是一件天真的趣事。但你知道吗？算法在医生、飞行员和首席执行官的形象中，男性的比例过高，而在护士、空姐和秘书的形象中，women 的比例过高，这种做法是否会延续性别陈规定型观念？

鉴于大量日常决策都交由人工智能处理，我们不能忽视使用人工智能所引发的伦理问题。人工智能仍然是一个市场，也是一项立法尚不完善的技术（尽管欧盟委员会正在积极制定未来的法规）。因此，保护用户是每个人的责任。.

人工智能面临的挑战是创建值得信赖的系统 按设计 以满足我们社会的道德期望。从现在开始，我们就必须做好准备，设计并维护可信的人工智能系统。这是一项艰巨的任务：伦理是一个贯穿产品整个生命周期的主题。.

复制人类错误的人工智能

人工智能（Artificial Intelligence）是一套理论和技术，可以让机器在面临预定情况时做出决策。换句话说，它模拟人类智能。这种程序可以是 确定性, 根据决策方案应用连续规则，或概率, 在这种情况下，经过对过去类似情况的学习，程序可以推断出 ‘正确 ’的决定应该是什么样的。这也被称为 机器学习。.

无论程序类型如何，人工智能都是决策的自动化。伦理风险并不在于人工智能可能会自动做出糟糕的决策，而恰恰相反，它完美地模仿了人类的决策，并带来了错误和偏见。其中许多功能障碍来自人工智能开发的文化背景，即人工智能复制了社会的历史价值体系（例如性别或种族不平等）或设计者的价值体系（教育、政治敏感性、宗教习俗等）。.

这些偏差在机器学习算法中尤为普遍，因为它们是在传统的 data 基础上训练出来的，从过去推断未来。.

与构想和开发值得信赖的人工智能生命周期相关的基本问题既涉及技术问题，也涉及伦理问题，例如如何可靠地检测人工智能中可能存在的偏差？如何解释模型的结果？我们能否衡量人工智能性能的演变？我们能提供哪些安全保证？我们能否对漂移做出反应？这份并非详尽无遗的清单反映了人工智能生产过程中需要应对的挑战的多样性。.

利用人工智能纠正人工智能偏见

随着人工智能模型从概念发展为产品，许多技术解决方案应运而生，以促进人工智能系统的自动化和部署。最近，可用技术解决方案的数量呈爆炸式增长，初创企业和行业领导者的不断创新催生了一个丰富的生态系统。著名的例子有人工智能基础设施联盟和 MLOps 社区, Artefact 是这两个组织的成员。因此，为正确的任务找到正确的工具变得越来越重要，也越来越困难。.

与此同时，一个同样充满活力的咨询公司生态系统也已发展起来，为客户做出这些战略选择提供支持。.

其中许多技术解决方案都是开源的，可供所有人免费使用。这些工具包可以检测和测量 data 处理链上的所有偏差：从收集到利用，包括转换和建模。这些解决方案必须在整个产品生命周期内实施，包括设计和开发阶段以及生产阶段，以确保永久纠正。有三个特殊领域可以通过技术解决方案来解决。.

“偏见不是来自 data 科学家，而是来自 data 套件”。”

纠正人工智能过去的偏见

偏见并非源于 data 科学家，而是源于 data 集。这就是为什么有必要首先深入探索和思考 datasets 的原因。偏见既可能是技术性的（遗漏变量、data基础或选择问题），也可能是社会性的（经济、认知、情感）。.

为了纠正训练集，消除敏感 data 的所有痕迹似乎是合乎逻辑的。然而，这样做既无用又危险：一方面是因为非敏感的 data 可能与敏感的 data 暗中相关，另一方面是因为这种捷径会鼓励限制对 data 和进程的定期检查。.

要发现这些偏差，必须意识到它们的存在，并知道要注意什么。必须了解 data 的背景，才能正确解读它。单个程序无法识别偏差，因此 data 科学家组成的不同团队非常重要。.

通过批判性地思考与人工智能模型相关的不同指标，我们才能发现并纠正问题。假设一个模型需要检测出 1% 人口中存在的一种疾病。如果模型总是预测这个人是健康的，那么模型的准确率将达到 99%。在没有背景的情况下，这是一个非常好的分数。然而，这个模型却毫无用处。.

使用基本的单变量和双变量 dataset 统计可以发现一些偏差。例如，每个年龄组的代表性是否足够平等？一种解决办法是将连续的 data 变为分类的 data。相关矩阵也可以验证两个相关变量之间的联系。所有这些上游工作对于确保在高质量的 data 集上训练模型至关重要。一言以蔽之“垃圾进，垃圾出”。.

解释模型结果

人工神经网络等高性能人工智能系统非常高效，可用于多种用途。然而，它们很难解释，这就是为什么它们经常被称为 “黑箱模型”。机器学习的巨大挑战在于识别和解释偏差的原因，而不是否定其后果。在可解释性和准确性之间需要权衡。有些算法（如决策树）非常容易解释，但对于更复杂的预测就不那么有用了。.

可解释人工智能（Ex-AI）领域试图通过开发提高系统可解释性的方法和算法来解决这一问题。我们既可以探索全局理解，即解释人工智能如何在全球人口中发挥作用，也可以探索局部理解，即解释算法如何在具体实例中发挥作用。后者是 GDPR 规定的，因为要做到透明，人工智能必须能够解释为什么模型会对特定的人/物/TP41T 线路做出特定的决定。要了解模型的行为方式，必须同时关注全局和局部理解。.

为此，data 科学家可以研究模型的重要变量。例如，招聘模型中将性别作为重要变量是不正常的。他们还可以检查以下指标 精确度 (准确预测的阳性结果数 = 真阳性结果除以所有预测的阳性结果 = 真阳性结果 + 假阳性结果）、F1 分数（概括准确率和误报率的值召回单一度量），或召回 (预测准确的阳性数量 = 真阳性除以所有阳性 = 真阳性 + 假阴性），与变量相关（例如，women 与男性相比的准确率）。.

“机器学习的巨大挑战在于找出并解释偏见的原因，而不是否定其后果”。”

提高模型的稳健性

人工智能模型出现故障的原因可能是偶然的，如 data 被破坏，也可能是故意的，如黑客攻击。这两种偏差源都会导致人工智能模型出错，提供不正确的预测或结果。一些解决方案能够对机器学习模型和应用进行评估、防御和验证，以应对可能针对 data（data 中毒）、模型（模型泄漏）或底层基础设施（包括硬件和软件）的相互冲突的威胁。.

照片来源 https://arxiv.org/pdf/1412.6572.pdf

只需在正常图像上叠加一张 ‘噪声 ’图像，分类器就能将熊猫误分类为长臂猿。人眼是无法察觉到这种差异的，但有资料表明，这种技术能够误导人工智能模型。.

开发不那么人性化但更人性化的系统

值得信赖的人工智能概念不能简化为法律和技术概念。人和组织方面对于人工智能伦理方法的成功至关重要。所有利益相关者都必须了解伦理章程和改进方案，在整个创建过程中加以应用，并长期遵循。这就需要转变组织文化，以便深入整合伦理问题和方法，保证解决方案的可持续性，并为符合伦理的人工智能做出贡献。 按设计.

人工智能本身既不道德，也不违背伦理。只有系统的训练方式或使用方式才是道德与否的关键。因此，与大规模使用人工智能相关的真正伦理风险并不在于算法可能造反。恰恰相反，当人工智能完全按照我们的要求行事，模仿我们的偏见，重复我们的错误，强化我们的不确定性和不精确性时，风险就出现了。.

“当人工智能完全按照我们的要求行事时，风险就会出现”。”

积极应对人工智能伦理问题

我们非常关注这一主题 Artefact, 因此，我们专门为此组建了团队，并在治理开发、技术解决方案实施和人工智能战略咨询方面提供了具体支持。.

我们与学术界密切协作，作为以下机构的合作伙伴科技领域的佼佼者 Artefact是由法国矿业电信学院和巴黎政治学院共同创立的，旨在缩小研究与实践之间的差距。Artefact 还获得了由独立协会颁发的 "负责任和可信赖的人工智能"（Responsible and Trusted AI）标签。 Labelia 实验室, 这保证了负责任和可信赖的人工智能技术的高度成熟。.

伦理问题关系到我们所有人，在这个问题上必须积极主动；伦理行为的采用不应仅仅是一种反应。人工智能正在经历一个进化时期，其流程和伦理道德都处于定义过程中。在一个尚未受到监管的领域，应该由那些积极发挥作用的人起带头作用。作为开发者、顾问和管理者，我们有责任满足所有相关人员--不仅是客户和服务用户，还有整个社会--的期望，并利用人工智能的力量创造一个更美好的世界。.

联系我们

可信的人工智能：新的挑战和 data-driven 解决方案