在 Artefact 生成式人工智能大会, 在 2023 年 4 月 20 日举行的 "世界人工智能大会 "上,生成式人工智能领域的主要参与者分享了他们的知识,并就这项新技术以及企业如何利用它来提高业务生产力交换了意见。.
最新的生成式人工智能模型能够与用户进行复杂的对话,从其训练data中创建看似原创的内容(图像、音频、文本),并执行手动或重复性任务,如编写电子邮件、编码或合成复杂文档。 如今,决策者必须制定明确而令人信服的生成式人工智能战略,并优先考虑 data governance 和 AIGen 业务解决方案的设计。.
会议主持人和主旨发言人:
生成式人工智能:探索创意新领域
文森特-卢西亚尼(Vincent Luciani)在会议介绍中说:“世界各地的人们都对这项新技术及其对组织和员工的影响感到兴奋。到目前为止,我们在人工智能方面所拥有的都是通过机器学习增强的相对确定性的应用。我们能够预测、个性化、优化,但不能真正创造。.
“但今天,我们第一次看到人与机器之间真正的互动。现在,一种真正的智能正在从这种技术和这些算法中产生,尽管科学界在这是一场革命还是一种进化的问题上存在分歧......
“我们已经讨论过增强的人类或增强的活动:很快我们将讨论增强的企业。在快速概述会议将涉及的主题并将发言权让给主旨发言人之前,他提醒 audience 注意以下几点
“尽管新的生成式人工智能应用不断涌现,但克制是至关重要的:成功的业务转型不会一蹴而就,它需要思考、研究和准备”。”Vincent Luciani,Artefact 首席执行官兼联合创始人
生成式人工智能市场的前景和机遇
第一位主题发言人哈南-瓦赞(Hanan Ouazan)首先概述了文本模型,从谷歌 2017 年革命性的“ "开始。“你只需要关注” 这篇论文促成了 Transformers 的诞生,而 Transformers 是目前使用的几乎所有大型语言模型 (LLM) 的基础。“众所周知,研究需要时间,但今天,我们正处于一个加速期,我们每天都能看到新的模型,这些模型利用了更多的 data 和基础设施”。”
哈南探讨了生成式人工智能模型的民主化和可及性的几个方面,特别强调了该技术的加速应用:“速度之快令人咋舌:ChatGPT 在短短五天内就达到了 100 万用户”。”
关于 LLM 训练方法策略,他介绍了预训练、微调和及时工程的优势,列举了每种方法的行业应用案例,并介绍了 Artefact 的模型策略决策矩阵。.

除了所有权成本、性能和局限性之外,哈南还谈到了变革管理以及生成式人工智能可能对工作产生影响的方式。.
“它肯定会改变我们的工作方式,但在 Artefact,我们认为它不会扼杀职业:它将增强从事这些职业的人类的能力”。”哈南-瓦赞(Hanan Ouazan),Data 科学公司合伙人兼 Artefact 公司生成式人工智能负责人
由人工智能驱动的电子商务图片生成平台
主讲嘉宾 Matthieu Rouif 是以下公司的首席执行官兼联合创始人 照片室, 该应用程序采用稳定扩散(一种图像生成人工智能技术),使其 8000 万用户能够使用智能手机创建影楼级照片。.
自 COVID-19 大流行引发电子商务市场爆炸以来,每年有 20 亿张照片被编辑。而 PhotoRoom 应用程序通过为商家自动剪裁、显示阴影和生成逼真的背景,发挥了重要作用。“Matthieu说:”我们利用人工智能生成技术为客户提供看起来像专业摄影师拍摄的照片,甚至可以在一秒钟内添加独特、逼真的人工智能生成背景。.

“我们为客户提供大量高质量、低成本的照片,尊重他们的品牌,以最佳方式展示他们的产品,吸引和留住客户,从而帮助他们发展业务”。”马蒂厄-鲁伊夫,PhotoRoom 首席执行官兼联合创始人
重新思考企业的人工智能
伊戈尔-卡隆是以下公司的首席执行官兼联合创始人 点亮, 该平台比 GPT-3 更为强大。它带来了运行服务器和 data 的最先进模型,同时保证了企业的 data 主权。.
伊戈尔在主题演讲中谈到了公司的起源。“当我们在2016年创建LightOn时,我们正在构建利用光进行人工智能计算的硬件。这是一种不同寻常的方法,但它成功了--我们的光学处理单元(OPU)是世界上第一个光子人工智能协处理器,现已被全球研究人员使用,并集成到世界上最大的超级计算机之一上。.
“自 2020 年 GPT 出现后,我们就开始研究如何利用我们的硬件来制造自己的 LLM--既供我们自己使用,也为外部客户服务。事实上,我们学会了如何制造 LLM,而且做得相当不错。但是,当我们第一次在 2021 年、2022 年与人交谈时,他们对 GPT3 一无所知,因此我们不得不教育我们的目标 audience。.
“我们与客户合作创建了一个更大的模型,最近发布了 400 亿个模型,以独特的方式进行训练,与 GPT3 竞争,但使用的参数要少得多。这意味着你可以拥有更少的重型硬件基础设施,而且使用它无需花费大量成本”。”
伊戈尔强调了大型语言模型的价值,他说
“我认为,未来大多数公司都将以 LLM 为基础......这些工具将使他们能够从自己的 data 中产生真正的价值”。”伊戈尔-卡隆,LightOn 首席执行官兼联合创始人
“我们今天为客户提供的是一种名为 Paradigm 的产品:它使公司能够管理其组织内部自己的 data 流,并重新使用这些 data 来重新训练和改进这些模型。这确保了他们的内部流程或产品能够从与 LLM 的互动中获得的情报中受益。.
“法国或欧洲生态系统中的许多人都依赖于开放式人工智能应用程序接口或其他北美竞争对手”。伊戈尔警告说:“将您的 data 发送给公共 API 的危险在于,它将被重复用于训练后续模型。因此,比如说采矿业的人,他们简直知道哪里能找到黄金,就把他们的技术 reports 发送给它......几年后,如果你问 ChatGPT-8 或 -9 或其他什么,‘黄金在哪里?他强烈建议公司开始使用内部生成的 data 来训练模型。.
生成式人工智能国家战略
最后一位主旨发言人 Yohann Ralle 是法国经济、财政、工业和数字主权部的生成式人工智能专家。他首先解释了他建立最先进 LLM 的 “神奇公式”:计算能力 + datasets + 基础研究:
Yohann Ralle,法国经济、财政、工业和数字主权部生成人工智能专家。.

“关于 datasets,诸如 Agdatahub 这也有助于提高法国的竞争力。在基础研究方面,国家战略帮助构建了人工智能研发生态系统,建立了 3IA 在法国和欧洲,我们还开展了多项活动,包括:为研究所提供资金、为博士生合同提供资金、启动圣埃克苏佩里国际研究中心(IRT Saint Exupéry)和 SystemX 项目、开展多项学生培训计划等等。”
生成式人工智能圆桌讨论,由 Artefact 首席执行官 Vincent Luciani 主持
人工智能是否通过了 图灵测试 (即人工智能是否已达到人类水平的智能)?
虽然对这个问题的回答不一,但普遍的共识是,虽然智力确实存在,但意向性却不存在。.
马修 “我认为它有......只要你不问日期,你就会觉得有人在那里。有一个时间面是行不通的。”
伊戈尔:“我的问题是,你为什么要问这个问题?因为图灵测试对商业来说并不有趣。但是,就交互而言,是的,你可以说人工智能通过了测试。”
Yohann: “图灵测试非常主观。当我们把人类的特质赋予人工智能时,当我们把人工智能拟人化时,就会有风险。还记得谷歌工程师的案例吗? Blake Lemoine, 他认为与他对话的 LaMDA 聊天机器人已经具有了智商......图灵测试只是一个有趣的练习,仅此而已。”
哈南 “关于 ChatGPT,我们正在接近,但还没有达到目标”。”
ChatGPT 的出现是一场革命,还是一次演变,抑或是连续体的一部分?
伊戈尔 “虽然目前还不能完全了解 ChatGPT 对 LLM 的长期影响,但随着时间的推移,这些技术的新用途将会出现,并产生重要的社会影响。讨论很有趣,但最重要的因素是实际的科学论文,这些论文将详细介绍对 LLM 的改进。这些模型当前和潜在的实际应用不应被忽视或低估”。”
对企业来说,哪些是最有前景的用例?机器人、图像生成?
Hanan: “显然,聊天机器人在人工智能领域一直都很重要,并将继续成为一个重要的用例,因为现在有了 ChatGPT,只需将其连接到 database 就能在 48 小时内建立一个聊天机器人,这太神奇了。另一个用例是创建无需人工干预就能执行特定任务的自主代理,比如为您预订前往意大利的所有酒店和餐厅门票的旅行社代理。”
Yohann: “我认为 CGT 驱动的插件有很多机会,比如 Kayak 或 Booking。我认为这将重构数字环境,OpenAI 将聚合聚合器。”
伊戈尔:“我认为可以定制企业 LLM。除了 data 湖之外,公司将开始了解如何使用非结构化 data,以及如何通过私人 LLM 从内部 data 创造真正的价值。同时,我认为由于 ChatGPT 的出现,人们搜索和使用互联网的方式将发生巨大变化。”
文森特 我认为,企业内部的 data 和 LLM 将融合成一种'主常见问题+‘’,可以通过搜索或增强代理进行查询。查询的概念正在演变:明天,人们会购买一个或多个关键词,还是会购买一个概念?在广告业,我们的目标一直是以人为本,以audience为基础;而现在,随着我们对个人data的保护,我们正朝着以情境为基础的方向发展。这将带来更有趣的广告’。”
生成式人工智能目前在企业中的应用情况如何?它是否会影响就业?
马修 “我们很幸运,我们的竞争优势之一就是我们的基因里就有人工智能。我们鼓励在内部使用更多的生成工具。我们的技术团队使用 Copilot 进行开发,我们的编码员同时使用 ChatGPT 和 Copilot。我们使用这些工具更有创造力。至于就业,我们正在成长,所以我们计划招聘新人......但与此同时,当我们拥有优秀的软件时,我们可以用较小的团队做更多的事情。”
伊戈尔 “我们的团队规模一直很小,只有七八个人,但却能达到谷歌等公司的高水平技术实力,谷歌的团队规模是我们的十倍。我们的小团队产生了完全不相称的效果。认为需要大团队才能成就大事业的想法是错误的。”
Yohann: “十年前,美国的一项研究称,20 年内人工智能将导致 47% 个工作岗位流失,但我们可以看到,这种情况并未发生。经合组织最近的一项调查显示,这一数字接近 14%。我认为,我们应该从任务而不是工作的角度来考虑问题。正如 OpenAI 最近的一项研究中提到的,80 到 90% 的工作将受到生成式人工智能的影响,但这实际上意味着 90% 的员工将在 10% 的任务中受到影响。有趣的是,我们认为人工智能无法触及的职业概念正在受到挑战,比如创意、法律、金融和其他领域的职业。法国政府创建了 Le LaborIA 以帮助探讨这些问题”。”
这些模式在主权和法规方面有哪些限制?
哈南 “第一个限制涉及知识产权(IP)。今天,我们有三种模式:公共模式,如 ChatGPT,您发送的 data 可以用于商业目的;没有知识产权所有者的私有模式,如谷歌在 Lamba 上的 API;以及自安装的开源模式。Data 主权是个问题,因为 GPT 和 PaLM 不是欧洲的,而是美国的”。”
Yohann: “在欧洲,法规是一个大问题。意大利完全 禁止使用 ChatGPT 该应用程序是否符合 GDPR 隐私法规的调查。OpenAI 需要非常清楚地说明他们对个人 data 的使用情况,例如提出免责声明,说明他们使用了个人 data,并允许用户选择退出 data 收集,让他们删除自己的 data。关于 LLM 的局限性,另一个问题是幻觉:它们经常给出错误的答案,如果请求涉及公众人物,而模型生成的'假新闻'故事可能会对当事人造成真正的伤害,那就很严重了‘。’
文森特 “你是否研究过知识产权问题以及知识产权所引发的问题? 盖蒂图片公司起诉 Stability AI 公司?有很多关于在互联网上搜索图像来训练模型的问题......”
Yohann: “我们正在考虑这个问题。开放源代码也许是创建干净、无版权限制、尊重知识产权的 databases 和 datasets 的一种方法。”
马修 “关于个人 data 和产品:让 ChatGPT 或 Midjourney 或 PhotoRoom 运行良好的不是个人 data,而是客户反馈”。”
Yohann: “用户反馈是最理想的,但收集用户反馈的成本对于法律硕士来说太高了”。”
伊戈尔 “钱在哪里?这就是我的问题。你提出的所有问题都是技术性的,在我们有资金雇佣工程师并建立生态系统之前,我们无法解决这些问题,而我们还根本没有做好准备。”
随着越来越多的 LLM 建成,您认为会出现 GPU “战争 ”吗?
Yohann: “这是一个真正的风险。现在,英伟达在这里处于垄断地位,他们控制着市场和价格。不幸的是,欧洲没有真正的竞争对手。顾名思义,这是一种有限的资源,一种稀缺资源,所以这是一场严峻的斗争。”
马修 “GPU的缺乏不仅严重限制了我们的生产力,也限制了欧洲各地公司的发展”。”
伊戈尔 “自从我们开始做硬件生产商以来,我们在2016年就已经面临这个问题......如今,有一些人与我们的竞争对手合作,他们的全职工作就是寻找足够的GPU来训练模型......市场正在爆炸式增长,但芯片生产却跟不上--无论在世界任何地方。”
哈南 “不可避免地会出现 GPU 瓶颈,但我们可以学习如何提高效率,我们需要这样做。我们需要考虑的是如何将开源技术融入我们的公司,而不仅仅是如何使用所有最新的技术。”
您认为未来最有价值的地方在哪里?开源模式?法律硕士?
马修 “在 PhotoRoom,我们使用开放源代码,这让我们能够更快地开发自己的知识产权。我们拥有广泛的 抱抱脸社区 在巴黎,它为我们提供了重要的反馈信息”。”
伊戈尔 “我们使用 LLM,但我们并不拘泥于这种商业模式。我们可以使用开放源码。重要的是能够并知道如何重新使用我们专有的 data 来训练未来的模型。我们的目标是建立一个为其他公司定制这些模型的行业。”
Yohann: “开源与专有的演变推动了生成式人工智能的发展。人工智能社区共同努力,让其他参与者也能从这项基础研究中获益,从而建立自己的模型。我怀疑这些开源模型的性能是否会低于专有模型,但这可能会改变。无论如何,人们不禁要问,谷歌不会后悔开放他们的 ChatGPT 技术吧!”
圆桌会议之后是 audience 问答环节,围绕科技领域缺乏 women 的讨论尤为热烈。Yohann 详细介绍了法国政府在教育方面采取的几项专门针对女孩和 women 的措施,Vincent 则谈到了法国政府正在采取的措施。 Artefact Data 学校, ,...... Women@Artefact 倡议和其他科技公司试图纠正这种情况。.
与会者还提出了其他问题:自闭症患者和其他残障人士使用 LLM 的包容性;人工智能幻觉问题;公司为保护环境而计划采取的措施;欧洲与法国在 data 互联网刮擦方面的作用。要了解与会者如何回答这些问题,请观看会议 replay。.

博客






