生成式人工智能的 PoCs 已经激增,主要是在大公司。但是,由于其复杂性,很少有举措实现了产业化。.

在 LeMagIT 记者 Christophe Auffray 撰写的这篇文章中,Artefact 合伙人兼生成式人工智能负责人 Hanan Ouazan 对现状进行了总结,并探讨了改进方法。.

“法国企业采用生成式 artificial intelligence 的情况并不一致。规模仍然是一个决定性因素。但大多数主要集团都已采取行动(战略、PoC 等);只有少数几个集团目前仍处于落后状态”。”
Hanan Ouazan,Artefact 生成式人工智能负责人

相比之下,虚拟经济企业和中小型企业则更加犹豫不决。“哈南指出:”并不是所有的组织都站在同一起跑线上。“大公司最先提出这个问题。但这并不意味着'大公司'已经成功地驯服了这项技术‘。’

工业化的复杂性

“一年前,我们就已经预见到生成式人工智能项目的主要困难,即其产业化。[......]几年前,[经典] artificial intelligence 的 PoC 需要三到四个月的时间。对于 GenAI 来说,两到三周可能就足够了。而产业化则完全不同。公司正在意识到 PoC 计划的局限性。”

而采用问题,尤其是 ”嵌入式人工智能 ”解决方案,如 副驾驶员. .使用率并不是必然的。更重要的是,这些工具的投资回报率还有待确定。.
内部解决方案,即 “自制 “而非 ”购买 "的解决方案,也无法避免采用问题。.

尽管存在这些障碍,但事实证明,一些行业在人工智能生成方面充满活力,其中包括零售业和奢侈品行业。Artefact的GenAI专家表示,即使后者的进展不如最初预期。据说银行业和医疗保健业的进展更为滞后,但这主要是由于cloud和合规性问题。.

RAG、Search 2.0、Automation、Creativity:四个家族和四个成熟期

在部门层面也可以看到双速进展。根据 Hanan 的说法,工业界在采用技术的竞赛中遥遥领先。.

但是,即使在最成熟的企业中,产业化和规模化(在采用和技术方面)仍然存在障碍。. 用例侧重于检索增强生成(RAG) 在 “经常被忽视的 databases” 中进行文档检索。”

内容索引既针对内部应用(提高生产力),也针对外部应用(通过对话界面)。哈南举例说,一家制造商参与了一个项目,通过聊天机器人向客户提供在线产品目录。.

在零售业,生成式人工智能被用来重新思考搜索. .基于 GenAI 的搜索 2.0 将通过表达需求来改变搜索体验。.

在不透露零售商名称的情况下,Artefact 正在合作设计一种基于意图搜索的解决方案。“明天,搜索将成为体验逻辑的一部分。.

第三类使用案例是自动化. .这包括分析分销商呼叫中心的信息和记录,以确定刺激因素或问题。.

“我们收集所有电话,将其转录,然后进行分析,创建一个仪表板。例如,通过该视图,我们可以看到有 3000 个电话是关于客户认为某款产品比产品单上的图片小的问题。你可以深入到这种详细程度”。”

以前,这种情感分析不够有效。现在,它甚至可以检测出讽刺意味。.

自动化还包括社交网络趋势分析或银行和保险后台实时 data 采集等应用。.

第四个家族是创造力. .“哈南指出:”这个领域没有我想象的那么先进,但已经开始起步了。Artefact 与客户合作,实现直销自动化,如个性化(“情景化”)短信,根据收件人的设备等标准生成订阅信息。.

用于广告的图像生成也正在兴起。然而,由于版权和图像生成人工智能训练 data 的法律不确定性,这些用途受到了阻碍。包括 Adobe 在内的一些出版商承诺的法律保障可以消除这方面的障碍。.

现在,生成式人工智能的应用已经非常正规化。然而,由于投入生产的项目很少,最终用户能接触到的项目就更少了,因此在实际转化方面的影响还需要进一步验证。.

“安全的 GPT 类工具非常多。但这并不是最难开发的东西。更重要的是,由于是内部应用,风险有限”。”

成本、用户体验、质量和变革是实现工业化的关键

对于哈南-瓦赞(Hanan Ouazan)来说,2024 年评估的原因显而易见: 工业化的复杂性. .造成这种情况的原因有很多,其中最主要的是成本问题:使用费可能会迅速上涨。.

然而,并非所有公司都预计到了其使用案例的投资回报率。无论预期与否,使用 LLM 的结果都是支出远远超过收入。虽然这些解决方案的单次使用价格在过去一年中大幅下降,但它们却使应用程序变得更加复杂,难以长期维护。.

这个成本问题可以通过 “优化逻辑 ”来解决,例如降低聊天机器人对话的成本。聊天是根据问题和回答的大小计费的。而每个新问题都会增加对话的历史记录,从而增加每次查询的总成本。.

“对于一家工业客户,我们监控聊天机器人的每一次互动。这让我们能够衡量成本和原因。例如,聊天机器人可能难以识别产品,导致交流次数成倍增加。监控对于采取纠正措施至关重要。”

用户体验也是一个重要参数. .要确保这一点,延迟很重要,但也要付出代价。在 Azure 上,可能有必要订购 Provisioned Throughput Units (PTU),即 “昂贵的专用托管资源”。”

不考虑人的因素,就无法成功采用

哈南-瓦赞(Hanan Ouazan)也认为质量是产业化的一项挑战。衡量和监控质量意味着 “将正确的评估构件落实到位[......]在某些敏感的用户路径上,我们部署了一个人工智能,其功能是验证另一个人工智能的响应。他解释说:”实时评估流程可确保生成式人工智能响应的质量。“我们还整合了反馈回路,利用用户的反应来改进结果”。”

工业化最终遭遇人类障碍. .要在这一阶段取得成功,就必须改变流程。例如,从传统的聊天机器人转变为基于生成式人工智能的版本,就会改变客户服务行业。.

“这种变化需要得到支持,尤其是在验证聊天机器人回复的过程中。部分对话可以委托人工智能进行验证。而当人类介入时,最好能协助他们减少处理时间。而当人类进行注释时,人工智能需要学习,以启动良性循环。”

Hanan 还呼吁支持用户采用并牢记用户体验。“收养不应是痛苦的. .这是在一个项目中实施的 Artefact 方法,该项目旨在提高制造商产品 data 基础的 data 质量。个人无需适应生成式人工智能。应该由人工智能来适应他们,尤其是适应他们的工作方式”。”

例如,Artefact 重新考虑了其产品 data 的表单生成解决方案,该解决方案最初的设计是直接集成到 PIM 中,而在所引用的项目中,员工对这一工具并不领情。.

“我们开展生成式人工智能项目的方法是,选择一家企业并确定其日常任务,以区分人工智能将取代人类或修改工具的任务。. 我们面临的挑战是如何将可以自动化的工作和难以完成的工作自动化,以及如何在人类工作条件下提高工作效率。而要做到这一点,就必须与目标用户进行互动。否则,采用率将为零.”

用户培训:调整光标

如何进行及时培训?对于哈南来说,这一切都与用户有关。. Artefact 对员工进行 CRAFT 方法(背景、角色、行动、格式、目标受众)培训, 它规定了人工智能的正确使用方法。对于成熟的用户,可以对他们进行模型操作和集成工具的培训。然而,有些人群仍然习惯于使用关键词。.

该公司正在教育员工使用自然语言进行查询的可能性。公司还引入了重拟功能。当输入关键词(puk 代码)时,该工具会重新措辞:“您在找您的 puk 代码吗?”

“有一个滑块,需要根据工具的适用人群进行调整。但我认为,随着生成式人工智能解决方案能力的提高,最终将不再需要提示。.

未来的两个重点项目

2024 年,生成式人工智能领域有两大重点领域。第一个领域涉及 采用, 确定职业、事业和技能的变化。.

第二个是 扩大规模. .目前正在两个层面进行试点:治理(确定需求优先次序、投资回报率和指导举措)和 GenAI 平台。.

哈南注意到,RAG 的数量在增加,这是由于正在开展的 PoCs 数量众多所导致的现象。因此,企业需要合理安排实验中使用的构件。.

明天,我们将不得不把 RAG 视为 data 产品. .它作为一种产品在企业中占有一席之地,就像法律硕士作为一种产品占有一席之地一样。.

“许多人认为GenAI是一种神奇的东西,可以让他们摆脱过去的束缚。实际上,GenAI 带来了更多的束缚,”Artefact 的专家提醒道。.

这种演变是一个连续过程的一部分。在 DevOps 和专门应对人工智能的 MLOps 之后,LLMOps 正在兴起。“MLOps 中定义的保障措施仍然适用。但我们需要对其进行补充,以考虑到成本、幻觉和模型的生成维度,”Hanan 总结道。.

阅读文章

.