生成式人工智能领域的概念验证项目如雨后春笋般涌现,主要集中在大型企业中。但由于其复杂性,鲜有项目得以实现产业化。

在LeMagIT记者克里斯托夫·奥弗雷(Christophe Auffray)撰写的这篇文章中,Artefact合伙人兼生成式人工智能负责人哈南·奥赞(Hanan Ouazan)对当前形势进行了评估,并探讨了改进之道。

“法国企业对生成式人工智能的采用情况远非普遍一致。企业规模仍是决定性因素。但大多数大型集团已采取行动(制定战略、开展概念验证等);如今只有少数企业仍处于落后状态。”
Hanan OuazanArtefact生成式人工智能负责人

相比之下,初创企业和中小企业则显得更为犹豫。“并非所有组织都步调一致,”哈南指出,“大公司是率先着手解决这一问题的。但这并不意味着这些‘大企业’已经成功驾驭了这项技术。”

工业化的复杂性

“一年前,我们就已预见到生成式人工智能项目面临的主要难题,即其产业化。[…] 几年前,[传统]人工智能领域的概念验证(PoC)通常需要三到四个月。而对于生成式人工智能,两到三周或许就足够了。但产业化却是另一码事。企业正逐渐意识到概念验证项目的局限性。”

此外,采用率问题更是雪上加霜,尤其是对于“嵌入式人工智能”解决方案(如Copilots)而言。用户是否会实际使用这些工具并非必然。更重要的是,这些工具的投资回报率尚待确定。
自研解决方案(即“自主开发”而非“直接采购”)同样难以避免采用率方面的问题。

尽管存在这些障碍,但在生成式人工智能领域,某些行业仍展现出蓬勃的发展势头,其中包括零售业和奢侈品行业。不过,Artefact生成式人工智能专家称,就奢侈品行业而言,其进展程度低于最初预期。据称,银行业和医疗保健行业则进一步落后,但这主要归因于cloud 合规性方面的问题。

RAG、搜索 2.0、自动化、创造力:四大类别与四个发展阶段

在行业层面,同样可以观察到“双速”发展态势。据哈南称,在技术采用的竞争中,工业领域处于领先地位。

但即便在最成熟的玩家中,工业化和规模化(无论是从应用还是技术层面来看)仍然是障碍。用例主要聚焦于“检索增强生成”(RAG),用于从“常被忽视的数据库”中检索文档。

内容索引既适用于内部应用(以提升工作效率),也适用于外部应用(通过对话式界面)。哈南举了一个制造商的例子:该企业正参与一个项目,旨在通过聊天机器人让客户能够在线查阅其产品目录。

在零售业,生成式人工智能正被用于重新构想搜索功能。基于生成式人工智能的“搜索2.0”将通过用户表达需求来彻底改变搜索体验。

虽然未透露该零售商的名称,Artefact 合作设计一款基于意图搜索的解决方案。“未来,搜索将成为体验逻辑的一部分,”这位生成式人工智能负责人预测道。

第三类用例是自动化。这包括分析分销商呼叫中心的消息和通话记录,以识别可能引发客户不满或存在的问题。

“我们会收集所有通话记录,将其转录成文字,然后进行分析以生成一个仪表盘。通过这个视图,我们可以发现,例如有3,000通电话是关于某款产品的,客户认为该产品比产品说明书上的图片要小。您可以深入到这种细节层面。”

此前,这种情感分析的效果并不理想。如今,它甚至能够识别反语。

自动化还涵盖了诸如社交网络趋势分析,以及面向银行和保险后端业务的实时数据采集等应用。

第四个领域是创造力。“这一领域的进展不如我预期的那么快,但已经开始起飞了,”哈南指出。Artefact 与客户Artefact ,致力于实现直接营销的自动化,例如根据收件人的设备等条件,对短信进行个性化(“情境化”)处理,从而吸引用户订阅。

广告领域的图像生成技术也正在兴起。然而,围绕图像生成人工智能的版权及训练数据所存在的法律不确定性,阻碍了这些应用的发展。包括Adobe在内的某些出版商所承诺的法律保障,有望消除这一领域的障碍。

生成式人工智能的应用目前已得到充分的规范化。然而,就其实际变革的影响而言,仍需加以限定,因为目前投入实际运行的项目寥寥无几,而最终用户能够接触到的项目更是少之又少。

“市面上有大量安全的GPT类工具。但这并不是最难开发的东西。更重要的是,由于这些应用是内部使用的,因此风险有限。”

成本、用户体验、质量和变革是工业化的关键

对于哈南·奥赞而言,此次2024年评估的原因显而易见:工业化的复杂性。造成这种情况的原因有很多,其中成本问题尤为突出:用户费用可能会迅速攀升。

然而,并非所有企业都预见到其应用场景的投资回报率。无论是否在预料之中,使用大型语言模型都会产生远超收入的支出。尽管过去一年中这些解决方案的单次使用成本已大幅下降,但随着时间的推移,它们会使应用程序变得更加复杂,且更难维护。

可以通过“优化逻辑”来解决这一成本问题,例如降低聊天机器人对话的成本。对话费用是根据提问和回答的长度来计算的。而且,每个新问题都会增加对话记录,从而推高每次查询的总成本。

“对于某家工业客户,我们对每一次聊天机器人交互都进行监控。这使我们能够衡量成本并找出原因。例如,可能是聊天机器人难以识别某款产品,从而导致对话次数激增。监控对于采取纠正措施至关重要。”

用户体验也是一个关键指标。为了确保这一点,延迟至关重要,但这需要付出代价。在 Azure 上,可能需要订阅预配置吞吐量单元(PTU),即“专用且昂贵的托管资源”。

如果不考虑人的因素,就不可能成功推行

哈南·奥赞还指出,质量是工业化进程中的一大挑战。他对质量的衡量与监控意味着“建立正确的评估体系……在某些关键的用户路径上,我们会部署一个人工智能,其作用是验证另一个人工智能的响应。实时评估流程确保了生成式人工智能响应的质量得以维持,”他解释道。“我们还整合了反馈循环,利用用户反馈来优化结果。”

工业化最终会遇到人为障碍。要在这个阶段取得成功,就必须改变流程。例如,从传统的聊天机器人转向基于生成式人工智能的版本,将改变客户服务这一职业。

“这种变革需要得到支持,尤其是在验证聊天机器人回复的过程中。对话的一部分可以交由人工智能进行验证。当人类介入时,最好协助他们以缩短处理时间。而当人类进行标注时,人工智能需要学会启动良性循环。”

哈南还呼吁支持用户采用,并始终将用户体验放在首位。“采用过程不应令人痛苦。Artefact 为某制造商改进产品数据库数据质量的项目Artefact 。用户不应被迫去适应生成式人工智能,而是人工智能应该适应用户,尤其是适应他们的工作方式。”

例如,Artefact 其产品数据表生成方案,该方案最初旨在直接集成到 PIM 中——而在该报价项目中,员工对这一工具并不太认可。

“我们在生成式人工智能项目中的方法是:选定一家企业,梳理其日常任务,从而区分哪些任务可由人工智能取代人工,或对现有工具进行优化。挑战在于:将可自动化的环节实现自动化,解决工作中难以处理的部分,并在改善人类工作条件方面取得进展。而若不与目标用户进行互动,这一切都无法实现。否则,该技术的采用率将归零。”

用户培训:调整光标

那么,关于提示词培训呢?对Hanan来说,一切都以用户为中心。Artefact 员工掌握CRAFT方法(情境、角色、行动、格式、目标受众),该方法明确了AI的正确使用方式。对于经验丰富的用户,可以培训他们掌握模型的操作以及集成这些模型的工具。然而,部分用户群体仍然习惯于使用关键词。

该公司正在向员工普及使用自然语言进行查询的可能性。此外,该公司还引入了语义重构功能。当用户输入关键词(PUK码)时,该工具会自动重述为:“您是在查找您的PUK码吗?”

“那里有一个滑块,需要根据该工具的目标受众进行调整。但我认为,随着生成式人工智能解决方案能力的提升,最终将不再需要提示词,”哈南解释道。

聚焦两个未来项目

2024年,生成式人工智能领域主要有两个关注重点。首先是应用推广,即识别职业、职业发展路径及技能方面的变化。

第二点是扩大规模。目前正在两个层面进行试点:治理层面(确定需求优先级、评估投资回报率并指导各项举措)以及生成式人工智能(GenAI)平台层面。

哈南注意到 RAG 的数量有所增加,这一现象源于当前正在开展的大量概念验证(PoC)项目。因此,企业需要对实验中使用的构建模块进行优化。

“明天,我们必须把RAG视为一种数据产品。它作为一种产品在企业中有着自己的定位,就像大语言模型(LLM)作为一种产品也有着自己的定位一样。”

“许多人曾以为生成式人工智能(GenAI)是一种神奇的存在,能让他们摆脱过去的束缚。但实际上,生成式人工智能带来的束缚反而更多Artefact专家提醒道。

这一演变是一个连续过程的一部分。继DevOps之后,为专门应对人工智能而出现的MLOps,如今LLMOps正崭露头角。“MLOps所定义的安全保障措施仍然适用。但我们需要在此基础上加以补充,以考虑到成本、幻觉以及模型的生成性维度,”哈南总结道。

阅读这篇文章

class="lazyload

.