Artefact 专家与法国科技企业社区合作为 Medium 博客撰写的文章。.
人们对 ChatGPT 和其他生成式人工智能的反应既丰富又多样,无论是持怀疑态度还是热情高涨,都表明了它们正在带来的变化和影响,远远超出了通常的技术圈子。这与前几代人工智能形成了鲜明的对比,前几代人工智能基本上都是预测性的,一般都是局限于研究和创新领域的文章或论文的主题。.
对企业而言,生成式人工智能也不同于以往的 artificial intelligence。如果我们将生成式人工智能与最相似的技术(如用于文本语料库的自然语言处理(NLP)或用于视听 data 的计算机视觉)进行比较,那么生成式人工智能会带来四大变化,企业在试用过程中会逐渐意识到这一点。.
首先,与以往的人工智能相比,生成式人工智能在加速概念验证的意义上大大加快了用例部署。其次,它们开辟了一个新的可能性领域,使非结构化 data 的增强变得更容易、更高效、成本更低。更重要的是,与以前使用的模型相比,生成式人工智能获得的结果在质量、数量和多样性方面都是全新的。所有这些因素都意味着,我们需要满足终端用户在这一技术的炒作下提高的期望。我们将在下文中阐述这四点。.
生成式人工智能能更快地测试用例的附加值
在生成式人工智能领域,用例的部署通常比以前的人工智能更快,劳动密集程度也更低。生成式人工智能所采用的方法经常被比作拼装乐高积木,将已有的组件组合起来就能创造出新的结果。这种易于实验和实施的方式可以缩短开发周期。此外,与用户的对话式交互模式也加快了应用的速度。.
data 用例可简化为业务问题、data 模型和提示。传统上,创建和优化模型是整个过程中最复杂、最耗时的部分。有了生成式人工智能,这一步就变得简单了。生成式人工智能提供预先训练好的、随时可用的模型,让企业无需投入大量时间开发和完善模型,就能从先进的专业知识中获益。实际上,模型(如 Azure 的 GPT 4.0)可以 “按需 ”访问,也可以通过 API(如 Google 的 Gemini Pro BARD)部署。有些提供商甚至针对特定领域提供专门的微调模型,如生成法律、医学或金融文本。.
一旦模型部署完毕,剩下的唯一任务就是将生成式人工智能模型 “落地”,即把模型生成的结果与现实世界的信息联系起来,从而约束模型在特定范围内做出反应。这通常涉及添加约束条件或附加信息,以引导模型产生与特定环境一致且相关的结果。然而,这与我们迄今为止一直使用的人工智能模型的训练时间相去甚远。.
让我们以呼叫中心逐字分析用例为例说明我们的观点。根据 Artefact 的研究,使用基于以往人工智能的模型开发此类用例,从 data 检索到可用一般需要三到四周的时间。如今,有了生成式人工智能,这一过程只需一周时间,加快了三倍多。主要的挑战在于选择合适的业务分类来调整模型。.
生成式人工智能将人工智能的范围扩展到以前很少使用或误用的领域 data
有些油田只有在油价暴涨时才有利可图。同样的原理也可应用于 data。现在,某些非结构化 data 可以通过生成式人工智能进行挖掘,为训练或微调模型开辟了一个全新的可利用 data 领域,并为专门从事特定领域的应用提供了广阔的前景。.
此外,还有一种新的前景:生成式人工智能能够在训练过程中处理和组合任何类型的 data ,绕过了费时而乏味的工作,即构建和改进公司 data 的质量,使其可用。根据目前的观察,这一承诺尚未实现。.
生成式人工智能不仅受益于注意力机制的真正突破。它还得益于不断增长的、必要的机器能力。.
注意力机制的工作原理有点像一个人在试图理解或创造某种事物时,将注意力集中在图像或文本重要部分的能力。想象一下,你试图从一张照片上画出一幅风景画。你不会一次看完整张照片,而是会把注意力集中在某些看起来重要的部分,比如山或树。这有助于你更好地理解重要细节,并绘制出更精确的图画。同样,在生成内容时,注意力机制也能让模型专注于图像或文本的特定部分。与一次性处理所有输入内容不同,模型可以将注意力集中在最相关、最重要的部分,从而生成更准确、更有意义的结果。这样,它就能学会如何更高效、更逼真地创建图像、文本或其他类型的内容。.
注意力机制的并行性非常好。多种注意力机制的使用为 data 提供了更丰富、更稳健的表示,从而提高了机器翻译、文本生成、语音合成、图像生成等各种任务的性能。.
因此,不久前还看似不可能的使用案例,现在已经完全可以使用了。例如,计算总统竞选期间在媒体上的发言时间就是这种情况。就在两年前,准确计算每位候选人的发言时间还是一项繁琐的工作。如今,由于使用了生成式人工智能,这一切都已成为可能。.
关于计算能力,六年前,OpenAI 发布的一份分析报告显示,自 2012 年以来,最重要的人工智能训练环节所使用的计算量呈指数级增长,翻倍时间为 3.4 个月(相比之下,摩尔定律的翻倍时间为两年)。自 2012 年以来,这一指标已经增长了 30 多万倍(两年的翻倍期只会产生七倍的增长)。.
生成式人工智能模型通常需要巨大的计算能力来进行训练,特别是因为这些模型被设计为通用型,需要大量的内容来进行训练。处理大型 datasets 和执行复杂的优化算法需要强大的计算资源,如高端 GPU 或 TPU。全新英伟达™(NVIDIA®)A100 Tensor Core GPU似乎能提供前所未有的加速能力。据英伟达公司称,A100 的性能比上一代产品高出 20 倍,并可划分为七个 GPU 实例,以动态适应不断变化的需求。据报道,它还拥有世界上最快的内存带宽,每秒超过两兆字节(TB/s),可运行最大的模型和 datasets。.
应该指出的是,计算能力的提高是 artificial intelligence 取得进展的关键因素。只要这种趋势继续下去,我们就应该做好准备,迎接远远超出当今能力的系统所带来的影响,这些系统将进一步突破极限,同时还要权衡这些系统所带来的价值和成本,尤其是在能源和环境方面。我们将在今后的文章中讨论这些问题。.
生成式人工智能提高了结果的多样性、质量和数量
生成式人工智能对其模型生成结果的影响显然不同于以往的人工智能。不仅生成结果的数量增加了,其质量和多样性也提高了。然而,生成式人工智能模型的可重复性较低,这必须与所有这些积极方面相适应。.
如果我们把拼图比作一幅图像,那么 data 分析就可以比作拼图的组装,其中 data 的每一块都代表着需要排列的拼块,以便展现出一幅连贯的图像。人工智能通过使用现有信息来推断和再造这些缺失的碎片,在试图填补缺失的 data 方面发挥着至关重要的作用。生成式人工智能不仅仅是完成现有的 data,而是从已有信息中获得灵感,创建新的 data。这一过程扩展了分析能力,并允许从现有的 data 中发现新的信息,从而将生成方面推向前沿。.

前几代人工智能产生的结果往往大同小异,与之不同的是,生成式人工智能模型能够通过探索不同的变化和替代方案,产生更加多样化的结果。这种多样性的增加使得生成更丰富、更多样化的内容成为可能,从定量转向定性,涵盖更广泛的需求和偏好。.
OpenAI 最近在好莱坞展示了它的最新模型 “Sora”,它能够根据文本生成视频。好莱坞制片人迈克-佩里(Mike Perry)说:“听说它能做所有这些事情是一回事,但真正看到它的能力还是令人吃惊。”他强调了生成式人工智能所提供能力的多样性和质量。.
然而,由于生成式人工智能模型能够探索更广阔的可能性空间,其可重复性可能不如以往的人工智能模型,结果的准确性也会大打折扣。具体来说,每次运行模型时都很难再现完全相同的结果,这可能会给某些关键任务应用的可靠性和可预测性带来挑战。.
对于需要精确答案的生成式人工智能应用来说,这一限制构成了重大挑战。这也是各家公司目前正在努力开发的领域:在高度特定的领域更好地专业化模型,以提高答案的准确性;通过将生成式人工智能的输出与基于规则的模型或结构化 data 查询的输出连接起来,将后者的鲁棒性与生成式人工智能的易用性和与用户的交互性结合起来。.
最终用户的期望值提高
在管理期望值和最终用户与技术的关系方面,生成式人工智能提出了几个具体的挑战。由于生成式人工智能能够快速产生结果,因此会让人产生特别高的期望。相反,如果出现幻觉和不理想的结果,则会极大地削弱用户对这些解决方案的信任。.
生成式人工智能能够以自动化的方式快速生成结果,这可能会给最终用户留下这样的印象,即该技术能够即时、高效地解决他们的所有问题。这可能会导致人们对生成式人工智能的实际能力产生过高的期望,如果结果不能完全满足这些过高的期望,人们就会感到失望。.
当然,生成式人工智能并不完美,有时会产生意想不到或不理想的结果,如不一致、虚假或不恰当的内容。出现这种不良结果会导致最终用户对该技术失去信心,对其可靠性和实用性产生怀疑。当意外结果损害生成式人工智能所生成信息的完整性时,它还会引发对 data 安全和隐私的担忧。.
2023 年 2 月,谷歌聊天机器人 "巴德"(更名为 "双子座")在被问及美国宇航局詹姆斯-韦伯太空望远镜的发现时提供了错误信息。它错误地声称该望远镜拍摄了第一张系外行星照片。这一说法是错误的,因为第一张系外行星照片可以追溯到 2004 年,而詹姆斯-韦伯望远镜直到 2021 年才发射升空(来源:CNET 法国团队,2024 年)。.
因此,让生成式人工智能系统的最终用户了解其局限性至关重要。因此,大多数部署这些解决方案的公司都会努力为用户的使用提供支持:培训提示艺术、解释这些系统的局限性、明确哪些期望可以实现或不能实现,并提醒他们注意 data 保护方面的适用规则。.
ChatGPT 发布一年多后,人们对这项新技术的期望一如既往地高。然而,与之相关的价值尚未在实际应用案例中得到体现。在下一篇文章中,我们将讨论与企业采用该技术以及如何在整个组织内推广该技术相关的话题。.
在以下人员的领导下

博客





