阅读文章

背景

ADEO 开发了广泛的 知识图谱 该网站涵盖了整个产品目录。与此同时,该公司还在其网站上发布了大量 DIY 文章。然而,这些文章仍然与知识图谱脱节,使我们无法准确识别内容中引用了分类标准中的哪些产品或实体。通过将这些文章链接到知识图谱,ADEO 可以通过更智能的搜索功能、个性化的推荐以及更吸引人、更丰富的内容来显著提升用户体验。.

这一举措标志着 Adeo、谷歌和 Artefact 之间成功而持久的合作翻开了新的篇章。该项目建立在 data、零售和尖端技术方面的共同专业知识基础之上,是我们在数字零售领域创新历程中的一次自然演进。与谷歌的战略合作有助于提供完成这一宏伟目标所需的工具和基础设施。.

基石:Adeo的知识图谱和DIY文章潜力

该项目的核心是 Adeo 强大的知识图谱(Knowledge Graph)--一个包含公司分类法的复杂图 database,这是一种对信息进行分类和归类的结构化方法。这个由相互连接的 data 点组成的网络,目前包括约 500,000关系人 与 23,000 个独特的主题41 个谓词, 和 225,000 件物品, 该知识图谱代表了有关产品、类别及其关系的大量信息。以下是您可能在该知识图谱中找到的关系的简单示例:

实体和关系示例

然而,大量有价值的信息蕴藏在众多的 DIY 文章 上发表的文章。这些文章包含丰富的实用建议和说明,通常会提到 Adeo 知识图谱中已经存在的实体。挑战是什么?有 无自动化途径 以识别这些提及,并在文本内容和结构化知识之间建立重要联系。.

弥合这一差距将释放出重要的 商业价值, 尤其是在当前人工智能和创人工智能转型的背景下。通过自动从文章和其他文本data中提取实体并将其链接到知识图谱中,从而丰富知识图谱,我们可以:

  • 提高搜索相关性: 启用 垂直搜索, 用户可以根据基本概念而不仅仅是关键词来查找文章。.
  • 加强产品推荐: 了解文章中讨论的实体,直接向读者推荐相关产品、工具和材料。.
  • 丰富和个性化内容: 通过链接知识图谱中的相关实体,动态丰富文章内容,为用户提供更深入的上下文和相关信息。.

导航:法学硕士的 NER 和 NEL

当前的任务--识别文本中的实体提及并将其链接到预定义的知识库--属于以下成熟的领域 命名实体识别(NER) 和 命名实体链接(NEL). .传统上,要想实现高性能,需要在大量标注的 data 数据集上训练专门的模型。虽然存在功能强大的 NER/NEL 模型,但其 data 密集型性质 介绍 这对我们的快速部署需求是一个挑战。.

因此,我们选择了 不同方法目标 1:利用 大型语言模型 (LLM) 来构建我们的提取管道。虽然 LLM 几乎不需要针对特定任务的训练 data - 因此可以更快地实施和迭代,但它们仍然需要 注释data 进行评估。为此,Adeo 团队建立了一个全面的 验证集, 这需要大量的人力和深厚的业务知识。这套 dataset 对于可靠地衡量管道性能至关重要。.

我们的首要目标并不是一开始就达到完美的准确性。相反,我们专注于创建一个功能性管道,以提供 预注释文本 人类标注者。这大大加快了标注过程,使未来对专门模型的微调更加高效。.

我们创新的两阶段模式

为了解决 NER 和 NEL 问题,我们开发了一个强大的两阶段管道

两级 NER/NEL 管道

1.命名实体识别(NER):发现候选实体

这一阶段使用 LLM 识别 DIY 文章中相关实体的提及。我们使用 文本分块 长文章被分割成易于管理的字块(500 字),以保证 LLM 上下文的一致性和更好的性能。我们的 NER 流程采用双层策略:

  • 地方实体: 对于特定语境中的提及,每个 500 字的词块都要经过两次提取,以进行细化(例如,在"...... 思维链 )使用 LLM。然后将所有数据块的结果进行合并。.
  • 全球实体: 对于首要主题,则对全文进行处理(再次使用 LLM 进行双重提取),以实现全面覆盖。.

这种双层方法确保我们既能有效捕捉细微细节,又能捕捉广泛概念。.

2.命名实体链接(NEL):连接知识图谱的点

提取实体后,NEL 会对其进行消歧并将其链接到最相关的知识图谱条目。这包括

🤝 候选人产生

对于每个提取的实体,我们都会使用向量存储和文本嵌入从 KG 中生成潜在的匹配项。我们只保留语义最相似的候选实体。我们使用 GCP 文本-多语种-嵌入-002 为完成这项任务,该模型使用了 database 向量。.

为了说明这一点,试想一下,NER 阶段从文本片段中提取候选实体 “轻便帆布手套”:

“[......]您可以选择 轻便帆布手套. 如果你用手在土壤中劳作[......]”。.

在候选词生成步骤中,系统根据语义相似性从知识图谱中检索潜在的匹配词。这可能会产生一个排序的候选列表,如 “一次性手套”(排名 1)、“工作手套”(排名 2)、...、“园艺手套”(排名 9)和 “玻璃处理手套”(排名 10)等。.

🧠 语义重排

入围候选者将由一名法学硕士通过分析文章中实体的上下文进行重新排序。只有匹配度最高的才能继续。我们发现 25 个候选者是重新排序的最佳数量。.

继续我们的例子,LLM 现在会分析周围的文字“......如果你用手在土壤中工作......”,并利用这一上下文对候选词进行重新排序。由于提到了在土壤中工作,“园艺手套 ”很可能会作为语义最相关的候选词被提升到列表的首位。.

🌳 分层排序

被选中的候选者会被置于 KG 的层级结构中。另一个 LLM 可以保留该候选者,或根据上下文用更合适的父辈、子辈或同辈候选者取而代之。分层重排阈值为 100,可确保考虑到整个分层结构。.

下面是知识图谱中的简化层次结构:

在这一步中,系统会验证 “园艺手套 ”是否是最合适的特异性级别。在我们的例子中,“园艺手套 ”与 "园艺手套 "的匹配度很高,但如果上下文更宽泛,只是提到需要保护手部,而没有园艺的上下文,那么分级排序可能会提升祖先实体 "手套",并将其链接到相应的 KG 条目。.

这种多步骤的 NEL 流程可确保在知识图谱中进行准确而有意义的锚定。.

衡量成功:我们的评估方法

为了确保我们的知识图谱充实管道在 Leroy Merlin 的 DIY 文章中的有效性,我们针对精心构建的知识图谱进行了稳健的评估。 地面实况 dataset 包含 Adeo 知识图谱中的实体。.

本次评估特别关注管道识别和链接四个关键实体类别的能力:ProductSet、HomeSpace、DIYActivity 和 Color:

  1. 产品套装: 这些是用于家装、园艺或 DIY 任务的工具、材料或可购买的产品。. 实例:混凝土打磨机、空气热泵、园艺围裙、台灯、智能恒温器
  2. 家庭空间: 这些区域或房间代表了家庭或花园中通常进行 DIY 活动的区域或房间。. 实例:车库、花园、厨房、浴室、阳台
  3. DIY 活动: 这些都是与自己动手和家庭装修有关的任务或操作。. 实例:油漆、安装、清洁、园艺、绝缘工作
  4. 颜色 这一类包括任何提及的颜色或色调。. 实例:乳白色、淡蓝色、浅灰色、哑黑色、亮黄色

评估整个管道(NER 和 NEL)

我们采用以下方法评估总体绩效:

  • 精确: 正确识别和链接的实体/全部识别和链接。.
  • 召回: 正确识别和链接实体/所有实际实体。.
  • F1 得分 精确度和召回率的平衡度量。.
  • 模糊匹配度量(距离 1、2、3): 我们根据错误与真实标签之间的分级距离对错误进行评分:距离 1 代表直邻,距离 2 代表下一级,等等。如果错误的预测在允许的半径范围内,则仍可 “通过”,从而更公平地捕捉近似错误。.

使用模糊指标进行评估

评估 NER: 我们将提取的有词干实体与有词干的地面实况(不区分大小写)进行了比较。我们的 NER 故意过度提取,以获得高召回率。.

评估 NEL: 假设有完美的 NER,我们使用与完整管道相同的指标(包括模糊匹配),重点关注链接过程的准确性。.

主要发现:有希望的成果和增长领域

以下是我们管道的性能指标

完整管道(精确匹配)

NER/NEL 管道的性能指标(精确匹配)

  • 全球实体: 精确度高,召回率低(平衡 F1)。.
  • 地方实体: 性能各异。. 产品套装 (关键类别)显示出稳固的平衡(精确度:58.9%,召回率:61.74%,F1:60.29%)。. 颜色 也表现出色。. 家庭空间 需要提高精确度。.

完整管道(模糊匹配)

使用不同模糊指标的性能

随着距离的增加,模糊度量也有明显改善。这清楚地表明,在精确匹配中被认为不正确的预测,在图层次结构中仍然相对接近实际值。.

NER:

不出所料,我们取得了 高召回率 但由于我们的过度提取策略,精度较低。.

NEL:

NEL 部分有效 精细的实体连接 NER 之后的🔗。.

总结:打造更智能的 DIY 生态系统

该项目标志着乐华梅兰公司在利用人工智能丰富网站DIY体验方面迈出了重要一步。通过成功建立将 DIY 文章链接到 Adeo 知识图谱的管道,我们为更智能的搜索、个性化推荐和更丰富的内容奠定了基础。.

虽然初步结果很不错(尤其是 ProductSet),但我们也发现了需要优化的地方,比如提高 HomeSpace 的精度。我们决定使用 LLMs 进行快速初始注释,这是一个非常有价值的策略,它可以加速 data 的生成,以便将来进行模型训练和改进。.

Adeo、谷歌和 Artefact 之间的持续合作将继续推动零售创新。这项知识图谱丰富化计划展示了将专业领域知识与尖端人工智能相结合,为 DIY 爱好者创造更直观、更有价值体验的力量。随着我们的产品线进一步完善,并可能推出 Gemini 2.5 Pro 等更先进的型号,内容与知识之间的联系只会不断加强,从而进一步增强乐华梅兰客户在家装过程中的能力。.