由 Data 科学家和 Artefact 软件工程师组成的四支团队是 MLOps 技术的专家,他们与来自世界各地的同行展开竞争,并赢得了这场为期两周的国际黑客马拉松比赛,其目标是利用 arXiv 学术论文 dataset 开发矢量搜索解决方案。.

首个矢量搜索工程实验室 黑客马拉松 于 2022 年 10 月 24 日至 11 月 4 日举行。这次黑客马拉松活动由 MLOps 社区, Redis, 英伟达™ Inception土星云 并以矢量搜索为中心,使用 arXiv 学术论文 dataset.矢量搜索是一种通过大量矢量嵌入进行索引和搜索的方法,以找到与给定(矢量化)查询最近的邻域。.

虽然有 20 个团队的 88 名参赛者参加了比赛,但只有 12 个团队成功完成了参赛作品。获胜者不仅赢得了荣誉,还获得了现金奖励、英伟达产品、博客文章和赞助商礼品。您可以在网站 mlops.community 博客.

第 1 名 该奖项由创意命名为 团队 Hackunamadata, 由 Artefactors Ali Bellamlih Mamou、Pol de Font-Réaulx、Benoit Bazouin 和 Hadrien DAURES 组成。他们的获奖作品是 “arXiv Copilot”,这是一款面向学生或学术论文或评论作者的搜索助手。作为谷歌文档的 Chrome 浏览器扩展,afXiv Copilot 实时推荐与用户输入内容相关的已发表文章链接。搜索选项包括字数、文本发送深度以及按年份和类别收集文本。引擎返回的推荐链接可以保存并在以后参考--例如,对于在课堂上做笔记的学生来说非常有用。您可以观看他们的 演示 了解更多他们的获奖创意。.

第二名 去了 AreYouRedis 团队, 其成员包括 Ariel Eddie Guidi、Armand Kouyoumdjian、Robin Doumerc 和 Youssef Moutaouakil Oudghiri。他们的 “达尔文论文资源管理器 ”是一款搜索应用软件,不仅能按主题查找特定主题的论文,还能按年与年之间的演变查找论文(因此而得名),甚至能根据发表论文的数量预测未来趋势;该应用软件还能根据主题相似性的顺序推荐阅读清单。观看视频 这里.

另外两个 Artefact 团队也获得了表彰:

  • 由 Henrique Brito、Tom Darmon、Michel Hua 和 Corentin Roineau 组成的 THM 团队凭借 THM CLI 概念荣获四等奖。逐日阅读 博客;
  • RedisPlayerOne 团队(Hugo Vasselin、Amale El Hamri、Karim Si Larbi 和 Sacha Lasry)的 “AskYves ”搜索引擎获得六等奖。观看他们的 演示.
“只有最优秀的 data 科学家和软件工程师才能参加这一要求极高的学科竞赛、,
Vincent Luciani,Artefact 联合创始人兼首席执行官。.

每个团队面临的挑战是利用 arXiv 论文 datasets 和 Redis 作为内存矢量 database 来创建一个创新、实用的矢量搜索引擎,从而创造真正的商业价值。“我们的 MLOps 专业知识 Artefact 公司的 ML 工程师 Robin Doumerc 说:”我们每天都在工作中实践这种创新。.

参赛作品的评判标准包括技术能力、"哇 "的因素(创意+独特性)、所需技术的使用(Redis 云、Saturn 云......)以及文档质量+清晰度。参赛团队必须能够利用各种工具和技术,包括

  • 向量相似性搜索

  • NLP

  • 文本挖掘

  • 知识图谱

  • 文件检索

  • 主题识别

  • 问答

  • 推荐系统

  • Data 可视化。.

巴黎的 MLOps 社区正在不断发展壮大,来自全球各地的 ML 专家可以在这里分享来自实际领域的机器学习运营最佳实践。其中一个最重要的主题涉及将机器学习模型投入生产并使其长期保持健康的问题。.

2022 年 6 月、, Amale El Hamri, Artefact 的 ML 工程师经理在与迪卡侬合作举办的 MLOps 世界 在多伦多举行的活动上,他谈到了如何利用 MLOps 原则,通过预测营业额来更好地开展业务。.

作为 data 和人工智能领域的专家,Artefact 日益关注 MLOps 和 ML 工程。作为这一重点的一部分,Artefact 在 MLOps 社区中发挥着更大的作用,与以下机构开展合作 MLOps 巴黎聚会社区 在会议中,这将提高当地专家在该领域的知名度,并加强我们作为一家在 ML 项目产业化方面具有专长的公司的形象。.