当我们回顾11月1日至2日“Snowday”活动期间分享的见解时,关于Snowflake未来的诸多令人振奋的发现正等待着我们。
本文深入探讨了此次活动中发布的值得关注的数据科学功能,揭示了备受瞩目的创新与进展。
欢迎加入我们的旅程,共同探索“Snowdays”大会的精彩亮点,我们将重点介绍数据科学领域的最新特性,例如:
Snowflake Cortex 亮点

Snowflake 中生成式人工智能 (GenAI) 和大型语言模型 (LLM) 功能的概述
语言模型(LLM)功能(部分模型已公开发布,其余仍处于私有预览阶段)
大型语言模型(LLM)是一种新型人工智能模型,能够生成文本、进行语言翻译、创作各类创意内容,并以富有信息量的方式回答您的问题。Snowflake 的新型 LLM 功能使其成为首批为用户提供这项强大新技术访问权限cloud 平台之一。
这使 Snowflake 区别于cloud 平台,因为它为 Snowflake 用户在开发 AI 应用程序方面提供了显著优势。借助 Snowflake Cortex,用户现在可以轻松构建能够执行多种任务的 AI 应用程序,例如生成报告、识别欺诈行为以及预测客户行为。
以下是 Snowflake 大型语言模型(LLM)功能的一些具体应用场景:
高级搜索功能(私有预览版)
Snowflake的新高级搜索功能让用户比以往任何时候都更容易找到所需的数据,无论这些数据存储在何处。相比之下,其他cloud 搜索功能通常较为有限,这正是 Snowflake 的显著优势。
具体来说,Snowflake 的新搜索功能允许用户:
这些高级搜索功能可帮助用户在处理数据时节省时间并提高工作效率。例如,数据分析师可以利用这些新搜索功能快速查找与特定分析项目相关的所有数据;或者,业务用户可以利用这些新搜索功能查找与特定客户或产品相关的所有数据。
更不用说,利用这些搜索功能提供的各种筛选条件(列命名、标签、元数据规范)还能提高数据的一致性。
总而言之,值得注意的是,这解决了数据目录的一个关键方面。鉴于实施数据目录本身面临的挑战,利用这一 Snowflake 集成功能显得尤为重要。

用于情感分析和摘要生成的 SQL 命令(私有预览版)
Snowflake 推出的用于情感分析和摘要生成的全新 SQL 命令,让用户能够轻松从数据中提取洞察,而无需学习任何新工具或语言。相比之下,cloud 通常要求用户使用独立工具来完成这些任务,这正是 Snowflake 的显著优势。
具体来说,Snowflake 的新 SQL 命令允许用户:
这些新的 SQL 命令有助于用户在处理数据时节省时间并提高工作效率。例如,业务用户可以利用这些新的 SQL 命令快速分析客户评论的情感倾向,或对冗长复杂的报告进行摘要。
Snowflake Copilot(私有预览版)
这是一个基于大语言模型(LLM)的助手,能够通过自然语言生成和优化 SQL 语句。此外,这项文本转代码功能即将通过 Snowflake Cortex 中的通用函数 Text2SQL 以编程方式实现。

使用 Document AI 进行文档数据提取(私有预览版)
Snowflake Cortex 的 Document AI 基于大型语言模型(LLM)技术,能够高效地从各类文档(PDF、Word、TXT、截图)中提取数据,从而节省人工数据处理所需的时间和资源。
总体而言,Snowflake 的新功能令人印象深刻,有望彻底改变人们使用cloud 平台的方式。
Snowflake 通过提供创新功能,让用户能够更轻松地开发和部署 AI 应用程序、查找数据、管理机器学习特征以及共享机器学习模型,从而在竞争中脱颖而出。此外,Snowflake 还让用户能够更轻松地从数据中提取洞察,而无需学习任何新的工具或语言。

特征存储库(私有预览版)
特征库是用于管理和共享机器学习特征的中央存储库。Snowflake 的新特征库让用户能够更轻松地开发和部署机器学习模型。
这使 Snowflake 区别于cloud 平台,因为它为用户提供了一个集中管理所有机器学习功能的一站式平台。这有助于用户节省时间,并提高机器学习开发流程的效率。
以下是 Snowflake 特征库的一些具体应用场景:
模型共享
Snowflake 共享机器学习模型的能力也是一大核心优势。这将使人们更容易在机器学习项目上进行协作,并让更多人能够接触到机器学习技术。
具体来说,Snowflake 允许用户与组织内部及外部的其他人共享机器学习模型。这有助于加快机器学习应用程序的开发和应用。
以下是 Snowflake 模型共享功能的一些具体应用场景:
Snowflake Notebooks(处于私有预览阶段)
Snowflake Notebooks 是一款专为代码开发和执行而cloud,cloud 已存在数年的笔记本工具具有相似之处。Databricks 是该领域的先驱,BigQuery 则于 8 月 31 日跟进推出了类似功能。这些笔记本经过精心设计,旨在优化 Snowflake 生态系统内的性能。
与传统的集成开发环境(IDE)相比,Snowflake Notebooks 具有诸多优势,例如:
Snowflake Notebooks 目前处于测试阶段,但预计将在不久的将来向公众发布。
作为机器学习开发环境,Snowflake 与其他平台的区别在于:它不仅包含可通过 Snowpark ML 库访问的 Python API,还提供了用于定义、管理和检索特征的 SQL 接口,以及用于特征元数据管理和持续特征处理的托管基础设施。这使得用户无需具备专业的 AI 专业知识。 此外,特征存储库和模型共享功能使 Snowflake 能够更有效地追赶竞争对手,尤其是 Databricks——后者凭借与 ML Flow 的集成,在过去几年中显然占据了优势。

结论
Snowflake 推出的新功能,包括 Snowflake Cortex、Copilot、Document AI 和笔记本,彰显了该公司对创新的承诺。尽管这些数据科学领域的公告契合当前生成式人工智能(GenAI)的趋势,但我们必须持谨慎态度对待。值得注意的是,某些功能虽然早已发布,但至今仍未在所有环境中全面上线。 最后,让我们以开放的心态和审慎的乐观态度看待这些创新,在脚踏实地的同时,做好拥抱无限可能的准备。

博客





