Ao refletirmos sobre os insights compartilhados durante o evento ‘Snowday’ nos dias 1º e 2 de novembro, uma cascata de revelações empolgantes sobre o futuro do Snowflake nos aguarda.

Este artigo analisa os notáveis recursos científicos do data revelados durante o evento, esclarecendo as inovações e os avanços que ocuparam o centro do palco.

Junte-se a nós nessa jornada enquanto desvendamos os destaques do Snowdays, com foco específico nos recursos científicos mais recentes do data, como o senhor:

Destaques do Snowflake Cortex

Uma visão geral dos recursos de GenAI e LLM no Snowflake

Recursos do Language Model (LLM) (alguns modelos são públicos, enquanto outros ainda estão em visualização privada)

Os LLMs são um novo tipo de modelo de IA que pode gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder às suas perguntas de forma informativa. Os novos recursos de LLM do Snowflake fazem dele um dos primeiros cloud data platforms a oferecer aos usuários acesso a essa nova e poderosa tecnologia.

Isso diferencia o Snowflake de outros cloud data platforms porque oferece aos usuários do Snowflake uma vantagem significativa em termos de desenvolvimento de aplicativos de IA. Com o Snowflake Cortex, os usuários agora podem criar facilmente aplicativos de IA que podem executar uma ampla gama de tarefas, como gerar reports, identificar fraudes e prever o comportamento do cliente.

Aqui estão alguns casos de uso específicos dos recursos de LLM da Snowflake:

  • Detecção de sentimentos: Analise os feedbacks dos clientes, as interações nas mídias sociais ou as avaliações de produtos para entender o sentimento geral e identificar áreas de melhoria. (Mais detalhes são fornecidos nos comandos SQL para análise e resumo de sentimentos (em visualização privada).

  • Sumarização de texto: Gere resumos concisos de documentos, e-mails ou reports extensos para captar rapidamente as principais informações e economizar tempo. (Mais detalhes são fornecidos em comandos SQL para análise de sentimento e resumo (em visualização privada).

  • Tradução: O senhor precisa de tradução para os valores em uma coluna específica durante suas transformações? Não há necessidade de entrar em contato com uma API externa; o senhor pode realizar a tradução sem problemas dentro do Snowflake.

Recursos de pesquisa avançada (em visualização privada)

O novo Snowflake recursos avançados de pesquisa tornam mais fácil do que nunca para os usuários encontrarem o data de que precisam, independentemente de onde ele esteja armazenado. Essa é uma grande vantagem em relação a outros cloud data platforms, que normalmente têm recursos de pesquisa mais limitados.

Especificamente, os novos recursos de pesquisa do Snowflake permitem que os usuários:

  • Pesquise em databases, tabelas Iceberg, data dentro do Snowflake, aplicativos nativos e o Snowflake Marketplace.

  • Uso consultas em linguagem natural para procurar por data.

  • Filtrar os resultados da pesquisa por uma variedade de critérios, O senhor pode obter informações sobre o tipo de arquivo, como o tipo data, o tamanho do arquivo e a data de criação.

Esses recursos avançados de pesquisa podem ajudar os usuários a economizar tempo e ser mais produtivos ao trabalhar com o data. Por exemplo, um analista de data pode usar os novos recursos de pesquisa para encontrar rapidamente todo o data que seja relevante para um projeto de análise específico. Ou um usuário comercial poderia usar os novos recursos de pesquisa para encontrar todo o data relacionado a um cliente ou produto específico.

Sem mencionar que o uso dos diferentes filtros snowflake fornecidos por esses recursos de pesquisa (nomeação de colunas, marcação, especificação metadata) induz a um aumento na consistência do data.

Para concluir, vale a pena observar que isso aborda um aspecto fundamental dos catálogos data. Considerando os desafios inerentes à implementação de um catálogo data, o aproveitamento desse recurso integrado do Snowflake torna-se particularmente atraente.

Comandos SQL para análise e resumo de sentimentos (em visualização privada)

Os novos comandos SQL do Snowflake para análise e resumo de sentimentos facilitam para os usuários a extração de insights de seu data sem a necessidade de aprender novas ferramentas ou linguagens. Essa é uma grande vantagem em relação a outros cloud data platforms, que normalmente exigem que os usuários usem ferramentas separadas para essas tarefas.

Especificamente, os novos comandos SQL do Snowflake permitem que os usuários:

  • Analisar o sentimento do texto data, O senhor pode usar os dados de seus clientes, como avaliações de clientes, publicações em mídias sociais e respostas a pesquisas.

  • Resumir o texto data para extrair as informações mais importantes.

Esses novos comandos SQL podem ajudar os usuários a economizar tempo e ser mais produtivos ao trabalhar com o data. Por exemplo, um usuário comercial pode usar os novos comandos SQL para analisar rapidamente o sentimento das avaliações dos clientes ou para resumir um relatório longo e complexo.

Snowflake Copilot (em visualização privada)

É um Assistente com tecnologia LLM para gerar e refinar SQL com linguagem natural. Além disso, essa funcionalidade de texto para código será disponibilizada em breve de forma programática por meio de uma função de uso geral, Text2SQL, com o Snowflake Cortex.

Extração do documento Data com Document AI (em visualização privada)

IA de documentos do Snowflake Cortex, O software de extração de dados data, desenvolvido pelo LLM, permite a extração eficiente do data de vários tipos de documentos (pdf, word, txt, capturas de tela), economizando tempo e recursos no processamento manual do data.

Em geral, os novos recursos do Snowflake são muito impressionantes e têm o potencial de revolucionar a maneira como as pessoas usam o cloud data platforms.

A Snowflake está claramente se diferenciando da concorrência ao oferecer recursos inovadores que facilitam aos usuários o desenvolvimento e a implantação de aplicativos de IA, a localização do data, o gerenciamento de recursos de ML e o compartilhamento de modelos de ML. A Snowflake também está facilitando para os usuários a extração de insights de seu data sem precisar aprender novas ferramentas ou idiomas.

Loja de recursos (em visualização privada)

A loja de recursos é um repositório central para gerenciar e compartilhar recursos de aprendizado de máquina. O novo armazenamento de recursos do Snowflake facilita aos usuários o desenvolvimento e a implantação de modelos de ML.

Isso diferencia o Snowflake de outros cloud data platforms porque oferece aos usuários um único local para gerenciar todos os seus recursos de ML. Isso pode ajudar os usuários a economizar tempo e melhorar a eficiência do processo de desenvolvimento de ML.

Aqui estão alguns casos de uso específicos para a loja de recursos da Snowflake:

  • Um cientista do data poderia usar o armazenamento de recursos para gerenciar e compartilhar os recursos que eles estão usando para desenvolver um modelo de aprendizado de máquina. Para obter mais informações sobre esse assunto, o senhor pode acessar aqui.

  • Um engenheiro de aprendizado de máquina poderia usar o armazenamento de recursos para implantar um modelo de aprendizado de máquina na produção e garantir que ele tenha acesso aos recursos necessários. Para obter mais informações sobre esse assunto, o senhor pode acessar aqui.

  • Um usuário corporativo pode usar o feature store para explorar e compreender os recursos que estão sendo usados para potencializar seus aplicativos de aprendizado de máquina. Para obter mais informações sobre esse assunto, o senhor pode acessar aqui.

Compartilhamento de modelos

A capacidade do Snowflake de compartilhar modelos de ML também é um diferencial importante. Isso facilitará a colaboração entre as pessoas em projetos de ML e democratizará o acesso ao ML.

Especificamente, o Snowflake permite que os usuários compartilhem modelos de ML com outras pessoas, dentro e fora da organização. Isso pode ajudar a acelerar o desenvolvimento e a adoção de aplicativos de ML.

Aqui estão alguns casos de uso específicos do recurso de compartilhamento de modelos do Snowflake:

  • Um cientista data poderia compartilhar um modelo de aprendizado de máquina com um usuário comercial para que possam usá-lo para explorar seu data e gerar insights.

  • Um engenheiro de aprendizado de máquina poderia compartilhar um modelo de aprendizado de máquina com um engenheiro de DevOps para que possam implantá-lo na produção.

  • Um fornecedor de software poderia compartilhar um modelo de aprendizado de máquina com seus clientes para que possam usá-lo para melhorar seus produtos e serviços.

Snowflake Notebooks (em visualização privada)

Cadernos Snowflake, O Databricks, um ambiente baseado no cloud projetado especificamente para desenvolvimento e execução de código, compartilha semelhanças com notebooks que estão disponíveis há vários anos em outros cloud data platforms. O Databricks foi o pioneiro nesse campo, e o BigQuery seguiu o exemplo com seu anúncio em 31 de agosto. Esses notebooks foram cuidadosamente projetados para otimizar o desempenho dentro do ecossistema Snowflake.

Os Snowflake Notebooks oferecem várias vantagens em relação aos IDEs tradicionais, tais como:

  • Colaboração: Os Snowflake Notebooks são fáceis de compartilhar com outras pessoas, o que facilita a colaboração em projetos.

  • Interatividade: Os Snowflake Notebooks são interativos, de modo que o senhor pode fazer experiências com seu código e ver os resultados imediatamente.

  • Desempenho: Os Snowflake Notebooks têm alto desempenho, de modo que o senhor pode executar consultas e análises complexas rapidamente.

Os Snowflake Notebooks estão atualmente em fase beta, mas espera-se que sejam lançados para o público em geral em um futuro próximo.

O que diferencia o Snowflake como um ambiente de desenvolvimento de Machine Learning de outros é o fato de que ele consiste em APIs Python acessíveis por meio da biblioteca ML do Snowpark e interfaces SQL para definir, gerenciar e recuperar recursos, juntamente com a infraestrutura gerenciada para o gerenciamento de metadata de recursos e o processamento contínuo de recursos. Isso elimina a necessidade de conhecimento especializado em IA. Além disso, o Feature Store e os recursos de compartilhamento de modelos capacitam a Snowflake a se equiparar de forma mais eficaz aos seus concorrentes, especificamente a Databricks, que obviamente teve vantagem nos últimos anos devido à sua integração com o ML Flow.

Conclusão

A revelação de novos recursos pela Snowflake, incluindo Snowflake Cortex, Copilot, Document AI e notebooks, confirma o compromisso da empresa com a inovação. Embora os anúncios científicos do data estejam alinhados com as tendências atuais da GenAI, é imperativo abordá-los com cautela. Vale ressaltar que certos recursos, embora anunciados há muito tempo, ainda estão pendentes de disponibilidade universal em todos os ambientes. Por fim, vamos abordar essas inovações com a mente aberta e um otimismo cauteloso, prontos para abraçar as possibilidades e, ao mesmo tempo, nos atermos à realidade.

Média Blog por Artefact.

Este artigo foi publicado inicialmente no Medium.com.
Siga-nos em nosso Medium Blog !