Mientras reflexionamos sobre las ideas compartidas durante el ‘Día de la Nieve’ celebrado los días 1 y 2 de noviembre, nos espera una cascada de emocionantes revelaciones sobre el futuro de Copo de Nieve.

Este artículo se sumerge en las notables características científicas del data desveladas durante el evento, arrojando luz sobre la innovación y los avances que ocuparon el centro del escenario.

Acompáñenos en este viaje mientras desentrañamos los aspectos más destacados del Snowdays, con especial atención a las últimas novedades científicas del data, como:

Lo más destacado del córtex copo de nieve

Una visión general de las capacidades de GenAI y LLM en Snowflake

Capacidades del Modelo de Lenguaje (LLM) (algunos modelos son públicos mientras que otros aún están en vista previa privada)

Los LLM son un nuevo tipo de modelo de IA que puede generar texto, traducir idiomas, escribir distintos tipos de contenidos creativos y responder a sus preguntas de forma informativa. Las nuevas capacidades LLM de Snowflake lo convierten en uno de los primeros cloud data platforms en ofrecer a los usuarios acceso a esta nueva y potente tecnología.

Esto diferencia a Snowflake de otros cloud data platforms porque proporciona a los usuarios de Snowflake una ventaja significativa en términos de desarrollo de aplicaciones de IA. Con Snowflake Cortex, los usuarios pueden ahora crear fácilmente aplicaciones de IA capaces de realizar una amplia gama de tareas, como generar reports, identificar fraudes y predecir el comportamiento de los clientes.

He aquí algunos casos de uso específicos de las capacidades LLM de Snowflake:

  • Detección de sentimientos: Analice los comentarios de los clientes, las interacciones en las redes sociales o las reseñas de productos para comprender el sentimiento general e identificar áreas de mejora. (Encontrará más información en Comandos SQL para el análisis y el resumen del sentimiento (en vista previa privada)).

  • Resumir textos: Genere resúmenes concisos de documentos extensos, correos electrónicos o reports para captar rápidamente la información clave y ahorrar tiempo. (Encontrará más información en Comandos SQL para el análisis de sentimientos y la elaboración de resúmenes (en vista previa privada).

  • Traducción: ¿Necesita traducir los valores de una columna específica durante sus transformaciones? No hay necesidad de recurrir a una API externa; puede realizar la traducción sin problemas dentro de Snowflake.

Funciones de búsqueda avanzadas (en vista previa privada)

Lo nuevo de Snowflake funciones avanzadas de búsqueda facilitan más que nunca que los usuarios encuentren el data que necesitan, independientemente de dónde esté almacenado. Esto supone una gran ventaja frente a otros cloud data platforms, que suelen tener capacidades de búsqueda más limitadas.

En concreto, las nuevas funciones de búsqueda de Snowflake permiten a los usuarios:

  • Busque en databases, tablas Iceberg, data dentro de Snowflake, aplicaciones nativas y el Snowflake Marketplace.

  • Utilice consultas en lenguaje natural para buscar data.

  • Filtre los resultados de la búsqueda por diversos criterios, como el tipo de data, el tamaño del archivo y la fecha de creación.

Estas funciones de búsqueda avanzada pueden ayudar a los usuarios a ahorrar tiempo y ser más productivos cuando trabajan con data. Por ejemplo, un analista de data podría utilizar las nuevas funciones de búsqueda para encontrar rápidamente todo el data que sea relevante para un proyecto de análisis específico. O bien, un usuario empresarial podría utilizar las nuevas funciones de búsqueda para encontrar todo el data relacionado con un cliente o producto específico.

Por no mencionar que el uso de los diferentes filtros de copo de nieve que proporcionan estas funciones de búsqueda (denominación de columnas, etiquetado, especificación metadata) induce un aumento de la coherencia data.

En conclusión, cabe destacar que esto aborda un aspecto clave de los catálogos data. Dados los retos inherentes a la implantación de un catálogo data, aprovechar esta función integrada en Snowflake resulta especialmente convincente.

Comandos SQL para el análisis y resumen de sentimientos (en vista previa privada)

Los nuevos comandos SQL de Snowflake para el análisis de sentimientos y el resumen facilitan a los usuarios la extracción de información de su data sin tener que aprender nuevas herramientas o lenguajes. Esto supone una gran ventaja con respecto a otros cloud data platforms, que normalmente requieren que los usuarios utilicen herramientas independientes para estas tareas.

En concreto, los nuevos comandos SQL de Snowflake permiten a los usuarios:

  • Analizar el sentimiento de un texto data, como las opiniones de los clientes, las publicaciones en las redes sociales y las respuestas a encuestas.

  • Resumir texto data para extraer la información más importante.

Estos nuevos comandos SQL pueden ayudar a los usuarios a ahorrar tiempo y ser más productivos cuando trabajan con data. Por ejemplo, un usuario empresarial podría utilizar los nuevos comandos SQL para analizar rápidamente el sentimiento de las opiniones de los clientes o para resumir un informe largo y complejo.

Copiloto Snowflake (en vista previa privada)

Es un Asistente potenciado por LLM para generar y refinar SQL con lenguaje natural. Además, esta funcionalidad de texto a código llegará pronto de forma programática a través de una función de propósito general, Text2SQL, con Snowflake Cortex.

Extracción del documento Data con la IA del documento (en vista previa privada)

La IA documental de Snowflake Cortex, impulsado por LLM permite una extracción eficaz de data a partir de diversos tipos de documentos (pdf, word, txt, capturas de pantalla), ahorrando tiempo y recursos en el procesamiento manual de data.

En general, las nuevas funciones de Snowflake son muy impresionantes y tienen el potencial de revolucionar la forma en que la gente utiliza cloud data platforms.

Snowflake se está diferenciando claramente de la competencia al ofrecer funciones innovadoras que facilitan a los usuarios el desarrollo y despliegue de aplicaciones de IA, la búsqueda de data, la gestión de funciones ML y el uso compartido de modelos ML. Snowflake también está facilitando a los usuarios la extracción de información de su data sin tener que aprender nuevas herramientas o lenguajes.

Tienda de características (en vista previa privada)

A tienda de características es un repositorio central para gestionar y compartir características de aprendizaje automático. El nuevo almacén de características de Snowflake facilita a los usuarios el desarrollo y despliegue de modelos de ML.

Esto diferencia a Snowflake de otros cloud data platforms porque proporciona a los usuarios un único lugar para gestionar todas sus funciones de ML. Esto puede ayudar a los usuarios a ahorrar tiempo y mejorar la eficacia de su proceso de desarrollo de ML.

He aquí algunos casos de uso específicos de la tienda de características de Snowflake:

  • Un científico data podría utilizar el almacén de funciones para gestionar y compartir las funciones que están utilizando para desarrollar un modelo de aprendizaje automático. Para más información sobre este tema, puede dirigirse a aquí.

  • Un ingeniero de aprendizaje automático podría utilizar el almacén de características para desplegar un modelo de aprendizaje automático en producción y asegurarse de que tiene acceso a las características que necesita. Para más información sobre este tema, puede dirigirse a aquí.

  • Un usuario empresarial podría utilizar el almacén de funciones para explorar y comprender las características que se están utilizando para potenciar sus aplicaciones de aprendizaje automático. Para más información sobre este tema, puede dirigirse a aquí.

Reparto de modelos

La capacidad de Snowflake para compartir modelos de ML es también un diferenciador importante. Esto facilitará la colaboración en proyectos de ML y democratizará el acceso al ML.

En concreto, Snowflake permite a los usuarios compartir modelos de ML con otros, tanto dentro como fuera de su organización. Esto puede ayudar a acelerar el desarrollo y la adopción de aplicaciones de ML.

He aquí algunos casos de uso específicos de la capacidad de compartir modelos de Snowflake:

  • Un científico data podría compartir un modelo de aprendizaje automático con un usuario empresarial para que puedan utilizarlo para explorar su data y generar ideas.

  • Un ingeniero de aprendizaje automático podría compartir un modelo de aprendizaje automático con un ingeniero DevOps para que puedan desplegarlo en producción.

  • Un proveedor de software podría compartir un modelo de aprendizaje automático con sus clientes de modo que puedan utilizarla para mejorar sus productos y servicios.

Cuadernos Snowflake (en vista previa privada)

Cuadernos de copos de nieve, un entorno basado en cloud diseñado específicamente para el desarrollo y la ejecución de código, comparten similitudes con los cuadernos que están disponibles desde hace varios años en otros cloud data platforms. Databricks fue el pionero en este campo, y BigQuery le siguió con su anuncio el 31 de agosto. Estos portátiles están cuidadosamente diseñados para optimizar el rendimiento dentro del ecosistema Snowflake.

Los Snowflake Notebooks ofrecen una serie de ventajas con respecto a los IDE tradicionales, como:

  • Colaboración: Los cuadernos Snowflake son fáciles de compartir con otras personas, lo que facilita la colaboración en los proyectos.

  • Interactividad: Los cuadernos Snowflake son interactivos, por lo que puede experimentar con su código y ver los resultados inmediatamente.

  • Rendimiento: Los cuadernos Snowflake ofrecen un alto rendimiento, por lo que podrá ejecutar consultas y análisis complejos con rapidez.

Los Snowflake Notebooks se encuentran actualmente en fase beta, pero se espera que se lancen al público general en un futuro próximo.

Lo que diferencia a Snowflake como entorno de desarrollo de aprendizaje automático de otros es el hecho de que consta de API de Python accesibles a través de la biblioteca Snowpark ML, e interfaces SQL para definir, gestionar y recuperar características, junto con una infraestructura gestionada para la metadata gestión de características y el procesamiento continuo de características. Esto elimina la necesidad de conocimientos especializados en IA. Además, el almacén de características y las funciones de intercambio de modelos permiten a Snowflake ponerse a la altura de sus competidores de forma más eficaz, en concreto de Databricks, que obviamente ha llevado la delantera en los últimos dos años gracias a su integración con ML Flow.

Conclusión

La presentación de nuevas funciones por parte de Snowflake, como Snowflake Cortex, Copilot, Document AI y los ordenadores portátiles, afirma el compromiso de la empresa con la innovación. Aunque los anuncios científicos de la data se alinean con las tendencias actuales de la GenAI, es imprescindible abordarlos con cautela. Cabe destacar que ciertas funciones, aunque anunciadas hace tiempo, aún están pendientes de disponibilidad universal en todos los entornos. Por último, acerquémonos a estas innovaciones con la mente abierta y un optimismo cauteloso, dispuestos a abrazar las posibilidades sin perder de vista la realidad.

Medio Blog por Artefact.

Este artículo se publicó inicialmente en Medium.com.
¡Síganos en nuestro Medium Blog !