Mientras reflexionamos sobre las ideas compartidas durante el "Día de la Nieve" del 1 y 2 de noviembre, nos espera una cascada de emocionantes revelaciones sobre el futuro de Snowflake.

En este artículo se analizan las características científicas más destacadas de data que se presentaron durante el evento y se arroja luz sobre la innovación y los avances que ocuparon un lugar central.

Acompáñenos en este viaje mientras desentrañamos lo más destacado de Snowdays, con especial atención a las últimas novedades científicas de data , como:

Aspectos destacados de Snowflake Cortex

class="img-responsive

Visión general de las capacidades de GenAI y LLM en Snowflake

Capacidades del Modelo de Lenguaje (LLM) (algunos modelos son públicos, mientras que otros aún están en fase de previsualización privada).

Los LLM son un nuevo tipo de modelo de AI capaz de generar texto, traducir idiomas, redactar distintos tipos de contenidos creativos y responder a sus preguntas de forma informativa. Las nuevas capacidades LLM de Snowflake la convierten en una de las primeras plataformas data en la nube en ofrecer a los usuarios acceso a esta nueva y potente tecnología.

Esto diferencia a Snowflake de otras plataformas data en la nube, ya que ofrece a los usuarios de Snowflake una ventaja significativa en términos de desarrollo de aplicaciones AI . Con Snowflake Cortex, los usuarios ahora pueden crear fácilmente aplicaciones AI que pueden realizar una amplia gama de tareas, como generar reports, identificar el fraude y predecir el comportamiento de los clientes.

He aquí algunos casos específicos de uso de las capacidades LLM de Snowflake:

  • Detección del sentimiento: Analice los comentarios de los clientes, las interacciones en las redes sociales o las reseñas de productos para comprender el sentimiento general e identificar áreas de mejora. (Para más información, consulte los comandos SQL de análisis y resumen de opiniones (en vista previa privada)).

  • Resumir textos: Genere resúmenes concisos de documentos extensos, correos electrónicos o reports para captar rápidamente la información clave y ahorrar tiempo. (Se ofrece más información en los comandos SQL para el análisis de sentimientos y el resumen (en vista previa privada)).

  • Traducción: ¿Necesita traducir los valores de una columna específica durante sus transformaciones? No hay necesidad de recurrir a una API externa; puede realizar la traducción sin problemas dentro de Snowflake.

Funciones de búsqueda avanzadas (en vista previa privada)

Las nuevas funciones de búsqueda avanzada de Snowflake facilitan más que nunca que los usuarios encuentren el data que necesitan, independientemente de dónde esté almacenado. Esto supone una gran ventaja frente a otras plataformas de data en la nube, que suelen tener capacidades de búsqueda más limitadas.

En concreto, las nuevas funciones de búsqueda de Snowflake permiten a los usuarios:

  • Realice búsquedas en bases de datos, tablas Iceberg, data dentro de Snowflake, aplicaciones nativas y Snowflake Marketplace.

  • Utilice consultas en lenguaje natural para buscar en data.

  • Filtre los resultados de la búsqueda por diversos criterios, como el tipo de data , el tamaño del archivo y la fecha de creación.

Estas funciones de búsqueda avanzada pueden ayudar a los usuarios a ahorrar tiempo y ser más productivos cuando trabajan con data. Por ejemplo, un analista de data podría utilizar las nuevas funciones de búsqueda para encontrar rápidamente todo el data que sea relevante para un proyecto de análisis específico. O bien, un usuario empresarial podría utilizar las nuevas funciones de búsqueda para encontrar todo el data relacionado con un cliente o producto específico.

Por no hablar de que el uso de los distintos filtros de copo de nieve que proporcionan estas funciones de búsqueda (denominación de columnas, etiquetado, especificación de metadatos) induce un aumento de la coherencia de data .

En conclusión, cabe señalar que esto aborda un aspecto clave de los catálogos data . Dados los retos inherentes a la implantación de un catálogo data , aprovechar esta función integrada en Snowflake resulta especialmente atractivo.

class="img-responsive

Comandos SQL para el análisis y la síntesis de sentimientos (en previsualización privada)

Los nuevos comandos SQL de Snowflake para el análisis de sentimientos y el resumen facilitan a los usuarios la extracción de información de su data sin tener que aprender nuevas herramientas o lenguajes. Esto supone una gran ventaja con respecto a otras plataformas en la nube data , que suelen requerir que los usuarios utilicen herramientas independientes para estas tareas.

En concreto, los nuevos comandos SQL de Snowflake permiten a los usuarios:

  • Analice el sentimiento del texto data, como opiniones de clientes, publicaciones en redes sociales y respuestas a encuestas.

  • Resuma el texto data para extraer la información más importante.

Estos nuevos comandos SQL pueden ayudar a los usuarios a ahorrar tiempo y ser más productivos cuando trabajan con data. Por ejemplo, un usuario empresarial podría utilizar los nuevos comandos SQL para analizar rápidamente el sentimiento de las opiniones de los clientes o para resumir un informe largo y complejo.

Copiloto Snowflake (en vista previa privada)

Se trata de un asistente basado en LLM para generar y refinar SQL con lenguaje natural. Además, esta funcionalidad de texto a código llegará pronto de forma programática a través de una función de propósito general, Text2SQL, con Snowflake Cortex.

class="img-responsive

Extracción de documentos Data con Document AI (en vista previa privada)

El documento AI de Snowflake Cortex, impulsado por LLM, permite extraer eficazmente data de varios tipos de documentos (pdf, word, txt, capturas de pantalla), ahorrando tiempo y recursos en el procesamiento manual de data .

En general, las nuevas funciones de Snowflake son impresionantes y pueden revolucionar el uso de las plataformas en la nube data .

Snowflake se está diferenciando claramente de la competencia al ofrecer funciones innovadoras que facilitan a los usuarios el desarrollo y despliegue de aplicaciones AI , la búsqueda de data, la gestión de funciones ML y el uso compartido de modelos ML. Snowflake también está facilitando a los usuarios la extracción de información de su data sin tener que aprender nuevas herramientas o lenguajes.

class="img-responsive

Tienda de funciones (en vista previa privada)

Un almacén de funciones es un repositorio central para gestionar y compartir funciones de aprendizaje automático. El nuevo almacén de funciones de Snowflake facilita a los usuarios el desarrollo y despliegue de modelos de ML.

Esto diferencia a Snowflake de otras plataformas en la nube data porque proporciona a los usuarios un único lugar para gestionar todas sus funciones de ML. Esto puede ayudar a los usuarios a ahorrar tiempo y mejorar la eficiencia de su proceso de desarrollo de ML.

He aquí algunos casos concretos de uso de la tienda de funciones de Snowflake:

  • Un científico de data podría utilizar el almacén de características para gestionar y compartir las características que está utilizando para desarrollar un modelo de aprendizaje automático. Para obtener más información sobre este tema, puedes dirigirte aquí.

  • Un ingeniero de aprendizaje automático podría utilizar el almacén de características para desplegar un modelo de aprendizaje automático en producción y asegurarse de que tiene acceso a las características que necesita. Para obtener más información sobre este tema, puedes dirigirte aquí.

  • Un usuario empresarial podría utilizar el almacén de características para explorar y comprender las características que se utilizan para impulsar sus aplicaciones de aprendizaje automático. Para obtener más información sobre este tema, puedes dirigirte aquí.

Modelo de reparto

La capacidad de Snowflake para compartir modelos de ML es también un elemento diferenciador importante. Esto facilitará la colaboración en proyectos de ML y democratizará el acceso a esta tecnología.

En concreto, Snowflake permite a los usuarios compartir modelos de ML con otros, tanto dentro como fuera de su organización. Esto puede ayudar a acelerar el desarrollo y la adopción de aplicaciones de ML.

He aquí algunos casos concretos de uso de la capacidad de compartir modelos de Snowflake:

  • Un científico de data podría compartir un modelo de aprendizaje automático con un usuario empresarial para que pueda utilizarlo para explorar su data y generar ideas.

  • Un ingeniero de aprendizaje automático podría compartir un modelo de aprendizaje automático con un ingeniero de DevOps para que puedan desplegarlo en producción.

  • Un proveedor de software podría compartir un modelo de aprendizaje automático con sus clientes para que puedan utilizarlo para mejorar sus productos y servicios.

Cuadernos Snowflake (en vista previa privada)

Snowflake Notebooks, un entorno basado en la nube diseñado específicamente para el desarrollo y la ejecución de código, comparte similitudes con los cuadernos disponibles desde hace varios años en otras plataformas en la nube data . Databricks fue el pionero en este campo, y BigQuery le siguió con su anuncio el 31 de agosto. Estos cuadernos están cuidadosamente diseñados para optimizar el rendimiento dentro del ecosistema Snowflake.

Los Snowflake Notebooks ofrecen una serie de ventajas sobre los IDE tradicionales, como:

  • Colaboración: Los Snowflake Notebooks son fáciles de compartir con otras personas, lo que facilita la colaboración en los proyectos.

  • Interactividad: Los Snowflake Notebooks son interactivos, por lo que puedes experimentar con tu código y ver los resultados inmediatamente.

  • Rendimiento: Los Snowflake Notebooks tienen un alto rendimiento, por lo que puede ejecutar consultas y análisis complejos con rapidez.

Los Snowflake Notebooks están actualmente en fase beta, pero se espera que se lancen al público general en un futuro próximo.

Lo que diferencia a Snowflake como entorno de desarrollo de aprendizaje automático de otros es el hecho de que consta de API de Python accesibles a través de la biblioteca Snowpark ML, e interfaces SQL para definir, gestionar y recuperar características, junto con una infraestructura gestionada para la gestión de metadatos de características y el procesamiento continuo de características. Esto elimina la necesidad de conocimientos especializados en AI . Además, el almacén de características y las funciones de uso compartido de modelos permiten a Snowflake ponerse a la altura de sus competidores de forma más eficaz, en concreto Databricks, que obviamente ha llevado la delantera en los últimos dos años gracias a su integración con ML Flow.

class="img-responsive

Conclusión

La presentación de nuevas funciones por parte de Snowflake, como Snowflake Cortex, Copilot, Document AI y notebooks, reafirma el compromiso de Compañiacon la innovación. Aunque los anuncios científicos de data coinciden con las tendencias actuales de la GenAI, es imprescindible abordarlos con cautela. Cabe destacar que ciertas características, aunque anunciadas hace tiempo, aún están pendientes de disponibilidad universal en todos los entornos. Por último, acerquémonos a estas innovaciones con la mente abierta y un optimismo cauto, dispuestos a abrazar las posibilidades sin perder de vista la realidad.

class="img-responsive

Blog de Medium por Artefact.

Este artículo se publicó inicialmente en Medium.com.
¡Síguenos en nuestro Medium Blog !