Alors que nous réfléchissons aux idées partagées lors de l'événement "Snowday" des 1er et 2 novembre, une cascade de révélations passionnantes sur l'avenir du flocon de neige nous attend.

Cet article se penche sur les caractéristiques scientifiques remarquables du site data dévoilées lors de l'événement, et met en lumière les innovations et les avancées qui ont occupé le devant de la scène.

Rejoignez-nous dans ce voyage pour découvrir les points forts de Snowdays, avec un accent particulier sur les dernières nouveautés scientifiques de data , telles que

Faits marquants du cortex du flocon de neige

class="img-responsive

Vue d'ensemble des capacités GenAI et LLM dans Snowflake

Capacités du modèle linguistique (LLM) (certains modèles sont publics tandis que d'autres sont encore en phase de prévisualisation privée)

Les LLM sont un nouveau type de modèle d'IA capable de générer du texte, de traduire des langues, de rédiger différents types de contenus créatifs et de répondre à vos questions de manière informative. Les nouvelles capacités LLM de Snowflake en font l'une des premières plateformes cloud data à offrir aux utilisateurs l'accès à cette nouvelle technologie puissante.

Cela différencie Snowflake des autres plateformes cloud data car cela donne aux utilisateurs de Snowflake un avantage significatif en termes de développement d'applications d'IA. Avec Snowflake Cortex, les utilisateurs peuvent désormais facilement créer des applications d'IA capables d'effectuer un large éventail de tâches, telles que la génération de rapports, l'identification des fraudes et la prédiction du comportement des clients.

Voici quelques cas d'utilisation spécifiques des capacités LLM de Snowflake :

  • Détection des sentiments : Analysez les commentaires des clients, les interactions avec les médias sociaux ou les évaluations de produits pour comprendre le sentiment général et identifier les domaines à améliorer. (De plus amples détails sont fournis dans les commandes SQL pour l'analyse et le résumé des sentiments (en avant-première privée)).

  • Résumés de texte : Générer des résumés concis de longs documents, courriels ou rapports pour saisir rapidement les informations clés et gagner du temps. (De plus amples détails sont fournis dans les commandes SQL pour l'analyse et le résumé des sentiments (en avant-première).

  • Traduction : Vous avez besoin d'une traduction pour les valeurs d'une colonne spécifique lors de vos transformations ? Il n'est pas nécessaire de faire appel à une API externe ; vous pouvez effectuer la traduction de manière transparente dans Snowflake.

Fonctionnalités de recherche avancées (en aperçu privé)

Les nouvelles fonctions de recherche avancée de Snowflake permettent aux utilisateurs de trouver plus facilement que jamais le site data dont ils ont besoin, quel que soit l'endroit où il est stocké. Il s'agit d'un avantage majeur par rapport à d'autres plateformes cloud data , dont les capacités de recherche sont généralement plus limitées.

Plus précisément, les nouvelles fonctions de recherche de Snowflake permettent aux utilisateurs de.. :

  • Recherche dans les bases de données, les tables Iceberg, data à l'intérieur de Snowflake, les applications natives et la place de marché Snowflake.

  • Utilisez des requêtes en langage naturel pour rechercher data.

  • Filtrer les résultats de la recherche en fonction de divers critères, tels que le type data , la taille du fichier et la date de création.

Ces fonctions de recherche avancée peuvent aider les utilisateurs à gagner du temps et à être plus productifs lorsqu'ils travaillent avec data. Par exemple, un analyste de data peut utiliser les nouvelles fonctions de recherche pour trouver rapidement tous les documents data pertinents pour un projet d'analyse spécifique. Ou encore, un utilisateur professionnel peut utiliser les nouvelles fonctions de recherche pour trouver toutes les informations data relatives à un client ou à un produit spécifique.

Sans oublier que l'utilisation des différents filtres en flocon de neige fournis par ces fonctions de recherche (dénomination des colonnes, étiquetage, spécification des métadonnées) induit une augmentation de la cohérence du site data .

En conclusion, il convient de noter que cette fonction aborde un aspect essentiel des catalogues data . Compte tenu des défis inhérents à la mise en œuvre d'un catalogue data , l'exploitation de cette fonction intégrée de Snowflake devient particulièrement convaincante.

class="img-responsive

Commandes SQL pour l'analyse et le résumé des sentiments (en avant-première)

Les nouvelles commandes SQL de Snowflake pour l'analyse et le résumé des sentiments permettent aux utilisateurs d'extraire facilement des informations de leur site data sans avoir à apprendre de nouveaux outils ou de nouveaux langages. Il s'agit d'un avantage majeur par rapport à d'autres plateformes cloud data , qui exigent généralement que les utilisateurs utilisent des outils distincts pour ces tâches.

Plus précisément, les nouvelles commandes SQL de Snowflake permettent aux utilisateurs de.. :

  • Analyser le sentiment des textes data, tels que les commentaires des clients, les messages sur les médias sociaux et les réponses aux enquêtes.

  • Résumer un texte data pour en extraire les informations les plus importantes.

Ces nouvelles commandes SQL peuvent aider les utilisateurs à gagner du temps et à être plus productifs lorsqu'ils travaillent avec data. Par exemple, un utilisateur professionnel peut utiliser les nouvelles commandes SQL pour analyser rapidement le sentiment des commentaires des clients ou pour résumer un rapport long et complexe.

Snowflake Copilot (en avant-première privée)

Il s'agit d'un assistant alimenté par LLM pour générer et affiner SQL en langage naturel. En outre, cette fonctionnalité de conversion de texte en code sera bientôt programmée via une fonction générale, Text2SQL, avec Snowflake Cortex.

class="img-responsive

Document Data Extraction avec Document AI (en avant-première)

Document AI de Snowflake Cortex, alimenté par LLM, permet une extraction efficace de data à partir de divers types de documents (pdf, word, txt, captures d'écran), ce qui permet de gagner du temps et d'économiser des ressources dans le traitement manuel de data .

Dans l'ensemble, les nouvelles fonctionnalités de Snowflake sont très impressionnantes et ont le potentiel de révolutionner la façon dont les gens utilisent les plateformes cloud data .

Snowflake se démarque clairement de la concurrence en proposant des fonctionnalités innovantes qui facilitent le développement et le déploiement d'applications d'IA, la recherche de data, la gestion des fonctions de ML et le partage des modèles de ML. Snowflake permet également aux utilisateurs d'extraire plus facilement des informations de leur site data sans avoir à apprendre de nouveaux outils ou de nouveaux langages.

class="img-responsive

Magasin de fonctionnalités (en avant-première privée)

Un magasin de fonctionnalités est un référentiel central pour la gestion et le partage des fonctionnalités d'apprentissage automatique. Le nouveau magasin de fonctionnalités de Snowflake permet aux utilisateurs de développer et de déployer plus facilement des modèles d'apprentissage automatique.

Snowflake se différencie ainsi des autres plateformes cloud data , car il offre aux utilisateurs un lieu unique pour gérer toutes leurs fonctions de ML. Cela peut aider les utilisateurs à gagner du temps et à améliorer l'efficacité de leur processus de développement ML.

Voici quelques cas d'utilisation spécifiques de la boutique de fonctionnalités de Snowflake :

  • Un scientifique ( data ) peut utiliser le magasin de fonctionnalités pour gérer et partager les fonctionnalités qu'il utilise pour développer un modèle d'apprentissage automatique. Pour plus d'informations sur ce sujet, cliquez ici.

  • Un ingénieur en apprentissage automatique pourrait utiliser le magasin de fonctionnalités pour déployer un modèle d'apprentissage automatique en production et s'assurer qu'il a accès aux fonctionnalités dont il a besoin. Pour plus d'informations sur ce sujet, cliquez ici.

  • Un utilisateur professionnel peut utiliser le magasin de fonctionnalités pour explorer et comprendre les fonctionnalités utilisées pour alimenter ses applications d'apprentissage automatique. Pour plus d'informations sur ce sujet, cliquez ici.

Partage des modèles

La capacité de Snowflake à partager des modèles de ML est également un facteur de différenciation majeur. Cela facilitera la collaboration sur les projets de ML et démocratisera l'accès au ML.

Plus précisément, Snowflake permet aux utilisateurs de partager des modèles de ML avec d'autres personnes, tant à l'intérieur qu'à l'extérieur de leur organisation. Cela peut contribuer à accélérer le développement et l'adoption d'applications de ML.

Voici quelques cas d'utilisation spécifiques de la capacité de partage de modèles de Snowflake :

  • Un scientifique du site data pourrait partager un modèle d'apprentissage automatique avec un utilisateur commercial afin qu'il puisse l'utiliser pour explorer son site data et générer des informations.

  • Un ingénieur en apprentissage automatique peut partager un modèle d'apprentissage automatique avec un ingénieur DevOps afin qu'il puisse le déployer en production.

  • Un fournisseur de logiciels pourrait partager un modèle d'apprentissage automatique avec ses clients afin qu'ils puissent l'utiliser pour améliorer leurs produits et services.

Carnets de notes en flocon de neige (en avant-première privée)

Les Snowflake Notebooks, un environnement basé sur le cloud spécialement conçu pour le développement et l'exécution de code, présentent des similitudes avec les notebooks disponibles depuis plusieurs années sur d'autres plateformes cloud data . Databricks a été le pionnier dans ce domaine, et BigQuery a suivi avec son annonce du 31 août. Ces Notebooks sont conçus pour optimiser les performances au sein de l'écosystème Snowflake.

Les ordinateurs portables Snowflake offrent un certain nombre d'avantages par rapport aux IDE traditionnels :

  • Collaboration : Les carnets Snowflake sont faciles à partager avec d'autres, ce qui facilite la collaboration sur les projets.

  • Interactivité : Les carnets de notes Snowflake sont interactifs, ce qui vous permet d'expérimenter votre code et de voir les résultats immédiatement.

  • Performance : Les Snowflake Notebooks sont très performants, ce qui vous permet d'exécuter rapidement des requêtes et des analyses complexes.

Les ordinateurs portables Snowflake sont actuellement en version bêta, mais ils devraient être mis à la disposition du grand public dans un avenir proche.

Ce qui différencie Snowflake des autres environnements de développement de l'apprentissage automatique, c'est qu'il se compose d'API Python accessibles via la bibliothèque ML de Snowpark et d'interfaces SQL pour définir, gérer et récupérer des caractéristiques, ainsi que d'une infrastructure gérée pour la gestion des métadonnées des caractéristiques et le traitement continu des caractéristiques. Il n'est donc pas nécessaire de disposer d'une expertise spécialisée en IA. En outre, le Feature Store et les fonctions de partage de modèles permettent à Snowflake de rattraper plus efficacement ses concurrents, en particulier Databricks, qui a manifestement pris le dessus au cours des deux dernières années grâce à son intégration avec ML Flow.

class="img-responsive

Conclusion

Le dévoilement par Snowflake de nouvelles fonctionnalités, notamment Snowflake Cortex, Copilot, Document AI et notebooks, confirme l'engagement de l'entreprise en faveur de l'innovation. Bien que les annonces scientifiques de data s'alignent sur les tendances actuelles de la GenAI, il est impératif de les aborder avec prudence. Il convient de noter que certaines fonctionnalités, bien qu'annoncées depuis longtemps, ne sont toujours pas disponibles dans tous les environnements. Enfin, abordons ces innovations avec un esprit ouvert et un optimisme prudent, prêts à embrasser les possibilités tout en restant ancrés dans la réalité.

class="img-responsive

Moyen Blog par Artefact.

Cet article a été initialement publié sur Medium.com.
Suivez-nous sur notre Medium Blog !