Mentre riflettiamo sulle intuizioni condivise durante l'evento "Snowday" dell'1 e 2 novembre, ci aspetta una cascata di emozionanti rivelazioni sul futuro di Snowflake.

Questo articolo approfondisce le caratteristiche di rilievo della scienza dei dati presentate durante l'evento, facendo luce sull'innovazione e sui progressi che hanno avuto un ruolo di primo piano.

Unitevi a noi in questo viaggio per scoprire i punti salienti degli Snowdays, con un focus specifico sulle ultime funzionalità di data science, come ad esempio:

Cortex a fiocco di neve Punti salienti

class="lazyload

Una panoramica delle funzionalità GenAI e LLM in Snowflake

Capacità del modello linguistico (LLM) (alcuni modelli sono pubblici mentre altri sono ancora in anteprima privata)

Gli LLM sono un nuovo tipo di modello AI in grado di generare testi, tradurre lingue, scrivere diversi tipi di contenuti creativi e rispondere alle vostre domande in modo informativo. Le nuove funzionalità LLM di Snowflake ne fanno una delle prime piattaforme di dati cloud a offrire agli utenti l'accesso a questa nuova e potente tecnologia.

Questo differenzia Snowflake da altre piattaforme di dati cloud , perché offre agli utenti Snowflake un vantaggio significativo in termini di sviluppo di applicazioni AI. Con Snowflake Cortex, gli utenti possono ora costruire facilmente applicazioni di IA in grado di eseguire un'ampia gamma di compiti, come la generazione di report, l'identificazione di frodi e la previsione del comportamento dei clienti.

Ecco alcuni casi d'uso specifici delle funzionalità LLM di Snowflake:

  • Rilevamento del sentiment: Analizzare i feedback dei clienti, le interazioni sui social media o le recensioni dei prodotti per comprendere il sentiment generale e identificare le aree di miglioramento. (Ulteriori approfondimenti sono forniti nei comandi SQL per l'analisi e la sintesi del sentiment (in anteprima privata)).

  • Riassunto del testo: Generare riassunti concisi di lunghi documenti, e-mail o rapporti per cogliere rapidamente le informazioni chiave e risparmiare tempo. (Ulteriori approfondimenti sono forniti nei comandi SQL per l'analisi del sentiment e la sintesi (in anteprima privata)).

  • Traduzione: Avete bisogno di tradurre i valori di una colonna specifica durante le vostre trasformazioni? Non c'è bisogno di rivolgersi a un'API esterna; potete eseguire la traduzione senza problemi all'interno di Snowflake.

Funzioni di ricerca avanzate (in anteprima privata)

Le nuove funzioni di ricerca avanzata di Snowflake rendono più facile che mai per gli utenti trovare i dati di cui hanno bisogno, indipendentemente da dove sono archiviati. Questo è un grande vantaggio rispetto ad altre piattaforme di dati cloud , che di solito hanno capacità di ricerca più limitate.

In particolare, le nuove funzioni di ricerca di Snowflake consentono agli utenti di:

  • Cerca nei database, nelle tabelle Iceberg, nei dati all'interno di Snowflake, nelle applicazioni native e nello Snowflake Marketplace.

  • Utilizzare le query in linguaggio naturale per cercare i dati.

  • Filtrare i risultati della ricerca in base a una serie di criteri, come il tipo di dati, la dimensione del file e la data di creazione.

Queste funzioni di ricerca avanzate possono aiutare gli utenti a risparmiare tempo e a essere più produttivi quando lavorano con i dati. Ad esempio, un analista di dati può utilizzare le nuove funzioni di ricerca per trovare rapidamente tutti i dati rilevanti per uno specifico progetto di analisi. Oppure, un utente commerciale potrebbe usare le nuove funzioni di ricerca per trovare tutti i dati relativi a un cliente o a un prodotto specifico.

Senza contare che l'uso dei diversi filtri a fiocco di neve forniti da queste funzioni di ricerca (denominazione delle colonne, tagging, specificazione dei metadati) induce un aumento della coerenza dei dati.

In conclusione, vale la pena di notare che questo affronta un aspetto chiave dei cataloghi di dati. Date le sfide inerenti all'implementazione di un catalogo di dati, sfruttare questa funzione integrata di Snowflake diventa particolarmente interessante.

class="lazyload

Comandi SQL per l'analisi del sentiment e la sintesi (in anteprima privata)

I nuovi comandi SQL di Snowflake per l'analisi del sentiment e la riepilogazione rendono più facile per gli utenti estrarre intuizioni dai loro dati senza dover imparare nuovi strumenti o linguaggi. Questo è un grande vantaggio rispetto ad altre piattaforme di dati cloud , che in genere richiedono agli utenti di utilizzare strumenti separati per queste attività.

In particolare, i nuovi comandi SQL di Snowflake consentono agli utenti di:

  • Analizzare il sentiment dei dati testuali, come le recensioni dei clienti, i post sui social media e le risposte ai sondaggi.

  • Riassumere i dati di testo per estrarre le informazioni più importanti.

Questi nuovi comandi SQL possono aiutare gli utenti a risparmiare tempo e a essere più produttivi quando lavorano con i dati. Ad esempio, un utente business può utilizzare i nuovi comandi SQL per analizzare rapidamente il sentiment delle recensioni dei clienti o per riassumere un report lungo e complesso.

Snowflake Copilot (in anteprima privata)

Si tratta di un assistente alimentato da LLM per generare e perfezionare SQL con il linguaggio naturale. Inoltre, questa funzionalità text-to-code sarà presto disponibile in modo programmatico tramite una funzione generica, Text2SQL, con Snowflake Cortex.

class="lazyload

Estrazione dei dati dei documenti con Document AI (in anteprima privata)

La Document AI di Snowflake Cortex, alimentata da LLM, consente di estrarre in modo efficiente i dati da vari tipi di documenti (pdf, word, txt, screenshot), risparmiando tempo e risorse nell'elaborazione manuale dei dati.

Nel complesso, le nuove funzionalità di Snowflake sono davvero notevoli e hanno il potenziale per rivoluzionare il modo in cui le persone utilizzano le piattaforme di dati cloud .

Snowflake si sta chiaramente differenziando dalla concorrenza offrendo funzionalità innovative che facilitano agli utenti lo sviluppo e l'implementazione di applicazioni di intelligenza artificiale, il reperimento dei dati, la gestione delle funzioni di ML e la condivisione dei modelli di ML. Snowflake rende anche più facile per gli utenti estrarre insight dai loro dati senza dover imparare nuovi strumenti o linguaggi.

class="lazyload

Negozio di funzionalità (in anteprima privata)

Un feature store è un repository centrale per la gestione e la condivisione di funzionalità di apprendimento automatico. Il nuovo feature store di Snowflake rende più facile per gli utenti sviluppare e distribuire modelli di ML.

Questo differenzia Snowflake da altre piattaforme di dati cloud , perché fornisce agli utenti un unico luogo per gestire tutte le loro funzioni di ML. Questo può aiutare gli utenti a risparmiare tempo e a migliorare l'efficienza del loro processo di sviluppo del ML.

Ecco alcuni casi d'uso specifici del feature store di Snowflake:

  • Un data scientist può utilizzare il feature store per gestire e condividere le caratteristiche che sta utilizzando per sviluppare un modello di apprendimento automatico. Per ulteriori informazioni su questo argomento, potete visitare questo sito.

  • Un ingegnere dell'apprendimento automatico potrebbe usare il feature store per distribuire un modello di apprendimento automatico in produzione e assicurarsi che abbia accesso alle funzioni necessarie. Per ulteriori informazioni su questo argomento, potete visitare questo sito.

  • Un utente business può utilizzare il feature store per esplorare e comprendere le funzionalità utilizzate per le applicazioni di apprendimento automatico. Per ulteriori informazioni su questo argomento, potete visitare questo sito.

Condivisione del modello

La capacità di Snowflake di condividere i modelli di ML è un altro importante elemento di differenziazione. In questo modo sarà più facile per le persone collaborare a progetti di ML e democratizzare l'accesso al ML.

In particolare, Snowflake consente agli utenti di condividere i modelli di ML con altri, sia all'interno che all'esterno della propria organizzazione. Ciò può contribuire ad accelerare lo sviluppo e l'adozione di applicazioni di ML.

Ecco alcuni casi d'uso specifici della funzionalità di condivisione dei modelli di Snowflake:

  • Un data scientist potrebbe condividere un modello di apprendimento automatico con un utente aziendale, in modo che questi possa utilizzarlo per esplorare i propri dati e generare approfondimenti.

  • Un ingegnere di machine learning potrebbe condividere un modello di machine learning con un ingegnere DevOps, in modo che questi possa distribuirlo in produzione.

  • Un fornitore di software potrebbe condividere un modello di apprendimento automatico con i propri clienti, in modo che questi possano utilizzarlo per migliorare i propri prodotti e servizi.

Quaderni a fiocco di neve (in anteprima privata)

Gli Snowflake Notebooks, un ambiente cloud specificamente progettato per lo sviluppo e l'esecuzione del codice, presentano analogie con i notebook disponibili da diversi anni su altre piattaforme di dati cloud . Databricks è stato il pioniere in questo campo e BigQuery ha seguito il suo esempio con l'annuncio del 31 agosto. Questi notebook sono stati progettati per ottimizzare le prestazioni all'interno dell'ecosistema Snowflake.

Gli Snowflake Notebook offrono una serie di vantaggi rispetto agli IDE tradizionali, come:

  • Collaborazione: I quaderni Snowflake sono facili da condividere con gli altri, il che facilita la collaborazione sui progetti.

  • Interattività: I Quaderni Snowflake sono interattivi, quindi potete sperimentare con il vostro codice e vedere immediatamente i risultati.

  • Prestazioni: Gli Snowflake Notebook sono altamente performanti e consentono di eseguire rapidamente query e analisi complesse.

I Notebook Snowflake sono attualmente in fase beta, ma si prevede che vengano rilasciati al pubblico nel prossimo futuro.

Ciò che differenzia Snowflake come ambiente di sviluppo per l'apprendimento automatico da altri è il fatto che consiste in API Python accessibili attraverso la libreria Snowpark ML e interfacce SQL per la definizione, la gestione e il recupero delle caratteristiche, insieme a un'infrastruttura gestita per la gestione dei metadati delle caratteristiche e l'elaborazione continua delle caratteristiche. Ciò elimina la necessità di competenze specialistiche in materia di intelligenza artificiale. Inoltre, il Feature Store e le funzionalità di condivisione dei modelli consentono a Snowflake di recuperare il ritardo rispetto ai concorrenti, in particolare Databricks, che negli ultimi anni ha avuto la meglio grazie all'integrazione con ML Flow.

class="lazyload

Conclusione

La presentazione da parte di Snowflake di nuove funzionalità, tra cui Snowflake Cortex, Copilot, Document AI e notebook, afferma l'impegno dell'azienda verso l'innovazione. Sebbene gli annunci relativi alla scienza dei dati siano in linea con le attuali tendenze della GenAI, è necessario affrontarli con cautela. È da notare che alcune funzionalità, sebbene annunciate da tempo, sono ancora in attesa della disponibilità universale in tutti gli ambienti. Infine, affrontiamo queste innovazioni con mente aperta e cauto ottimismo, pronti ad abbracciare le possibilità pur rimanendo ancorati alla realtà.

class="lazyload

Medium Blog di Artefact.

Questo articolo è stato pubblicato inizialmente su Medium.com.
Seguiteci sul nostro blog Medium!