Terwijl we nadenken over de inzichten die we tijdens het ‘Snowday’-evenement op 1 en 2 november hebben gedeeld, staat ons een stortvloed aan spannende onthullingen te wachten over de toekomst van Snowflake.

Dit artikel duikt in de opmerkelijke wetenschappelijke functies van de data die tijdens het evenement werden onthuld, en werpt een licht op de innovatie en vooruitgang die centraal stonden.

Ga met ons mee op deze reis en ontdek de hoogtepunten van Snowdays, met speciale aandacht voor de nieuwste wetenschappelijke functies van de data, zoals:

Hoogtepunten van Snowflake Cortex

Een overzicht van GenAI- en LLM-mogelijkheden in Snowflake

Taalmodel (LLM) mogelijkheden (sommige modellen zijn openbaar, terwijl andere zich nog in een besloten preview bevinden)

LLM's zijn een nieuw type AI-model dat tekst kan genereren, talen kan vertalen, verschillende soorten creatieve content kan schrijven en uw vragen op een informatieve manier kan beantwoorden. Met de nieuwe LLM-mogelijkheden is Snowflake een van de eerste cloud data platforms die gebruikers toegang biedt tot deze krachtige nieuwe technologie.

Dit onderscheidt Snowflake van andere cloud data platforms omdat het Snowflake gebruikers een aanzienlijk voordeel biedt bij het ontwikkelen van AI-toepassingen. Met Snowflake Cortex kunnen gebruikers nu gemakkelijk AI-toepassingen bouwen die een breed scala aan taken kunnen uitvoeren, zoals het genereren van reports, het identificeren van fraude en het voorspellen van klantgedrag.

Hier volgen enkele specifieke gebruikssituaties voor de LLM-mogelijkheden van Snowflake:

  • Sentimentdetectie: Analyseer feedback van klanten, interacties op sociale media of productbeoordelingen om het algemene sentiment te begrijpen en gebieden voor verbetering te identificeren. (Verdere uitwerking vindt u in SQL-commando's voor sentimentanalyse en -samenvatting (in privé-preview).

  • Tekstsamenvatting: Genereer beknopte samenvattingen van lange documenten, e-mails of reports om snel de belangrijkste informatie te begrijpen en tijd te besparen. (Verdere uitwerking vindt u in SQL-commando's voor sentimentanalyse en samenvattingen (in privévoorbeeld).

  • Vertaling: Hebt u vertaling nodig voor de waarden in een specifieke kolom tijdens uw transformaties? U hoeft geen beroep te doen op een externe API; u kunt de vertaling naadloos binnen Snowflake uitvoeren.

Geavanceerde zoekfuncties (in privévoorbeeld)

Snowflake's nieuw geavanceerde zoekfuncties maken het voor gebruikers gemakkelijker dan ooit om de data te vinden die ze nodig hebben, ongeacht waar die is opgeslagen. Dit is een groot voordeel ten opzichte van andere cloud data platforms, die doorgaans beperktere zoekmogelijkheden hebben.

De nieuwe zoekfuncties van Snowflake stellen gebruikers in staat om:

  • Zoek in databases, Iceberg-tabellen, data in Snowflake, Native Applications en de Snowflake Marketplace.

  • Gebruik zoekopdrachten in natuurlijke taal om te zoeken naar data.

  • Filter zoekresultaten op verschillende criteria, zoals data type, bestandsgrootte en aanmaakdatum.

Deze geavanceerde zoekfuncties kunnen gebruikers helpen om tijd te besparen en productiever te werken met data. Een data analist kan bijvoorbeeld de nieuwe zoekfuncties gebruiken om snel alle data te vinden die relevant is voor een specifiek analyseproject. Of een zakelijke gebruiker kan de nieuwe zoekfuncties gebruiken om alle data te vinden die gerelateerd is aan een specifieke klant of product.

Om nog maar te zwijgen over het feit dat het gebruik van de verschillende sneeuwvlokfilters die deze zoekfuncties bieden (kolomnaamgeving, tagging, metadata specificatie) een toename in data consistentie teweegbrengt.

Tot slot is het de moeite waard om op te merken dat dit een belangrijk aspect van data catalogi aanpakt. Gezien de inherente uitdagingen bij het implementeren van een data catalogus, is het bijzonder aantrekkelijk om gebruik te maken van deze geïntegreerde Snowflake-functie.

SQL-commando's voor sentimentanalyse en -samenvatting (in besloten voorvertoning)

Met de nieuwe SQL-commando's van Snowflake voor sentimentanalyse en samenvatten kunnen gebruikers gemakkelijk inzichten uit hun data halen zonder nieuwe tools of talen te hoeven leren. Dit is een groot voordeel ten opzichte van andere cloud data platforms, waarvoor gebruikers meestal aparte tools moeten gebruiken voor deze taken.

Met de nieuwe SQL-commando's van Snowflake kunnen gebruikers met name:

  • Het sentiment van tekst analyseren data, Zoals klantbeoordelingen, berichten op sociale media en reacties op enquêtes.

  • Tekst samenvatten data om de belangrijkste informatie eruit te halen.

Deze nieuwe SQL-commando's kunnen gebruikers helpen om tijd te besparen en productiever te werken met data. Een zakelijke gebruiker kan de nieuwe SQL-opdrachten bijvoorbeeld gebruiken om snel het sentiment van klantbeoordelingen te analyseren of om een lang en complex rapport samen te vatten.

Snowflake Copilot (in privévoorvertoning)

Het is een LLM-assistent voor het genereren en verfijnen van SQL met natuurlijke taal. Daarnaast zal deze tekst-naar-code functionaliteit binnenkort programmatisch beschikbaar zijn via een functie voor algemeen gebruik, Text2SQL, met Snowflake Cortex.

Document Data extractie met document AI (in privévoorbeeld)

Snowflake Cortex' document-AI, LLM maakt efficiënte extractie van data uit verschillende documenttypes mogelijk (pdf, word, txt, screenshots), waardoor tijd en middelen bespaard worden bij handmatige data verwerking.

Over het geheel genomen zijn de nieuwe functies van Snowflake zeer indrukwekkend en kunnen ze een revolutie teweegbrengen in de manier waarop mensen cloud data platforms gebruiken.

Snowflake onderscheidt zich duidelijk van de concurrentie door innovatieve functies aan te bieden waarmee gebruikers gemakkelijker AI-toepassingen kunnen ontwikkelen en implementeren, data kunnen vinden, ML-functies kunnen beheren en ML-modellen kunnen delen. Snowflake maakt het gebruikers ook gemakkelijker om inzichten uit hun data te halen zonder nieuwe tools of talen te hoeven leren.

Feature store (in privé-preview)

A winkel is een centrale opslagplaats voor het beheren en delen van functies voor machine learning. De nieuwe feature store van Snowflake maakt het makkelijker voor gebruikers om ML-modellen te ontwikkelen en in te zetten.

Dit onderscheidt Snowflake van andere cloud data platforms omdat het gebruikers een enkele plaats biedt om al hun ML-functies te beheren. Dit kan gebruikers helpen om tijd te besparen en de efficiëntie van hun ML-ontwikkelingsproces te verbeteren.

Hier zijn enkele specifieke gebruikssituaties voor Snowflake's feature store:

  • Een data wetenschapper zou de feature store kunnen gebruiken om de functies beheren en delen die zij gebruiken om een model voor machinaal leren te ontwikkelen. Voor meer informatie over dit onderwerp kunt u terecht bij hier.

  • Een machine-learning ingenieur kan de feature store gebruiken om een model voor machinaal leren in productie nemen en ervoor zorgen dat het toegang heeft tot de functies die het nodig heeft. Voor meer informatie over dit onderwerp kunt u terecht bij hier.

  • Een zakelijke gebruiker kan de feature store gebruiken om de functies verkennen en begrijpen die worden gebruikt om hun toepassingen voor machinaal leren te voeden. Voor meer informatie over dit onderwerp kunt u terecht bij hier.

Model delen

Snowflake's mogelijkheid om ML-modellen te delen is ook een belangrijke onderscheidende factor. Dit maakt het makkelijker voor mensen om samen te werken aan ML-projecten en democratiseert de toegang tot ML.

Snowflake stelt gebruikers in staat om ML-modellen te delen met anderen, zowel binnen als buiten hun organisatie. Dit kan helpen om de ontwikkeling en acceptatie van ML-toepassingen te versnellen.

Hier zijn enkele specifieke gebruikssituaties voor de mogelijkheid van Snowflake om modellen te delen:

  • Een data wetenschapper zou een model voor machinaal leren delen met een zakelijke gebruiker zodat ze het kunnen gebruiken om hun data te verkennen en inzichten te genereren.

  • Een ingenieur in machinaal leren zou een machine-learning model delen met een DevOps engineer zodat ze het in productie kunnen nemen.

  • Een softwareleverancier zou een model voor machinaal leren delen met hun klanten zodat ze die kunnen gebruiken om hun producten en diensten te verbeteren.

Notitieboekjes met sneeuwvlokjes (in privé-preview)

Notitieboekjes met sneeuwvlokjes, een op cloud gebaseerde omgeving die speciaal is ontworpen voor het ontwikkelen en uitvoeren van code, heeft overeenkomsten met notebooks die al enkele jaren beschikbaar zijn op andere cloud data platforms. Databricks was de pionier op dit gebied, en BigQuery volgde met zijn aankondiging op 31 augustus. Deze notebooks zijn zorgvuldig ontworpen om de prestaties binnen het Snowflake ecosysteem te optimaliseren.

Snowflake Notebooks bieden een aantal voordelen ten opzichte van traditionele IDE's, zoals:

  • Samenwerking: Snowflake notitieboeken zijn gemakkelijk te delen met anderen, waardoor het gemakkelijk is om samen aan projecten te werken.

  • Interactiviteit: Snowflake Notebooks zijn interactief, zodat u met uw code kunt experimenteren en de resultaten meteen kunt zien.

  • Prestaties: Snowflake Notebooks zijn zeer performant, zodat u complexe query's en analyses snel kunt uitvoeren.

Snowflake Notebooks zijn momenteel in bèta, maar zullen naar verwachting in de nabije toekomst worden vrijgegeven voor het grote publiek.

Wat Snowflake als Machine Learning-ontwikkelomgeving onderscheidt van andere, is het feit dat het bestaat uit Python API's die toegankelijk zijn via de Snowpark ML-bibliotheek, en SQL-interfaces voor het definiëren, beheren en ophalen van features, samen met beheerde infrastructuur voor feature metadata beheer en continue verwerking van features. Hierdoor is er geen gespecialiseerde AI-expertise nodig. Bovendien stellen de Feature Store en de functies voor het delen van modellen Snowflake in staat om hun concurrenten beter in te halen, in het bijzonder Databricks, dat de afgelopen jaren duidelijk de overhand had door zijn integratie met ML Flow.

Conclusie

De onthulling van nieuwe functies door Snowflake, waaronder Snowflake Cortex, Copilot, Document AI en notebooks, bevestigt de toewijding van het bedrijf aan innovatie. Hoewel de aankondigingen van de data wetenschap aansluiten bij de huidige GenAI-trends, is het noodzakelijk om ze met de nodige voorzichtigheid te benaderen. Het is opmerkelijk dat bepaalde functies, hoewel ze al lang geleden zijn aangekondigd, nog steeds niet universeel beschikbaar zijn in alle omgevingen. Laten we deze innovaties tot slot met een open geest en een voorzichtig optimisme benaderen, klaar om de mogelijkheden te omarmen en tegelijkertijd de realiteit niet uit het oog te verliezen.

Medium Blog bij Artefact.

Dit artikel werd oorspronkelijk gepubliceerd op Medium.com.
Volg ons op ons medium Blog !