Nu we nadenken over de inzichten die zijn gedeeld tijdens het 'Snowday'-evenement op 1 en 2 november, staat ons een stortvloed aan spannende onthullingen te wachten over de toekomst van Snowflake.

Dit artikel duikt in de opmerkelijke data wetenschapsfuncties die tijdens het evenement werden onthuld en werpt een licht op de innovatie en vooruitgang die centraal stonden.

Ga met ons mee op deze reis en ontdek de hoogtepunten van Snowdays, met speciale aandacht voor de nieuwste wetenschappelijke functies op data , zoals:

Hoogtepunten van Snowflake Cortex

class="img-responsive

Een overzicht van GenAI- en LLM-mogelijkheden in Snowflake

Taalmodel (LLM) mogelijkheden (sommige modellen zijn openbaar, andere zijn nog in een besloten preview)

LLM's zijn een nieuw type AI model dat tekst kan genereren, talen kan vertalen, verschillende soorten creatieve content kan schrijven en uw vragen op een informatieve manier kan beantwoorden. Snowflake's nieuwe LLM-mogelijkheden maken het een van de eerste cloud data platforms die gebruikers toegang biedt tot deze krachtige nieuwe technologie.

Dit onderscheidt Snowflake van andere cloud data platformen omdat het Snowflake gebruikers een aanzienlijk voordeel geeft in termen van het ontwikkelen van AI toepassingen. Met Snowflake Cortex kunnen gebruikers nu eenvoudig AI toepassingen bouwen die een breed scala aan taken kunnen uitvoeren, zoals het genereren van reports, het identificeren van fraude en het voorspellen van klantgedrag.

Hier volgen enkele specifieke gebruikssituaties voor de LLM-mogelijkheden van Snowflake:

  • Sentimentdetectie: Analyseer feedback van klanten, sociale media-interacties of productbeoordelingen om het algemene sentiment te begrijpen en verbeterpunten te identificeren. (Verdere uitwerking wordt gegeven in SQL-commando's voor sentimentanalyse en -samenvatting (in privé-preview).

  • Tekst samenvatten: Genereer beknopte samenvattingen van lange documenten, e-mails of reports om snel de belangrijkste informatie te begrijpen en tijd te besparen. (Verdere uitwerking wordt gegeven in SQL-commando's voor sentimentanalyse en samenvatten (in privévoorbeeld).

  • Vertaling: Heb je vertaling nodig voor de waarden in een specifieke kolom tijdens je transformaties? U hoeft geen beroep te doen op een externe API; u kunt de vertaling naadloos binnen Snowflake uitvoeren.

Geavanceerde zoekfuncties (in privévoorbeeld)

Met de nieuwe geavanceerde zoekfuncties van Snowflake is het voor gebruikers eenvoudiger dan ooit om de data te vinden die ze nodig hebben, ongeacht waar deze is opgeslagen. Dit is een groot voordeel ten opzichte van andere cloud data platforms, die meestal beperktere zoekmogelijkheden hebben.

De nieuwe zoekfuncties van Snowflake stellen gebruikers in staat om:

  • Doorzoek databases, Iceberg-tabellen, data in Snowflake, Native Applications en de Snowflake Marketplace.

  • Gebruik query's in natuurlijke taal om te zoeken naar data.

  • Filter zoekresultaten op verschillende criteria, zoals data type, bestandsgrootte en aanmaakdatum.

Deze geavanceerde zoekfuncties kunnen gebruikers helpen om tijd te besparen en productiever te werken met data. Een data analist kan de nieuwe zoekfuncties bijvoorbeeld gebruiken om snel alle data te vinden die relevant zijn voor een specifiek analyseproject. Of een zakelijke gebruiker kan de nieuwe zoekfuncties gebruiken om alle data te vinden die betrekking hebben op een specifieke klant of een specifiek product.

Om nog maar te zwijgen over het feit dat het gebruik van de verschillende sneeuwvlokfilters die deze zoekfuncties bieden (kolomnaamgeving, tagging, metadataspecificatie) een toename in data consistentie teweegbrengt.

Tot slot is het de moeite waard om op te merken dat dit een belangrijk aspect van data catalogi aanpakt. Gezien de uitdagingen die inherent zijn aan het implementeren van een data catalogus, is het bijzonder aantrekkelijk om gebruik te maken van deze geïntegreerde Snowflake-functie.

class="img-responsive

SQL-commando's voor sentimentanalyse en -samenvatting (in besloten voorvertoning)

De nieuwe SQL-commando's van Snowflake voor sentimentanalyse en samenvatten maken het gebruikers gemakkelijk om inzichten te halen uit hun data zonder nieuwe tools of talen te hoeven leren. Dit is een groot voordeel ten opzichte van andere cloud data platforms, waarvoor gebruikers meestal aparte tools moeten gebruiken voor deze taken.

De nieuwe SQL-commando's van Snowflake stellen gebruikers in staat om:

  • Het sentiment van tekst analyseren data, zoals klantbeoordelingen, berichten op sociale media en reacties op enquêtes.

  • Tekst data samenvatten om de belangrijkste informatie eruit te halen.

Deze nieuwe SQL-commando's kunnen gebruikers helpen om tijd te besparen en productiever te werken met data. Een zakelijke gebruiker kan de nieuwe SQL-opdrachten bijvoorbeeld gebruiken om snel het sentiment van klantbeoordelingen te analyseren of om een lang en complex rapport samen te vatten.

Snowflake Copilot (in privévoorvertoning)

Het is een door LLM aangedreven assistent om SQL te genereren en te verfijnen met natuurlijke taal. Daarnaast zal deze tekst-naar-code functionaliteit binnenkort programmatisch beschikbaar zijn via een functie voor algemeen gebruik, Text2SQL, met Snowflake Cortex.

class="img-responsive

Document Data extractie met document AI (in privévoorvertoning)

Snowflake Cortex' Document AI, ondersteund door LLM, maakt efficiënte extractie mogelijk van data uit verschillende documenttypes (pdf, word, txt, screenshots), waardoor tijd en middelen worden bespaard bij de handmatige verwerking van data .

Over het geheel genomen zijn de nieuwe functies van Snowflake zeer indrukwekkend en hebben ze het potentieel om een revolutie teweeg te brengen in de manier waarop mensen cloud data platforms gebruiken.

Snowflake onderscheidt zich duidelijk van de concurrentie door innovatieve functies te bieden waarmee gebruikers eenvoudiger AI toepassingen kunnen ontwikkelen en implementeren, data kunnen vinden, ML-functies kunnen beheren en ML-modellen kunnen delen. Snowflake maakt het gebruikers ook gemakkelijker om inzichten te halen uit hun data zonder nieuwe tools of talen te hoeven leren.

class="img-responsive

Winkel met functies (in besloten voorvertoning)

Een feature store is een centrale opslagplaats voor het beheren en delen van machine learning features. De nieuwe feature store van Snowflake maakt het makkelijker voor gebruikers om ML-modellen te ontwikkelen en in te zetten.

Dit onderscheidt Snowflake van andere cloud data platformen omdat het gebruikers een enkele plek biedt om al hun ML functies te beheren. Dit kan gebruikers helpen tijd te besparen en de efficiëntie van hun ML-ontwikkelingsproces te verbeteren.

Hier zijn enkele specifieke use cases voor Snowflake's feature store:

  • Een data wetenschapper zou de feature store kunnen gebruiken om de features te beheren en te delen die ze gebruiken om een machine learning model te ontwikkelen. Voor meer informatie over dit onderwerp kun je hier terecht.

  • Een machine learning engineer zou de feature store kunnen gebruiken om een machine learning model in productie te nemen en ervoor te zorgen dat het toegang heeft tot de features die het nodig heeft. Voor meer informatie over dit onderwerp kun je hier terecht.

  • Een zakelijke gebruiker kan de feature store gebruiken om de features te verkennen en te begrijpen die worden gebruikt om hun machine learning-toepassingen aan te drijven. Voor meer informatie over dit onderwerp kun je hier terecht.

Model delen

Snowflake's mogelijkheid om ML-modellen te delen is ook een belangrijke onderscheidende factor. Dit maakt het makkelijker voor mensen om samen te werken aan ML-projecten en democratiseert de toegang tot ML.

Snowflake stelt gebruikers in staat om ML-modellen te delen met anderen, zowel binnen als buiten hun organisatie. Dit kan helpen om de ontwikkeling en acceptatie van ML-toepassingen te versnellen.

Hier zijn enkele specifieke gebruikssituaties voor de mogelijkheid van Snowflake om modellen te delen:

  • Een wetenschapper op data zou een model voor machinaal leren kunnen delen met een zakelijke gebruiker, zodat die het kan gebruiken om zijn data te verkennen en inzichten te genereren.

  • Een machine learning engineer kan een machine learning model delen met een DevOps engineer, zodat zij het kunnen inzetten in de productie.

  • Een softwareleverancier zou een model voor machinaal leren kunnen delen met zijn klanten, zodat zij het kunnen gebruiken om hun producten en diensten te verbeteren.

Notitieboekjes met sneeuwvlokjes (in privé-preview)

Snowflake Notebooks, een cloud-gebaseerde omgeving die speciaal is ontworpen voor het ontwikkelen en uitvoeren van code, heeft overeenkomsten met notebooks die al enkele jaren beschikbaar zijn op andere cloud data platformen. Databricks was de pionier op dit gebied en BigQuery volgde met zijn aankondiging op 31 augustus. Deze notebooks zijn zorgvuldig ontworpen om de prestaties binnen het Snowflake ecosysteem te optimaliseren.

Snowflake Notebooks bieden een aantal voordelen ten opzichte van traditionele IDE's, zoals:

  • Samenwerking: Snowflake Notebooks zijn gemakkelijk te delen met anderen, waardoor het gemakkelijk is om samen te werken aan projecten.

  • Interactiviteit: Snowflake Notebooks zijn interactief, zodat je kunt experimenteren met je code en direct de resultaten kunt zien.

  • Prestaties: Snowflake Notebooks zijn zeer performant, zodat u complexe query's en analyses snel kunt uitvoeren.

Snowflake Notebooks zijn momenteel nog in bèta, maar zullen naar verwachting in de nabije toekomst worden vrijgegeven voor het grote publiek.

Wat Snowflake als Machine Learning ontwikkelomgeving onderscheidt van andere, is het feit dat het bestaat uit Python API's die toegankelijk zijn via de Snowpark ML bibliotheek, en SQL interfaces voor het definiëren, beheren en ophalen van features, samen met beheerde infrastructuur voor feature metadata beheer en continue feature verwerking. Dit maakt gespecialiseerde AI expertise overbodig. Bovendien stellen de Feature Store en de functies voor het delen van modellen Snowflake in staat om de concurrentie beter in te halen, met name Databricks, dat de afgelopen jaren duidelijk de overhand had door zijn integratie met ML Flow.

class="img-responsive

Conclusie

De onthulling van nieuwe functies door Snowflake, waaronder Snowflake Cortex, Copilot, Document AI en notebooks, bevestigt het streven van organisatienaar innovatie. Hoewel de aankondigingen van data wetenschap aansluiten bij de huidige GenAI-trends, is het noodzakelijk om ze met de nodige voorzichtigheid te benaderen. Het is opmerkelijk dat bepaalde functies, hoewel lang geleden aangekondigd, nog steeds in afwachting zijn van universele beschikbaarheid in alle omgevingen. Laten we deze innovaties tot slot benaderen met een open geest en een voorzichtig optimisme, klaar om de mogelijkheden te omarmen en tegelijkertijd de realiteit niet uit het oog te verliezen.

class="img-responsive

Medium Blog door Artefact.

Dit artikel is oorspronkelijk gepubliceerd op Medium.com.
Volg ons op onze Medium Blog!