Deep Dive Snowflake Intelligence: Der Semantic Layer als Schlüssel
Der Hype um «Talk to your Data» ist groß. Doch für Data Engineers und Architekten stellt sich bei Generative AI im Unternehmenskontext vor allem die Frage, wie Halluzinationen verhindert werden können.
«Talk to your Data» selbst ist zwar nicht neu, jedoch war es in der Vergangenheit selten erfolgreich. Ohne tiefes Verständnis des zugrundeliegenden Datenmodells und der Geschäftsregeln scheitert es oft daran, korrekte Aggregationen oder Joins zu bilden. An dieser Stelle setzt Snowflake Intelligence an und versucht das Problem mittels seines eigenen semantischen Layer zu lösen.
Die Architektur: Cortex Agent, Analyst und Search
Snowflake Intelligence verknüpft drei Dienste miteinander, die auf Snowflake Cortex basieren. Je nach Art der Abfrage kommen unterschiedliche Komponenten zum Einsatz:
- Cortex Agent (Orchestrator): Fungiert als «Gehirn», welches die Intention des Users verstehen soll. Cortex Agent zerlegt komplexe Anfragen in Teilaufgaben und routet sie an die passenden «Tools».
- Cortex Search (Unstrukturierte Daten): Nutzt eine hybride Suche (Vektor- und Keyword-Search) für Low-Latency-Retrieval aus Dokumenten (PDFs, Wikis).
- Cortex Analyst (Strukturierte Daten): Der Kern für SQL-Generierung. Anders als generische Text-zu-SQL-Ansätze nutzt der Analyst keine bloße Schema-Analyse, sondern stützt sich auf ein semantisches Modell.
Der Semantic Layer: Mapping von Schema zu Kontext
Hand aufs Herz: Das Hauptproblem bei ‹Talk to your Data› ist meistens nicht die KI, sondern das Datenmodell. Woher soll ein LLM wissen, dass sich hinter dem kryptischen Kürzel FCT_SLS die Umsatztabelle verbirgt? Oder, dass im Unternehmen ‹Churn› anders berechnet wird als es die Standard-Definition im Lehrbuch hergibt? Genau hier wird es bei «Talk to your Data» oft unangenehm, wenn der CEO falsche Zahlen bekommt. Der Semantic Layer fungiert hier als Dolmetscher: Er übersetzt die interne ‹Daten-Hieroglyphenschrift› in verständliche Business-Logik, bevor die KI überhaupt loslegt.
Wie das Mapping funktioniert
Angenommen, ein Business User fragt nach dem Gesamtumsatz pro Kunde, um sich beispielsweise auf einen anstehenden Sales Termin vorzubereiten. Ohne Semantic Layer müsste das Modell raten wie dies berechnet wird und woher es die Informationen erhalten kann. Mit dem Layer greift eine im Vorfeld definierte Logik in Snowflake Intelligence:
- Snowflake Intelligence extrahiert die Information, dass die Transaktionstabelle
FCT_SLSund die KundentabelleCUST_DIMheißt. - Im semantischen Modell ist definiert, dass «Revenue» der Summe aus
sales_amountentspricht und «Customer» über dieCUST_IDverknüpft wird. - Der Cortex Analyst nutzt diese Definitionen, um deterministisch den korrekten Code zu erzeugen:
SELECT
SUM(FCT_SLS.sales_amount),
CUST_DIM.CUST_ID
...
GROUP BY CUST_DIM.CUST_ID
Governance und Vertrauen
Insbesondere im Bereich Governance spielt Snowflake Intelligence seine Stärken aus. Das LLM erfindet keine Metriken sondern nutzt die im Semantic Model definierten Berechnungen. Dies schafft Vertrauen in die berechneten KPIs. Sollte sich zu einem Zeitpunkt die Berechnungslogik ändern, wie beispielsweise die Marge des Unternehmens definiert ist, so muss dies nur im semantischen Modell nachgepflegt werden. Das Prompting des Users bleibt jedoch unverändert. Auch Compliance-seitig können Nutzer aufatmen: Da das gesamte Processing innerhalb von Snowflake läuft, verlassen keine sensiblen Daten die Data Cloud.
Fazit: Keine Intelligence ohne Semantik
Snowflake Intelligence zeigt deutlich, dass der Erfolg von AI-Projekten im Data Warehousing nicht vom gewählten LLM abhängt, sondern von der Qualität der Metadaten. Der Semantic Layer ist hier nicht nur ein «Feature», sondern die kritische Komponente, die aus einem Sprachmodell einen verlässlichen Helfer macht. Dabei werden Analysten nicht ersetzt, sondern von der Last befreit, repetitive SQL-Abfragen für Standard-Reports zu schreiben. Sie können sich stattdessen auf andere, wertschöpfende Aufgaben konzentrieren wie auf das Design robuster semantischer Modelle.
Wer seine Datenstrategie heute zukunftsfähig machen will, muss Zeit in den Aufbau sauberer semantischer Modelle investieren. Nur so wird aus «Talk to your Data» eine echte Unterhaltung mit Mehrwert.
Interesse an der technischen Implementierung? Als synvert unterstützen wir Sie beim Aufbau der notwendigen Data Governance und semantischen Modelle, um Snowflake Intelligence produktiv zu nutzen.
