Unternehmensnews teilen
Klare Daten, starke KI: Data Governance mit Microsoft Purview
Unternehmensnews
15. September 2025

Viele KI-Projekte scheitern nicht an der KI selbst, sondern an schlechter Datenqualität, fehlender Data Governance und unzureichenden Prozessen. In diesem Beitrag schauen wir uns an, wie Governance und Datenqualität zum entscheidenden Erfolgsfaktor für KI-Projekte werden – und wie moderne Tools wie Microsoft Purview dabei helfen, den Datendschungel zu lichten und Daten zuverlässig nutzbar zu machen.
Data Governance: Grundlage erfolgreicher KI-Projekte
In der KI-Community werden gern die Data Scientists und Algorithmen-Entwickler ins Rampenlicht gestellt. Doch die wahren Datenhelden arbeiten oft im Hintergrund: Sie sorgen dafür, dass die Datenbasis stimmt. Ohne saubere, gut verwaltete Daten nützt der beste KI-Algorithmus wenig – „Garbage in, garbage out“ gilt unverändert.
Studien untermauern dies: Gartner prognostiziert, dass bis 2027 rund 60 % der Unternehmen den erwarteten Nutzen ihrer KI-Anwendungsfälle nicht realisieren werden, weil es an einem kohärenten Data-Governance-Rahmenwerk fehlt. Bevor wir in die Technik einsteigen, klären wir kurz, was unter Data Governance zu verstehen ist und warum sie die Grundlage erfolgreicher KI‑Projekte bildet.
Was ist Data Governance?
Unter Data Governance versteht man alle Prozesse, Rollen und Richtlinien, die sicherstellen, dass Unternehmensdaten auffindbar, vertrauenswürdig, hochwertig und sicher sind. Sie schafft einen Rahmen, in dem geklärt ist, wer welche Daten verwaltet, wie Daten definiert werden (Stichwort Single Source of Truth) und welche Regeln für die Nutzung gelten.
Für KI ist das essenziell: Wenn Daten nicht stimmen oder niemand ihren Ursprung und Kontext kennt, leidet die Qualität der Modelle und das Vertrauen in die Ergebnisse. Microsoft bringt es treffend auf den Punkt: Die Zuverlässigkeit von Daten beeinflusst direkt die Genauigkeit von KI-Erkenntnissen – ohne vertrauenswürdige Daten droht ein Vertrauensverlust in KI-Systeme.
Gute Data Governance bedeutet auch, Datensilos aufzubrechen. In vielen Organisationen liegen Daten verteilt in verschiedenen Abteilungen oder Systemen. Ohne übergreifende Governance gibt es unterschiedliche Datendefinitionen, Versionen und Qualitätsniveaus. Das Resultat: widersprüchliche Berichte, manuelle Abstimmungsaufwände und Frust.
Data Governance setzt hier an, indem es Verantwortlichkeiten festlegt (z.B. Datenverantwortliche pro Fachbereich), Standards definiert (etwa für Datenqualität oder Metadaten) und Daten in einem Datenkatalog zentral auffindbar macht. Gerade für KI-Projekte, die oft Daten aus verschiedenen Quellen nutzen, ist diese „datengetriebene Ordnung“ ein Muss.

Microsoft Purview: Data Governance aus der Cloud
An dieser Stelle kommen moderne Werkzeuge ins Spiel – allen voran Microsoft Purview, ein SaaS-Tool, das Data Governance in der Praxis unterstützt. Purview (ursprünglich Ende 2020 als Azure Purview gestartet und 2022 ausgebaut) ist eine Cloud-Plattform für einheitliches Datenmanagement. Als Teil der Microsoft-Azure- und Microsoft-Fabric-Welt integriert es sich nahtlos in bestehende Datenplattformen und bündelt alle wichtigen Funktionen unter einer Oberfläche. Unternehmen können Purview ohne große Installationsprojekte sofort einsetzen – der Ramp-up ist kurz, da Microsoft die Infrastruktur betreibt. Für viele Bestandskunden ist das Tool lizenztechnisch oft schon abgedeckt oder zumindest leicht in bestehende Verträge integrierbar.
Kurz: Purview verspricht einen schnellen Start, um die Data-Governance-Hausaufgaben anzugehen.
Zentrale Funktionen von Microsoft Purview im Überblick:
- Einheitlicher Datenkatalog: Alle Datenbestände – von Datenbank-Tabellen über Data-Lake-Dateien bis hin zu BI-Berichten – werden in einem zentralen Katalog erfasst. Nutzende (vom Datenexperten bis zum Fachanwendenden) können über eine Suchfunktion Daten assets schnell auffinden, Metadaten einsehen und den Datenbestand durchstöbern. Dieser Unified Data Catalog bildet das Fundament, um Daten auffindbar zu machen und Silos sichtbar zu überwinden.
- Nachvollziehbare Datenherkunft (Data Lineage): Purview dokumentiert die Datenflüsse. Man sieht, aus welchen Quellen ein Dataset stammt, welche Transformations-Pipelines es durchlaufen hat und wo es letztlich genutzt wird (z.B. in welchem BI-Dashboard). Diese Transparenz der Datenherkunft hilft, Vertrauen aufzubauen und Auswirkungen von Änderungen abzuschätzen – ein wichtiges Feature, wenn KI-Modelle regelmäßig mit neuen Daten trainiert werden.
- Datenqualitätsmanagement: Neben der reinen Katalogisierung bietet Purview Funktionen, um die Datenqualität zu messen und zu überwachen. Dazu zählen Profiling (statistische Analysen wie Wertebereiche, Verteilungen, Dubletten etc.), das Definieren von Qualitätsregeln und die Berechnung von Datenqualitäts-Scores für Datensätze. Über Dashboards können Datenverantwortliche die „Gesundheit“ ihrer Datenbestände im Auge behalten.
- Zugriffskontrolle und Sicherheit: Purview integriert sich mit Azures Identity- und Zugriffskontrollen. So kann man Rollen und Berechtigungen feinjustieren – etwa wer im Katalog welche Daten sehen oder bearbeiten darf. Außerdem lassen sich in Purview Zugriffsrichtlinien zentral definieren, die dann auf den angebundenen Datenquellen durchgesetzt werden. Gerade in regulierten Branchen sind solche zentral verwalteten Policies Gold wert, um Datenschutz und Compliance einzuhalten.
Data Governance in der Praxis: Katalog, Rollen und Domänen
Wie unterstützt nun Purview konkret die Data Governance in einer Organisation?
Automatisierte Data Discovery durch einen durchsuchbaren Datenkatalog
Ein zentrales Element ist der bereits erwähnte Datenkatalog. Purview durchforstet (per Scanner) angebundene Datenquellen automatisch und erfasst Metadaten: Tabellen- und Spaltennamen, Dateistrukturen, Schema-Informationen, sogar automatische Klassifizierungen (z.B. Erkennen von personenbezogenen Daten oder Kreditkartennummern). All diese Informationen landen im Katalog, der für Nutzende über ein Web-Portal durchsuchbar ist. Damit wird Data Discovery zum Kinderspiel – ein Data Scientist kann etwa nach „Kundendaten Umsatz“ suchen und findet relevante Datensätze inklusive Beschreibung und zuständigem Owner.
Rollenmodell zur Sichtbarmachung von Verantwortlichkeiten
Stichwort Owner: Data Governance ist ohne die menschliche Komponente nicht denkbar. Purview bietet ein Rollenmodell, um Verantwortlichkeiten abzubilden. So lassen sich pro Datenquelle oder -domäne Datenverantwortliche (Owner) und Daten-Stewards (Pflegeverantwortliche) benennen. Diese Rollen werden in Purview hinterlegt, sodass bei jedem Datenasset ersichtlich ist, wer der Ansprechpartner ist.
Dadurch wird die oft abstrakte Governance greifbar: Konkrete Personen – die „Datenhelden“ in den Fachbereichen – kümmern sich um „ihre“ Daten. Das Rollenmodell sorgt auch dafür, dass Änderungen, Freigaben und Qualitätsprüfungen in geordneten Bahnen verlaufen und nicht dem Zufall überlassen bleiben.
Ein weiterer Governance-Baustein in Purview ist das Domänenmodell. Damit können Unternehmen ihre Datenwelt entlang der Geschäftsbereiche oder Daten-Domains strukturieren. Statt einen monolithischen Katalog zu haben, ordnet man Daten z.B. Domänen wie Marketing, Vertrieb, Produktion oder Finance zu. Diese Governance Domains richten sich an den Business Concepts aus und machen die Datenorganisation für das Unternehmen logisch nachvollziehbar. Jede Domain kann eigene Datenprodukte enthalten (eine Sammlung von Datenassets zu einem bestimmten Zweck) und eigene Verantwortliche haben.
Domänenstruktur und föderierte Governance für skalierbare Umsetzung
Dieser föderierte Governance-Ansatz – zentrale Standards, aber dezentrale Verantwortung in den Fachbereichen – vereint das Beste aus zwei Welten: Es gibt einen Rahmen einheitlicher Regeln und Qualitätsstandards für alle, zugleich aber die Flexibilität, dass jeder Bereich seine Daten entsprechend den eigenen Anforderungen verwalten kann. So bleibt Data Governance skalierbar, auch in heterogenen Organisationen. In der Praxis bedeutet das: Die IT oder der CDO legt die Spielregeln fest (z.B. welche Metadaten gepflegt werden, welche Qualitätskriterien gelten), während die Fachbereiche innerhalb ihrer Domäne eigenständig arbeiten können.
Purview unterstützt diesen Ansatz technisch, indem es sowohl globale Policen erlaubt als auch domänenspezifische Einstellungen. Letztlich entsteht ein lebendiges Datenökosystem: zentral koordiniert, aber dezentral gelebt – ein entscheidender Faktor, um Data Governance nicht nur auf dem Papier, sondern in der Organisationskultur zu verankern.
Datenqualität im Griff: Regeln, Scorecards und Monitoring
Eine solide Governance schafft die Voraussetzung, aber erst hohe Datenqualität gibt KI-Projekten den nötigen Treibstoff. Purview adressiert dieses Thema mit einem ganzen Paket an Data-Quality-Funktionen.
Data Profiling – die Ist‑Situation schnell erfassen
Zunächst hilft Data Profiling dabei, die Ist-Situation der Daten zu verstehen: Mit einem Klick kann ein Datenverantwortlicher z.B. eine Tabelle profilen lassen – Purview ermittelt dann automatisch Kennzahlen wie Werteverteilungen, Minimum/Maximum, Durchschnitt, Anzahl eindeutiger Werte, Leerschritte etc. So offenbaren sich schon früh Ausreißer oder Auffälligkeiten (etwa ein Datumfeld mit ungewöhnlich vielen Null-Werten).
Regeln definieren und automatisiert prüfen
Darauf aufbauend können Datenqualitätsregeln definiert werden. Purview liefert hierfür bereits vordefinierte Regeln für branchenübliche Qualitätsdimensionen (Out-of–the-Box), zum Beispiel Vollständigkeit, Konsistenz, Konformität zu Standards, Genauigkeit, Aktualität und Eindeutigkeit der Daten. Diese Regeln lassen sich ohne Programmierung anwenden und bei Bedarf anpassen oder durch eigene Regeln ergänzen. Einfache Beispiele: „Feld X darf nicht leer sein“, „Wert Y muss innerhalb des Bereichs 0–100 liegen“, „Attribut Z muss ein gültiges Datumsformat haben“ etc. – bis hin zu komplexeren Cross-Feld-Prüfungen.
Scorecards, Aggregation und Monitoring für kontinuierliche Verbesserung
Jeder Regel kann eine Schwellenwert zugewiesen werden (z.B. mindestens 95 % der Datensätze müssen die Regel erfüllen). Führt man nun einen Data-Quality-Scan aus, bewertet Purview alle markierten Datenspalten gegen die hinterlegten Regeln. Das Ergebnis ist ein Datenqualitäts-Score – meist in Prozent – der auf einen Blick zeigt, wie „gut“ die Daten den gesetzten Anforderungen entsprechen.
Diese Bewertungen aggregiert Purview über verschiedene Ebenen: Man erhält auf Spalten- und Tabellenebene Scores, kann diese aber auch pro Datenprodukt oder Domäne zusammenfassen. So könnte z.B. die Domäne „Finance“ insgesamt einen Score von 88 % haben, was anzeigt, dass im Schnitt 88 % aller Qualitätsprüfungen in diesem Bereich erfüllt sind. Solche quantifizierten Metriken sind hilfreich, um Fortschritte messbar zu machen und Problemfelder zu identifizieren.
Ein Data Steward kann z.B. in Purview eine Übersichtsseite aufrufen, die die Qualität aller kritischen Datenelemente anzeigt, mit Ampelfarben oder Trendpfeilen. Bei Verschlechterungen (etwa weil ein Quellsystem plötzlich vermehrt fehlerhafte Einträge liefert) können automatische Benachrichtigungen ausgelöst werden. So wird Datenqualität zu einer kontinuierlichen Aufgabe – Abweichungen werden früh erkannt, statt erst im fertigen KI-Report.
Microsoft beschreibt diesen Ansatz so: „Durch systematisches Datenqualitätsmanagement können Organisationen die Qualität ihrer Daten effektiv messen, überwachen und verbessern, was die Zuverlässigkeit KI-basierter Insights stärkt und Vertrauen in datengetriebene Entscheidungen fördert.“
Anders gesagt: Hochwertige Daten bedeuten verlässlichere KI-Ergebnisse – das zahlt direkt auf den Erfolg des Projekts ein.
Vorteile von Microsoft Purview auf einen Blick
Natürlich gibt es am Markt verschiedene Data-Governance-Lösungen – doch Purview bringt einige handfeste Vorteile mit:
- Schneller Einstieg: Als Cloud-Service war Purview ohne großen Installationsaufwand nutzbar. Innerhalb weniger Tage ließen sich erste Datenquellen anbinden und Ergebnisse (z.B. gefüllter Katalog, erste Qualitätsmetriken) erzielen. Gerade für Unternehmen, die schnell erste Governance-Erfolge sehen möchten, ist dieser Time-to-Value ein Plus.
- Integration in die Microsoft-Welt: Purview spielt seine Stärken insbesondere in Microsoft-zentrierten Datenlandschaften aus. Es integriert sich nahtlos mit wichtigen Azure-Diensten wie Azure Data Lake, Azure SQL, Synapse Analytics oder Power BI. Für Organisationen, die ohnehin stark auf Microsoft setzen, ist Purview somit eine logische Erweiterung – viele Komponenten (Authentifizierung via Azure AD, Benutzerverwaltung, Sicherheit und Compliance-Features) greifen reibungslos ineinander. Das macht auch die Bedienung für Nutzende vertraut und reduziert den Einführungsaufwand deutlich.
- Microsoft Fabric + Purview – eine starke Kombination: Besonders hervorzuheben ist die Synergie zwischen Microsoft Purview und der Datenplattform Microsoft Fabric. Fabric bündelt zentrale Analytics- und KI-Services von Microsoft in einer integrierten Umgebung. Purview ergänzt Fabric ideal, indem es Governance-Funktionen wie Data Discovery, Lineage, Sensitivitätsklassifizierung und Datenqualitätsmanagement End2End für die gesamte in Fabric abgebildete Datenwertschöpfungskette bereitstellt. So profitieren Nutzende von einer durchgängigen, nahtlosen Nutzererfahrung, können schnell auf Daten zugreifen und zugleich sicherstellen, dass alle Datenbestände innerhalb klarer Governance-Leitlinien genutzt werden.
- Breites Funktionsspektrum unter einem Dach: Wie oben beschrieben, deckt Purview sehr viele Aspekte ab – vom Katalog über Lineage bis zur Datenqualität. Dieser „One-Stop-Shop“-Ansatz verhindert Insellösungen. Zudem entwickelt Microsoft Purview rasant weiter: 2024 kamen etwa das neue Katalog-Interface, erweiterte Data-Lineage-Tools und das umfassende Datenqualitätsmodul hinzu. Für Anwender bedeutet das: Mit Purview hat man eine zukunftssichere Plattform, die mit den Anforderungen mitwächst.
- Lizenzierung und Kosten: Für viele Bestandskunden ist Purview (teilweise) in bestehenden Microsoft-Lizenzpaketen enthalten oder über Azure-Guthaben finanzierbar. Beispielsweise nutzen Unternehmen mit Microsoft 365 E5 bereits Purview-Komponenten für Compliance; und auch das Purview Data Governance in Azure folgt einem Pay-as-you-go-Modell, wo man pro tatsächlich verwaltetem Datenasset zahlt. Dadurch gibt es oft keine hohen Einstiegskosten – ein wichtiger Punkt für Entscheidende.
Grenzen und Herausforderungen
Natürlich ist nicht alles eitel Sonnenschein – auch Microsoft Purview hat Grenzen, die man realistisch betrachten sollte:
- Eingeschränkte Konnektoren jenseits der MS-Welt: Purview glänzt vor allem mit Azure- und Microsoft-Datenquellen. Die Anbindung von Drittsystemen (anderen Clouds oder On-Premises-Datenbanken) ist zwar möglich, aber teils noch limitiert. So unterstützt Purview etwa Snowflake-Datenbanken, und auch Google BigQuery kann eingebunden werden – allerdings (Stand 06/2025) nur in einer Preview-Version und mit begrenztem Funktionsumfang. Für sehr heterogene Datenlandschaften, die stark auf Non-Microsoft-Technologien setzen, muss geprüft werden, ob alle wichtigen Quellen integriert werden können oder ob Workarounds nötig sind.
- Rasante Entwicklung – steigende Komplexität: Einerseits ist es positiv, dass Microsoft Purview schnell neue Features liefert. Andererseits bedeutet der schnelle Wandel auch, dass sich Oberfläche und Funktionen häufig ändern. Nutzende berichten, dass manche Module noch unausgereift wirken oder anfangs instabil waren. Beispielsweise wurde das gesamte Katalog-Interface 2024 runderneuert, was zunächst Einarbeitung und Umstellung erforderte. Für Anwender heißt das: Purview ist kein statisches Werkzeug, sondern eher eine Reise. Man sollte eine gewisse Aufwandsreserve für Updates und Schulungen einplanen, da „lebende“ Tools naturgemäß Bewegung in Prozesse bringen.
- Funktionsumfang vs. Spezialisierung: Purview deckt vieles ab, geht aber in einzelnen Bereichen vielleicht nicht so tief wie Spezialwerkzeuge. Ein Beispiel: Das Business-Glossar in Purview ist nützlich, aber ein dediziertes Metadata-Management-Tool könnte hier mehr Raffinesse bieten. Ähnliches gilt für Master Data Management (MDM), das Purview nicht direkt abbildet (Microsoft setzt hier auf Partnerintegration, z.B. Profisee). Es ist wichtig zu erkennen, dass Purview primär ein Governance-Überbau ist – für operative Datenqualitätssicherung oder MDM könnten ergänzende Tools sinnvoll bleiben.
- Umgang mit fehlgeschlagenen Datenqualitäts-Scans. Purview ermöglicht aktuell noch nicht, direkt aus der Oberfläche heraus detaillierte Informationen auf Ebene einzelner fehlerhafter Datensätze (z. B. betroffene IDs oder spezifische Zeilen) anzuzeigen. Dies erschwert es erheblich, konkrete Maßnahmen zur Behebung einzuleiten – etwa indem man direkt ein Ticket zur Korrektur an ein verantwortliches Team weiterleitet, inklusive aller notwendigen Details. Zwar ist ein solches Szenario theoretisch mit Purviews Workflow-Funktion umsetzbar, es bedarf jedoch zusätzlicher manueller Konfiguration und Integration (z. B. Anbindung an ein Ticketsystem wie Jira oder ServiceNow). Im Vergleich zu spezialisierten Data-Quality-Tools, die solche Workflows bereits standardmäßig mitliefern, ist dieser Aspekt bei Purview aktuell noch nicht optimal gelöst.
Trotz dieser Punkte überwiegt bei vielen Unternehmen der Mehrwert, den Purview bietet. Die genannten Herausforderungen sind meist handhabbar, insbesondere da Microsoft in engem Austausch mit der Community steht und auf Feedback reagiert. So werden z.B. laufend neue Konnektoren nachgeschoben und Kinderkrankheiten behoben.
Wer sich für Purview entscheidet, sollte sich der Dynamik bewusst sein – aber genau diese Dynamik sorgt auch dafür, dass Purview am Puls der Zeit bleibt (Stichwort Integration von KI in die Datenverwaltung, die Microsoft bereits andeutet).
Fazit: Data Governance als Startpunkt für erfolgreichen KI‑Einsatz
KI-Projekte haben enormes Potenzial – doch ihr Schicksal hängt maßgeblich von der Datenbasis ab. Schlechte Datenqualität, unklare Verantwortlichkeiten und Silodenken wirken wie Sand im Getriebe und lassen so manches ambitionierte AI-Vorhaben ins Stocken geraten. Umgekehrt zeigt sich: Investitionen in Data Governance und Datenqualitätsmanagement zahlen sich direkt in Geschwindigkeit, Qualität und Akzeptanz von KI-Lösungen aus. Tools wie Microsoft Purview bieten hier einen praktischen Weg, um innerhalb kurzer Zeit Ordnung ins Datenchaos zu bringen und einen durchgängigen Blick auf die Daten zu schaffen – vom Ursprung über die Nutzung bis hin zur Qualität.
Menschen und Organisationskultur als Erfolgsfaktor
Am Ende sind es jedoch nicht die Tools allein, die den Unterschied machen, sondern die Menschen, die sie einsetzen. Die wahren Datenhelden sind jene Entscheidenden und Mitarbeitenden, die erkannt haben, dass datengetriebener Erfolg bei der Basis beginnt. Sie etablieren in ihren Unternehmen eine Kultur, die Daten als wertvolles Gut behandelt – mit klaren Regeln und Verantwortlichkeiten. Microsoft Purview kann als Enabler dienen: Es vereinfacht den Weg, indem es viele Governance-Aufgaben out-of-the-box bereitstellt.
Doch den Schritt gehen müssen Organisationen selbst. Für fachlich interessierte Entscheidende, die vielleicht keine tiefen Technikspezialisten sind, lautet die Kernbotschaft: KI-Erfolg ist kein Zufall, sondern planbar – wenn man die richtigen Grundlagen legt. Anstatt nur dem nächsten Machine-Learning-Algorithmus hinterherzujagen, lohnt es sich, die weniger glamourösen Fragen zu stellen: Sind unsere Daten gut genug? Wissen wir, woher sie stammen? Wer ist dafür verantwortlich? Wenn Sie diese Fragen mit Hilfe von Data Governance beantworten, legen Sie den Grundstein, damit Ihre Data Scientists überhaupt glänzen können.
Data Governance als langfristige Investition
In einer Welt, in der Daten als „das neue Öl“ gelten, braucht es Menschen, die dieses Öl raffinieren können – Datenhelden eben. Sie sorgen dafür, dass aus Rohdaten vertrauenswürdige Informationen werden. Und am Ende liefern genau diese Informationen die Power, um KI-Projekte zum Erfolg zu führen. Mit einer Lösung wie Microsoft Purview stehen ihnen dafür alle Werkzeuge zur Verfügung, um aus Daten Werte zu schaffen. Es liegt an uns, sie zu nutzen.
Fazit: Wer morgen KI einführen will, sollte heute mit Data Governance anfangen. Denn die Sieger von morgen sind diejenigen, die ihre Daten schon heute im Griff haben. Die Datenhelden.

Über den Autor
Richard Madsack ist Lead Data Strategy & Data Governance und seit über 15 Jahren in der IT tätig, davon 6 Jahre mit Fokus auf Data Governance und Data Excellence. Seine Schwerpunkte liegen in Data Governance, Data Quality und Data Catalogs – mit dem Ziel, Organisationen zu befähigen, Daten ganzheitlich zu betrachten und echten Mehrwert daraus zu ziehen.
Neugierig auf konkrete Anwendungsfälle und praktische Schritte, um KI wirkungsvoll einzusetzen?
Dann kommen Sie zu unserem Onsite‑Event „Becoming a Frontier Firm“ am 1. Oktober 2025 in Köln — mit Microsoft‑Expert*innen, spannenden Praxisberichten und viel Gelegenheit zum Netzwerken.
Unternehmensnews teilen
Weitere Unternehmensnews
44 Beiträge