003 - DATA Governance im KI-Zeitalter

003 - DATA Governance im KI-Zeitalter

Data Governance im Zeitalter Künstlicher Intelligenz (KI)?

Hintergrund

Data Governance ist im digitalen Zeitalter - und insbesondere mit den massiven Data Leaks die täglich passieren - eine IT-Disziplin die jedes Unternehmen ernst nehmen muss!

Schon seit Jahren gibt es im Big Data-/Data-Warehouse Umfeld diese Herausforderungen. Leider wurden viel zu häufig proprietäre Einzellösungen angewandt, die weder gut skalieren, noch Plattform-übergreifend eingesetzt werden konnten.

Durch den KI-Hype, der nicht mehr aufgehalten werden kann und somit kritische Daten über eine unüberschaubare Anzahl an Schnittstellen ausgewertet und ausgetauscht werden müssen, ist Data Governance ein hoch-kritischer Aspekt in IHRER Cyber Security Strategie!

WO liegen die Herausforderungen?

challenges Quelle: Factspan.com

Die Risiken im KI-Zeitalter werden sich noch deutlich verstärken!

Risks

Quellen: 1. Data Security Index report, Oct 2023 commissioned by Microsoft 2. Survey of 658 data security professions, Mar 2023, commissioned by Microsoft 3. Gartner Security Leader’s Guide to Data Security, Sep 2023

Hinzu kommen die neuen Anforderungen zur verteilten Verantwortlichkeit, die in diesem Zusammenhang deutlich komplexer aussehen, als im klassischen Multi-Cloud Umfeld!

Shared Quelle: Microsoft


Data Governance im KI-Zeitalter

Wie fange ich an?

challenges Quelle: Microsoft

  1. WO liegen meine Daten? - diese Frage wird leider extrem unterschätzt und so wie seit Jahrzehnten das Thema Asset Management vernachlässigt wird, können viele Unternehmen diese Frage nicht beantworten. Daher ist es zwingend erforderlich eine Geschäftsprozess-Analyse und deren Systemabhängigkeiten (Datenablage, Daten-Typen, Schnittstellen!) auf den aktuellen Stand zu bringen. Egal welche “Automation-/Discovery- Tools” Ihnen von einschlägigen Herstellern auf Power-Point vorgeführt werden, ohne diese vorbereitende Maßnahmen werden Sie wenig Erfolg ernten und nur meist viel Geld verbrennen. Basierend Informationen aus Ihrer CMDB und Prozess-Modellierung, sollte eine Liste mit zumindest folgenden Themen erstellt werden:

    • Daten-Quelle (Bsp. DB, Cloud Storage)
    • Daten-Typ (Datenformat)
    • Daten-Interfaces (Bsp. welche Systeme & Applikationen interagieren mit dieser Quelle? Abhängigkeiten festhalten!)
    • Daten-Kritikalität (geschäftskritisch)
    • Daten-Sensibilität (Datenschutz)
    • Daten-Zugriffsart (Bsp. DB, API, File, Web)
    • Daten-Berechtigungen (Bsp. RBAC oder SSO vorhanden für Einschränkung zu Datenzugriffen/Ablagen)
    • Data Owner (wer hat hierüber die Datenhoheit?)

    Danach kann man sich auf Toolsuche begeben, oder sich eben mit nachstehenden Boardmitteln behelfen!

  2. Zu nutzendes Tooling? - sollten Sie bereits Microsoft 365 im Einsatz und korrekt konfiguriert haben, so sind Sie in der glücklichen Lage, sich sehr schnell ein (Daten-)Lagebild zu erstellen. Nutzen Sie Defender for Cloud Apps, Purview Data Catalog, um Daten im M365-Universum (Sharepoint Online, Dynamics, Fabric/Data Lake, Azure spezifische Datendienste) zu analysieren. Somit stehen umfangreiche Data Governance Insights zur Verfügung.

  3. WIE sieht die KI-Plattformarchitektur aus? - Hier sollten Sie sowohl ein klares Konzept zur Plattform selbst, als auch eine klare Vorstellung des Data-Flows vorliegen haben! Fragestellungen, die beantwortet werden sollten:
    • WO werden die KI-Funktionen/Systeme bereitgestellt? (OnPrem, Public/PaaS-SaaS, Private/PaaS-SaaS)
    • WER hat die Verantwortung über diese Plattform? (externer Dienstleister, interne IT, Fachabteilung selbst?)
    • WELCHE externen KI-Funktionen werden genutzt? (Quellen wie OpenAI oder andere externe Short-/Large LM’s? Fertige Datasets von Dritten?)
    • WIE sieht die Datendrehscheibe hierzu aus? (Data Lake mit klar definierten Schnittstellen? Zwischenspeicherung der Quelldaten in der KI-Plattform erforderlich?)
    • WIE sieht das Berechtigungskonzept aus? (Zugriff auf Frontend und nachlagernde Datenstrukturen?)
    • WIE sieht das Verschlüsselungskonzept aus? (Wo werden wann, welche Daten verschlüsselt? In-Transfer/KI-Trainings/Datenablagen?)
    • WIE sieht das Data Lifecycle-Management aus? (Archivierung, Backup und Bereinigung?)
  4. WIE schütze ich meine Daten? - nachdem die Bestandsaufnahme abgeschlossen ist und das KI-Konzept vorliegt, kann man gezielt das Thema “Data Governance & Security” angehen. Hier sollten keine/wenige proprietäre Lösungen zum Einsatz kommen. Verwenden Sie etablierte Hyperscaler, die hier gute Frameworks und standardisierte Schnittstellen nutzen. Soll nicht wie eine Microsoft Produktveranstaltung klingen, aber im KI-Umfeld hat Microsoft das professionellste Lösungsportfolio! Schauen Sie sich nur mal das Thema Microsoft Fabric und Pureview Integration an!

HINWEIS: beginnen Sie bereits beim KI-Prototyping die grundlegenden Sicherheitsvorgaben einzuhalten. Viel zu häufig wird auch hier wieder das Thema Datensicherheit stiefmütterlich behandelt und zu spät angegangen!

Nutzen Sie etablierte KI-Dienste die ein umfassendes Berechtigungs- und Verschlüsselungskonzept bis runter auf einzelne Datensätze anbieten. Hier muß man sich einfach eingestehen, dass Microsoft am weitesten ist. Keine AWS, GCP oder KI-Startups sind annähernd in der Lage, derlei KI-Platform in standardisierter Weise so umfassend bereit zu stellen!

Schauen Sie sich die aktuellste Microsoft Fabric, Pureview und die nahtlose M365-Integration an - so sieht Data Governance & Security in einer KI-Plattform aus!


:+1: Eine einheitliche Plattform ist zukünftig erforderlich!

Sowohl durch die Komplexität und Vielfalt der (Daten-)Schnittstellen, als auch durch das Trainieren unterschiedlicher KI-Modelle, ist es wichtiger den je IHRE UNTERNEHMENSDATEN als echte Kronjuwelen zu behandeln!

Diese Komponenten müssen heute in einer zukunftsorientierten KI-Plattform und einer adäquaten Data Governance beachtet werden:

challenges Quelle: Microsoft


Microsoft ‘AI hub’ adressiert diese Security-Anforderungen vollumfänglich!

ai-hub ai-hub ai-hub



AI Security Frameworks



NOCH FRAGEN? SIE SUCHEN HIERZU PRAXISERPROBTE KONZEPTE & IMPLEMENTIERUNGSUNTERSTÜTZUNG?

Kontaktieren Sie mich: gf @ ctopilot . de oder vereinbaren Sie einen Online-Termin!

Erfinde nicht das Rad neu - COPY & INNOVATE. Lerne von den Besten und höre niemals auf zu lernen! Gerald Fehringer