Datenmodelle automatisiert erstellen
Wenn in Unternehmen Datenmodelle erstellt werden sollen, geschieht dies meist nach Gesprächen mit Domänexpert:innen und der Sichtung bestehender Daten. Die Komplexität der Aufgabe wächst dabei mit den Ansprüchen. Vor allem eine Datenübersicht über alle Datenquellen und ausgetauschten Daten im gesamten Unternehmen kann schwierig und zeitintensiv werden. Dies kann zur Folge haben, dass eine solche Übersicht entweder gar nicht erstellt wird oder das Ergebnis bereits bei der Fertigstellung quasi veraltet ist. Künstliche Intelligenz kann dabei helfen, ein solches Datenmodell automatisiert zu erstellen.
Schon bei der Analyse der Daten kann in kürzester Zeit Künstliche Intelligenz ein abstraktes Datenmodell erzeugen. Dabei werden Datentypen wie die Produkt-ID oder Konstruktionszeichnungen und die Beziehungen zwischen den Datentypen ermittelt. Im Rahmen der Data Governance bzw. des Datenverwaltungskonzeptes können über Data Mining die notwendigen Informationen für eine Datenübersicht zusammengetragen werden. Mit Hilfe von Data Mining können Daten analysiert und auch riesige Datenmengen (wie Big Data) ausgewertet werden. Data Mining verwendet Algorithmen aus der Statistik und Verfahren der künstlichen Intelligenz, um in Datensätze automatisch Muster, Trends oder Zusammenhänge zu finden.
Durch Verfahren wie Dependency Parsing und Prediction können die Beziehungen zwischen Datentypen identifiziert, beschrieben und mit einer Wahrscheinlichkeit versehen werden. Dependency Parsing ist ein Prozess, bei dem die grammatikalische Struktur eines Satzes analysiert wird und verwandte Wörter sowie die Art der Beziehung zwischen ihnen ermittelt werden.
Daten sortieren wie E-Mails
Verfahren wie Clustering oder Statistical Classification werden daraufhin angewendet die Datenübersicht häufig in Form eines Modells zu formen und in Bereiche aufzuteilen. Bei der Statistical Classification geht es darum, dass unmarkierte Daten in markierte Klassen oder Kategorien eingeordnet werden. Das funktioniert wie bei mit Spam-Filter im E-Mail-Programm. In diesem Fall werden unmarkierte E-Mails gescannt und entweder als ‘Spam’ oder ‘Nicht-Spam’ klassifiziert.
Der größte Nutzen einer automatisierten Datenmodell-Erstellung liegt in der Erhöhung der Datenqualität und der Reduzierung von Medienbrüchen. Ein Datenmodell kann als Ausgangspunkt für die Entwicklung von KI-Anwendungen genutzt werden. Darüber hinaus ist ein durchgängiges Datenmodell der Schlüssel zu einem vollumfänglichen Digitalen Produkt- und Prozesszwilling.