Jedes Unternehmen hat Daten. Produktbeschreibungen, Prozessdokumentation, Kundenkommunikation, Angebote, Projektabläufe. Das Problem ist nicht die Menge – das Problem ist die Form.

Laut Studien von Gartner und IBM liegen rund 80 Prozent aller Unternehmensinformationen in unstrukturierter Form vor: verstreut über E-Mails, Word-Dokumente, Präsentationen, lokale Festplatten und verschiedene Softwaresysteme. Ein Großteil des Unternehmenswissens steckt nicht in Datenbanken, sondern in den Köpfen einzelner Mitarbeiter, in Ordnerstrukturen, die nur die jeweilige Abteilung versteht, und in Dokumenten, deren Existenz niemand außerhalb des Teams kennt.

Das hat Folgen. Laut der Bitkom-Studie Data Economy 2024 schöpfen nur 6 Prozent der deutschen Unternehmen das Potenzial ihrer verfügbaren Daten vollständig aus. 60 Prozent verschenken es weitgehend. Und 76 Prozent sehen die Datenökonomie gleichzeitig als entscheidend für ihre zukünftige Wettbewerbsfähigkeit. Das heißt: Die meisten Unternehmen wissen, dass ihre Daten wertvoll sind – können sie aber nicht nutzen.

Was Datenstruktur bedeutet – und was nicht

Datenstruktur klingt nach IT-Projekt. Nach Datenbanken, Servern und technischem Fachpersonal. Das ist ein weit verbreitetes Missverständnis, das viele Unternehmen davon abhält, den entscheidenden ersten Schritt zu machen.

Datenstruktur beginnt nicht bei der Technologie. Sie beginnt bei der Frage: Was macht dieses Unternehmen eigentlich – und wie lässt sich das in klare Kategorien, Beziehungen und Hierarchien übersetzen?

Stellen Sie sich ein Dienstleistungsunternehmen vor, das über die Jahre gewachsen ist. Es bietet heute 40 verschiedene Leistungen an, aber niemand kann spontan eine vollständige Liste erstellen. Manche Leistungen tragen intern einen anderen Namen als auf der Website. Die Zuordnung zu Kunden, Branchen oder Prozessen existiert nur im Kopf der Geschäftsführung. Neue Mitarbeiter brauchen Monate, um zu verstehen, was das Unternehmen eigentlich alles kann.

Datenstruktur bedeutet: Diese Leistungen werden systematisch erfasst, kategorisiert und in Beziehung zueinander gesetzt. Jede Leistung bekommt einen definierten Namen, eine Beschreibung, eine Zuordnung zu Kundensegmenten, zu internen Prozessen, zu benötigten Kompetenzen. Es entsteht ein Modell, das das Unternehmen abbildet – nicht als statisches Organigramm, sondern als verknüpftes System aus Leistungen, Prozessen, Zielgruppen und Werten.

Vom Wissen in den Köpfen zum maschinenlesbaren Modell

Solange das Wissen eines Unternehmens in Meetings, E-Mails und individuellen Erfahrungen lebt, ist es an Personen gebunden. Es lässt sich weder skalieren noch automatisieren. Und es geht verloren, wenn Mitarbeiter das Unternehmen verlassen.

Strukturierte Daten verändern das grundlegend. Sie überführen implizites Wissen in ein explizites, maschinenlesbares Format. Das klingt abstrakt, hat aber sehr konkrete Auswirkungen. Wenn die Leistungen, Prozesse und Produkteigenschaften eines Unternehmens strukturiert vorliegen, wird daraus ein digitaler Zwilling – ein Modell, das die Realität des Unternehmens in einer Form abbildet, mit der sowohl Menschen als auch Maschinen arbeiten können.

Damit dieses Modell zuverlässig funktioniert, muss es als einzige, verbindliche Quelle gelten – in der Fachsprache: eine Single Source of Truth. Was das konkret bedeutet und warum es der entscheidende Unterschied zwischen einem nützlichen Modell und einem weiteren Datenfriedhof ist, vertiefen wir im Bereich Digitaler Zwilling.

Für Menschen bedeutet das: Klarheit. Einheitliche Begriffe, nachvollziehbare Zuordnungen, ein gemeinsames Verständnis dessen, was das Unternehmen leistet und wie es funktioniert. Neue Mitarbeiter verstehen schneller, Abteilungen kommunizieren präziser, die Geschäftsführung hat den Überblick.

Für KI bedeutet es: Arbeitsfähigkeit. Ohne strukturierte Daten kann ein KI-System keine sinnvollen Antworten liefern, keine Prozesse automatisieren, keine relevanten Empfehlungen geben. Mit strukturierten Daten kann es genau das – und zwar auf Basis des tatsächlichen Unternehmenswissens, nicht auf Basis allgemeiner Trainingsdaten.

Woraus eine Datenstruktur besteht

Eine tragfähige Datenstruktur besteht aus vier Elementen:

Erstens: Kategorien. Die grundlegenden Bausteine des Unternehmens werden benannt und gruppiert – Leistungen, Produkte, Zielgruppen, Kanäle, Kompetenzen, Werte. Was existiert?

Zweitens: Eigenschaften. Jeder Baustein wird mit definierten Merkmalen versehen. Eine Leistung hat einen Namen, eine Beschreibung, einen Nutzen, eine Zielgruppe, einen Preis, eine Dauer. Was zeichnet es aus?

Drittens: Beziehungen. Die Verbindungen zwischen den Bausteinen werden explizit gemacht. Welche Leistung gehört zu welcher Kundengruppe? Welcher Prozess hängt von welcher Kompetenz ab? Welches Produkt ergänzt welches andere? Wie hängt es zusammen?

Viertens: Hierarchien. Die Ebenen werden definiert. Übergeordnete Leistungsbereiche, darunter einzelne Leistungen, darunter Leistungsbestandteile. Nicht alles liegt auf einer Ebene – die Tiefe der Struktur bestimmt die Tiefe der möglichen Automatisierung.

Diese vier Elemente bilden zusammen das, was in der Praxis häufig als Ontologie oder Wissensmodell bezeichnet wird. In weniger technischer Sprache: Es ist die Landkarte des Unternehmens.

Warum es sich rechnet

Die Zahlen sprechen eine deutliche Sprache. Laut einer Studie des Capgemini Research Institute erzielen Unternehmen, die ihre Daten systematisch nutzen, 70 Prozent mehr Umsatz pro Mitarbeiter und 22 Prozent mehr Gewinn als ihre Wettbewerber. McKinsey beziffert die Wahrscheinlichkeit, dass datengetriebene Unternehmen profitabler sind, auf das 19-Fache im Vergleich zu Unternehmen, die es nicht sind. Und laut derselben Quelle berichten Outperformer von EBITDA-Steigerungen zwischen 15 und 25 Prozent.

Gleichzeitig qualifizieren sich nach der Capgemini-Studie nur etwa 16 Prozent aller Unternehmen als sogenannte „Data Masters“ – Organisationen, die über die nötigen Werkzeuge, die Governance und die Kultur verfügen, um ihre Daten wirklich zu nutzen. Für die übrigen 84 Prozent liegt der entscheidende Engpass nicht bei den Werkzeugen, sondern bei der Grundlage: der Struktur.

Struktur vor Werkzeug

Es gibt heute mehr KI-Tools als je zuvor. Chatbots, Automationsplattformen, Analysesysteme – der Markt wächst monatlich. Doch jedes dieser Werkzeuge ist nur so gut wie die Daten, die es verarbeitet. Ein Chatbot, der auf unstrukturierte, widersprüchliche oder unvollständige Informationen zugreift, liefert unbrauchbare Ergebnisse. Ein Automationstool, das nicht weiß, welche Leistungen zu welchen Kunden gehören, kann keine sinnvollen Workflows auslösen.

Das Forschungsinstitut Gartner identifiziert Wissensmodelle – sogenannte Knowledge Graphs – als eine der kritischen Voraussetzungen für die erfolgreiche Einführung generativer KI in Unternehmen. Der Grund: Sie liefern die faktische Grundlage, auf der KI-Systeme arbeiten können, ohne zu halluzinieren. Ohne diese Grundlage bleibt KI ein Werkzeug, das zwar beeindruckend klingt, aber keine zuverlässigen Ergebnisse liefert.

Datenstruktur ist kein einmaliges IT-Projekt. Sie ist eine unternehmerische Entscheidung, das eigene Wissen von einer impliziten Ressource in einen expliziten Vermögenswert zu verwandeln. Und sie ist der Schritt, der den Unterschied macht zwischen einem Unternehmen, das KI einsetzt, und einem, das von KI profitiert.