Wie Wir ein Enterprise-RAG-System Aufgebaut Haben, das 1.400+ Dokumente mit Null Cloud-Kosten Verwaltet

Das Problem: Verstreutes Unternehmenswissen Kostet Mehr als Gedacht

Jedes Unternehmen mit mehr als 5 Mitarbeitern hat dasselbe unsichtbare Problem: Kritisches Wissen ist über E-Mails, Dokumente, Chats, CRM-Systeme, Datenbanken und die Köpfe der Menschen verteilt.

McKinsey schätzt, dass Knowledge Worker 19,8 % ihrer Arbeitszeit damit verbringen, interne Informationen zu suchen. Bei einem Unternehmen mit 20 Mitarbeitern und einem Durchschnittsgehalt von €40K entspricht das €160.000/Jahr, die durch erfolglose Suchen, wiederholte Rückfragen und Entscheidungen mit unvollständigem Kontext verloren gehen.

Herkömmliche Systeme (Unternehmens-Wikis, SharePoint, Confluence) lösen das Problem nicht: Sie erfordern, dass jemand die Dokumentation aktiv aktuell hält. Das tut niemand.

Die Lösung: Hybrides RAG mit Knowledge Graph

Wir haben ein Retrieval-Augmented Generation-System entwickelt, das das gesamte Unternehmenswissen automatisch indiziert und in natürlicher Sprache abfragbar macht. Kein generischer Chatbot — ein System, das Ihr Unternehmen kennt.

Architektur auf hohem Niveau

Das System besteht aus drei Schichten:

1. Ingestionsschicht — Verarbeitet automatisch Unternehmensdokumente (Strategie, Marketing, Interessenten, Infrastruktur, Integrationen, Preisgestaltung, Wettbewerbsanalysen) und segmentiert sie in semantisch kohärente Chunks. Es schneidet den Text nicht einfach ab: Es erkennt die Dokumentstruktur (Überschriften, Abschnitte, Codeblöcke) und bewahrt den Kontext.

2. Hybride Suchschicht — Kombiniert semantische Suche (versteht die Bedeutung der Frage) mit Keyword-Suche (findet exakte Übereinstimmungen). Die 60/40-Balance zwischen den beiden Ansätzen eliminiert sowohl die Falsch-Positive der rein semantischen Suche als auch die Starrheit der Schlüsselwortsuche.

3. Knowledge-Graph-Schicht — Ein Entitäten- und Beziehungsgraph, der Personen, Technologien, Projekte, Kompetenzen und Verticals abbildet. Wenn Sie fragen „Wer verwaltet Projekt X?", sucht das System nicht nur ähnliche Dokumente — es navigiert den Beziehungsgraphen.

Echte Zahlen

Metrik	Wert
Indizierte Dokumente	1.400+ Chunks aus 59 Quelldateien
Dokumententypen	Strategie, Marketing, Interessenten, Infrastruktur, Sicherheit, Wettbewerb
Entitäten im Knowledge Graph	71 (Personen, Technologien, Projekte, Skills, Unternehmen)
Gemappte Beziehungen	45+ typisierte Verbindungen
Durchschnittliche Suchlatenz	50–150ms
Zusätzliche Cloud-Kosten	€0/Monat
Aktualisierung	Kontinuierlich, automatisch
Unterstützte Sprachen	5 (IT, EN, ES, PT, DE, FR)

Wie die Suche Funktioniert: Ein Vektor Allein Reicht Nicht

Die meisten RAG-Systeme auf dem Markt verwenden ausschließlich Vektorsuche (Embeddings). Das funktioniert gut bei vagen Fragen („Erzähl mir etwas über die Marketingstrategie"), versagt aber bei präzisen Abfragen („Was ist der Preis für das Enterprise-Tier im Facility Management?").

Unser hybrider Ansatz löst beide Fälle:

Semantische Suche (60%) — Wandelt die Frage in einen hochdimensionalen Vektor um und findet Dokumente mit der ähnlichsten Bedeutung. Verwendet asymmetrische Embeddings: Die Art, wie eine Frage kodiert wird, unterscheidet sich von der eines Dokuments, da eine kurze Frage und ein langer Absatz unterschiedliche sprachliche Strukturen haben.

BM25-Suche (40%) — Probabilistischer Algorithmus, der die Häufigkeit von Begriffen gewichtet. Wenn Sie nach „Vacchelli €797" suchen, findet das System genau diesen Preis in den entsprechenden Dokumenten — selbst wenn die Abfrage semantisch nirgendwo „nah" ist.

Qualitätsfilter — Nur Ergebnisse oberhalb einer Mindestschwelle werden zurückgegeben. Keine Ergebnisse sind besser als falsche Ergebnisse: Im Enterprise-Kontext ist eine fehlerhafte Information schlimmer als gar keine Information.

Der Knowledge Graph: Beziehungen, Nicht Nur Dokumente

Dokumente enthalten Fakten. Aber Unternehmen funktionieren über Beziehungen.

„Alessandro verwaltet SCALA" ist kein Fakt, den man in einem Dokument findet — es ist eine Beziehung zwischen einer Personen-Entität und einer Projekt-Entität. Der Knowledge Graph erfasst diese Beziehungen und ermöglicht strukturelle Abfragen:

„Welche Technologien nutzt Projekt X?" → Graphnavigation
„Wer hat Kompetenzen in AI Strategy?" → Entitätssuche nach Typ
„Welche Projekte bedienen das Hospitality-Vertical?" → Multi-Hop-Traversal

Der Graph unterstützt 8 Beziehungstypen (uses, builds, serves, requires, competes_with, part_of, manages, has_skill) und 8 Entitätstypen. Jede Entität hat ihr eigenes Vektor-Embedding, sodass sie sowohl nach Bedeutung als auch nach Struktur gefunden werden kann.

Intelligente Deduplizierung: Kein Dokument Wird Zweimal Verarbeitet

Ein unterschätztes Problem bei RAG-Systemen ist die Neu-Indizierung. Ändert sich in einem Dokument eine von 200 Zeilen, verarbeitet ein naives System es vollständig neu: neues Chunking, neue Embeddings, neue API-Kosten.

Unser System berechnet einen kryptografischen Hash für jeden Chunk. Hat sich der Inhalt nicht verändert, wird er vollständig übersprungen — null API-Aufrufe, null Datenbankschreibvorgänge. Hat die Datei weniger Chunks als die Vorversion (weil sie gekürzt wurde), werden verwaiste Chunks automatisch entfernt.

Ergebnis: Eine vollständige Neu-Indizierung von 1.400+ Chunks dauert weniger als 30 Sekunden, wenn sich nichts geändert hat.

Native Integration mit dem AI-Assistenten

Das System ist keine eigenständige Anwendung mit einer zu pflegenden UI. Es ist direkt in den AI-Assistenten über das MCP-Protokoll (Model Context Protocol) integriert und stellt 8 Operationen bereit:

Suche — Abfrage in natürlicher Sprache mit optionalen Filtern
Abruf — Alle Chunks eines bestimmten Dokuments
Katalog — Vollständige Liste der indizierten Quellen
Ingestion — Hinzufügen neuer Dokumente auf Anfrage
Graphnavigation — Entitätssuche, Beziehungen, N-Hop-Nachbarschaft
Statistiken — Systemstatus in Echtzeit

Wenn der AI-Assistent eine Frage erhält, konsultiert er automatisch das RAG, bevor er antwortet. Er „erfindet" keine Antworten — er ruft verifizierte Fakten aus der unternehmenseigenen Knowledge Base ab.

Warum Kein SaaS?

RAG-as-a-Service-Systeme (Pinecone, Weaviate Cloud, Zilliz) kosten €200–2.000/Monat bei Enterprise-Volumen. Das ist sinnvoll für Unternehmen ohne Infrastrukturkompetenzen.

Wer bereits PostgreSQL im Produktivbetrieb hat, fügt pgvector als Erweiterung hinzu — kein neuer Dienst. Die Grenzkosten sind buchstäblich null: dieselben Server, dieselbe Datenbank, dasselbe Backup.

Der eigentliche Vorteil ist nicht die Einsparung: Es ist die Kontrolle. Unternehmensdaten verlassen niemals die eigene Infrastruktur. Kein Vendor-Lock-in, kein Risiko von Preisüberraschungen, keine Abhängigkeit von APIs, die ihre Nutzungsbedingungen ändern können.

Gewonnene Erkenntnisse

1. Hybrid schlägt reines Vektorsystem. Rein semantische Suche produziert zu viele Falsch-Positive in Enterprise-Kontexten, wo Präzision wichtiger ist als Recall. BM25 mit 40% liefert das notwendige „Grounding".

2. Der Knowledge Graph ist kein Luxus. Für Unternehmen mit komplexen Organisationsstrukturen beantwortet der Beziehungsgraph Fragen, die kein Vektorsystem lösen kann. „Wer ist wofür verantwortlich?" ist eine Graph-Frage, keine Ähnlichkeitsfrage.

3. Deduplizierung spart mehr als gedacht. In einem System mit periodischer Neu-Indizierung reduziert Hash-basierte Dedup den API-Verbrauch bei Folgedurchläufen um mehr als 90%.

4. Intelligentes Chunking macht 50% des Ergebnisses aus. Zu kleine Chunks verlieren den Kontext. Zu große verwässern die Relevanz. Die Segmentierung nach Dokumentstruktur (Header, Funktionen, Abschnitte) mit Overlap bewahrt sowohl Kontext als auch Präzision.

5. Null-Kosten bedeutet nicht Null-Aufwand. Kenntnisse in Data Engineering, NLP und Infrastruktur sind erforderlich. Aber einmal aufgebaut, ist der Betrieb des Systems im Wesentlichen kostenlos.

Für Wen Ist Das Sinnvoll?

Dieser Ansatz ist ideal für:

Unternehmen mit 10+ Mitarbeitern, die Wissen in verstreuten Dokumenten ansammeln
Technische Teams, die bereits PostgreSQL im Einsatz haben
Multi-Vertical-Organisationen mit heterogenen Knowledge Bases
Unternehmen, die >€200/Monat für Wissensmanagement-Tools ausgeben

Nicht sinnvoll für:

Startups mit 2–3 Personen (das Wissen steckt noch in den Köpfen)
Unternehmen ohne interne technische Kompetenzen (hier ist ein SaaS die bessere Wahl)
Anwendungsfälle mit weniger als 100 Dokumenten (Overkill)

Dieses System ist Teil von SCALA AI OS, dem KI-Betriebssystem für Multi-Vertical-Unternehmen. Mehr erfahren oder Demo anfordern.