Come Abbiamo Costruito un Sistema RAG Enterprise che Gestisce 1.400+ Documenti con Zero Costi Cloud
Case study tecnico: sistema RAG ibrido con knowledge graph per gestione della conoscenza aziendale. Ricerca semantica + keyword in <150ms, 1.400+ documenti indicizzati, costo operativo zero.
Il Problema: la Conoscenza Aziendale Dispersa Costa Più di Quanto Pensi
Ogni azienda con più di 5 persone ha lo stesso problema invisibile: la conoscenza critica è frammentata tra email, documenti, chat, CRM, database e la testa delle persone.
McKinsey stima che i knowledge worker spendono il 19.8% del loro tempo cercando informazioni interne. Per un'azienda con 20 dipendenti a €40K medi, sono €160.000/anno bruciati in ricerche infruttuose, domande ripetute e decisioni prese con contesto incompleto.
I sistemi tradizionali (wiki aziendali, SharePoint, Confluence) non risolvono il problema: richiedono che qualcuno mantenga attivamente la documentazione aggiornata. Nessuno lo fa.
La Soluzione: RAG Ibrido con Knowledge Graph
Abbiamo costruito un sistema di Retrieval-Augmented Generation che indicizza automaticamente tutta la conoscenza aziendale e la rende interrogabile in linguaggio naturale. Non un chatbot generico — un sistema che conosce la tua azienda.
Architettura ad Alto Livello
Il sistema si compone di tre layer:
1. Layer di Ingestione — Processa automaticamente documenti aziendali (strategy, marketing, prospect, infrastruttura, integrazioni, pricing, analisi competitor) e li segmenta in chunk semanticamente coerenti. Non si limita a tagliare il testo: riconosce la struttura dei documenti (titoli, sezioni, blocchi di codice) e preserva il contesto.
2. Layer di Ricerca Ibrida — Combina ricerca semantica (capisce il significato della domanda) con ricerca per keyword (trova corrispondenze esatte). Il bilanciamento 60/40 tra i due approcci elimina sia i falsi positivi della ricerca puramente semantica che la rigidità della ricerca per parole chiave.
3. Layer Knowledge Graph — Un grafo di entità e relazioni che mappa persone, tecnologie, progetti, competenze e vertical. Quando cerchi "chi gestisce il progetto X?", il sistema non cerca solo documenti simili — naviga il grafo delle relazioni.
Numeri Reali
| Metrica | Valore |
|---|---|
| Documenti indicizzati | 1.400+ chunk da 59 file sorgente |
| Tipologie documento | Strategia, marketing, prospect, infrastruttura, sicurezza, competitor |
| Entità nel knowledge graph | 71 (persone, tecnologie, progetti, skill, aziende) |
| Relazioni mappate | 45+ connessioni tipizzate |
| Latenza media ricerca | 50-150ms |
| Costo cloud aggiuntivo | €0/mese |
| Aggiornamento | Continuo, automatico |
| Lingue supportate | 5 (IT, EN, ES, PT, DE, FR) |
Come Funziona la Ricerca: non Basta il Vettore
La maggior parte dei sistemi RAG sul mercato usa solo la ricerca vettoriale (embedding). Funziona bene per domande vaghe ("dimmi qualcosa sulla strategia marketing") ma fallisce miseramente per query precise ("qual è il prezzo del tier enterprise per facility management?").
Il nostro approccio ibrido risolve entrambi i casi:
Ricerca semantica (60%) — Converte la domanda in un vettore ad alta dimensionalità e trova i documenti con il significato più vicino. Usa embedding asimmetrici: il modo in cui codifica una domanda è diverso da come codifica un documento, perché una domanda breve e un paragrafo lungo hanno strutture linguistiche diverse.
Ricerca BM25 (40%) — Algoritmo probabilistico che pesa la frequenza dei termini. Se cerchi "Vacchelli €797", il sistema trova esattamente quel prezzo in quei documenti, anche se semanticamente la query non è "vicina" a nulla.
Filtro di qualità — Solo risultati sopra una soglia minima vengono restituiti. Meglio zero risultati che risultati sbagliati: in un contesto enterprise, un'informazione errata è peggio di nessuna informazione.
Il Knowledge Graph: Relazioni, non Solo Documenti
I documenti contengono fatti. Ma le aziende funzionano a relazioni.
"Alessandro gestisce SCALA" non è un fatto che trovi in un documento — è una relazione tra un'entità persona e un'entità progetto. Il knowledge graph cattura queste relazioni e permette query strutturali:
- "Quali tecnologie usa il progetto X?" → navigazione del grafo
- "Chi ha competenze in AI Strategy?" → ricerca entità per tipo
- "Quali progetti servono il vertical hospitality?" → traversal multi-hop
Il grafo supporta 8 tipi di relazione (uses, builds, serves, requires, competes_with, part_of, manages, has_skill) e 8 tipi di entità. Ogni entità ha il proprio embedding vettoriale, quindi può essere trovata sia per significato che per struttura.
Deduplicazione Intelligente: Mai Ri-processare lo Stesso Documento
Un problema sottovalutato nei sistemi RAG è la ri-indicizzazione. Se un documento cambia una riga su 200, un sistema naive lo ri-processa completamente: nuovo chunking, nuovi embedding, nuovi costi API.
Il nostro sistema calcola un hash crittografico di ogni chunk. Se il contenuto non è cambiato, skip completo — zero chiamate API, zero scritture database. Se il file ha meno chunk rispetto alla versione precedente (perché è stato accorciato), i chunk orfani vengono rimossi automaticamente.
Risultato: una re-indicizzazione completa di 1.400+ chunk richiede <30 secondi se nulla è cambiato.
Integrazione Nativa con AI Assistant
Il sistema non è un'applicazione standalone con una UI da mantenere. È integrato direttamente nell'assistente AI tramite il protocollo MCP (Model Context Protocol), esponendo 8 operazioni:
- Ricerca — Interrogazione in linguaggio naturale con filtri opzionali
- Recupero — Tutti i chunk di un documento specifico
- Catalogo — Lista completa delle sorgenti indicizzate
- Ingestione — Aggiunta di nuovi documenti on-demand
- Navigazione grafo — Ricerca entità, relazioni, vicinato N-hop
- Statistiche — Stato del sistema in tempo reale
Quando l'assistente AI riceve una domanda, consulta automaticamente il RAG prima di rispondere. Non "inventa" — recupera fatti verificati dalla knowledge base aziendale.
Perché Non un SaaS?
I sistemi RAG-as-a-Service (Pinecone, Weaviate Cloud, Zilliz) costano €200-2.000/mese per volumi enterprise. Hanno senso per chi non ha competenze infrastrutturali.
Per chi ha già un database PostgreSQL in produzione, aggiungere pgvector è un'estensione — non un nuovo servizio. Il costo marginale è letteralmente zero: stessi server, stesso database, stesso backup.
Il vero vantaggio non è il risparmio: è il controllo. I dati aziendali non lasciano mai l'infrastruttura. Nessun vendor lock-in, nessun rischio di pricing surprise, nessuna dipendenza da API che possono cambiare termini di servizio.
Lezioni Apprese
1. L'ibrido batte il puro vettoriale. La ricerca solo semantica produce troppi falsi positivi in contesti enterprise dove la precisione conta più del recall. Il BM25 al 40% aggiunge la "grounding" necessaria.
2. Il knowledge graph non è un lusso. Per aziende con strutture organizzative complesse, il grafo di relazioni risponde a domande che nessun sistema vettoriale può risolvere. "Chi è responsabile di cosa?" è una domanda di grafo, non di similarità.
3. La dedup salva più di quanto pensi. In un sistema che re-indicizza periodicamente, la dedup basata su hash riduce il consumo API del 90%+ nelle run successive alla prima.
4. Il chunking intelligente è il 50% del risultato. Chunk troppo piccoli perdono contesto. Troppo grandi diluiscono la rilevanza. La segmentazione per struttura del documento (header, funzioni, sezioni) con overlap preserva sia contesto che precisione.
5. Zero-cost non significa zero-effort. Servono competenze di data engineering, NLP e infrastruttura. Ma una volta costruito, il sistema operativo è essenzialmente gratuito.
Per Chi Ha Senso
Questo approccio è ideale per:
- Aziende con 10+ dipendenti che accumulano conoscenza in documenti dispersi
- Team tecnici che hanno già PostgreSQL in produzione
- Organizzazioni multi-vertical con knowledge base eterogenee
- Chiunque spenda >€200/mese in strumenti di knowledge management
Non ha senso per:
- Startup con 2-3 persone (la conoscenza sta tutta in testa)
- Aziende senza competenze tecniche interne (meglio un SaaS)
- Casi d'uso con <100 documenti (overkill)
Questo sistema è parte di SCALA AI OS, il sistema operativo AI per aziende multi-verticale. Scopri di più o richiedi una demo.
Ricevi insight su AI e automazione
Unisciti a 1.800+ professionisti. Strumenti gratuiti, strategie e case study — ogni settimana.