Cómo Construimos un Sistema RAG Enterprise que Gestiona 1.400+ Documentos con Cero Costes Cloud

El Problema: el Conocimiento Empresarial Disperso Cuesta Más de lo que Crees

Toda empresa con más de 5 personas tiene el mismo problema invisible: el conocimiento crítico está fragmentado entre emails, documentos, chats, CRM, bases de datos y la memoria de las personas.

McKinsey estima que los knowledge workers dedican el 19,8% de su tiempo a buscar información interna. Para una empresa con 20 empleados a €40K de media, son €160.000/año quemados en búsquedas infructuosas, preguntas repetidas y decisiones tomadas con contexto incompleto.

Los sistemas tradicionales (wikis corporativas, SharePoint, Confluence) no resuelven el problema: requieren que alguien mantenga activamente la documentación actualizada. Nadie lo hace.

La Solución: RAG Híbrido con Knowledge Graph

Hemos construido un sistema de Retrieval-Augmented Generation que indexa automáticamente todo el conocimiento empresarial y lo hace consultable en lenguaje natural. No es un chatbot genérico — es un sistema que conoce tu empresa.

Arquitectura de Alto Nivel

El sistema se compone de tres capas:

1. Capa de Ingestión — Procesa automáticamente documentos empresariales (estrategia, marketing, prospects, infraestructura, integraciones, pricing, análisis de competidores) y los segmenta en chunks semánticamente coherentes. No se limita a cortar el texto: reconoce la estructura de los documentos (títulos, secciones, bloques de código) y preserva el contexto.

2. Capa de Búsqueda Híbrida — Combina búsqueda semántica (entiende el significado de la pregunta) con búsqueda por keyword (encuentra coincidencias exactas). El balance 60/40 entre ambos enfoques elimina tanto los falsos positivos de la búsqueda puramente semántica como la rigidez de la búsqueda por palabras clave.

3. Capa Knowledge Graph — Un grafo de entidades y relaciones que mapea personas, tecnologías, proyectos, competencias y verticales. Cuando buscas "¿quién gestiona el proyecto X?", el sistema no solo busca documentos similares — navega el grafo de relaciones.

Datos Reales

Métrica	Valor
Documentos indexados	1.400+ chunks de 59 ficheros fuente
Tipos de documento	Estrategia, marketing, prospects, infraestructura, seguridad, competidores
Entidades en el knowledge graph	71 (personas, tecnologías, proyectos, skills, empresas)
Relaciones mapeadas	45+ conexiones tipificadas
Latencia media de búsqueda	50-150ms
Coste cloud adicional	€0/mes
Actualización	Continua, automática
Idiomas soportados	5 (IT, EN, ES, PT, DE, FR)

Cómo Funciona la Búsqueda: el Vector No es Suficiente

La mayoría de los sistemas RAG del mercado usa únicamente búsqueda vectorial (embeddings). Funciona bien para preguntas vagas ("cuéntame algo sobre la estrategia de marketing") pero falla de forma estrepitosa con queries precisas ("¿cuál es el precio del tier enterprise para facility management?").

Nuestro enfoque híbrido resuelve ambos casos:

Búsqueda semántica (60%) — Convierte la pregunta en un vector de alta dimensionalidad y encuentra los documentos con el significado más cercano. Usa embeddings asimétricos: la forma en que codifica una pregunta es diferente a cómo codifica un documento, porque una pregunta corta y un párrafo largo tienen estructuras lingüísticas distintas.

Búsqueda BM25 (40%) — Algoritmo probabilístico que pondera la frecuencia de los términos. Si buscas "Vacchelli €797", el sistema encuentra exactamente ese precio en esos documentos, aunque semánticamente la query no esté "cerca" de nada.

Filtro de calidad — Solo se devuelven resultados por encima de un umbral mínimo. Mejor cero resultados que resultados incorrectos: en un contexto enterprise, una información errónea es peor que ninguna información.

El Knowledge Graph: Relaciones, no Solo Documentos

Los documentos contienen hechos. Pero las empresas funcionan a base de relaciones.

"Alessandro gestiona SCALA" no es un hecho que encuentres en un documento — es una relación entre una entidad persona y una entidad proyecto. El knowledge graph captura estas relaciones y permite queries estructurales:

"¿Qué tecnologías usa el proyecto X?" → navegación del grafo
"¿Quién tiene competencias en AI Strategy?" → búsqueda de entidades por tipo
"¿Qué proyectos sirven al vertical de hospitality?" → traversal multi-hop

El grafo soporta 8 tipos de relación (uses, builds, serves, requires, competes_with, part_of, manages, has_skill) y 8 tipos de entidad. Cada entidad tiene su propio embedding vectorial, de modo que puede encontrarse tanto por significado como por estructura.

Deduplicación Inteligente: No Volver a Procesar el Mismo Documento

Un problema subestimado en los sistemas RAG es la re-indexación. Si un documento cambia una línea de 200, un sistema naive lo re-procesa completamente: nuevo chunking, nuevos embeddings, nuevos costes de API.

Nuestro sistema calcula un hash criptográfico de cada chunk. Si el contenido no ha cambiado, skip completo — cero llamadas a la API, cero escrituras en base de datos. Si el fichero tiene menos chunks que la versión anterior (porque ha sido acortado), los chunks huérfanos se eliminan automáticamente.

Resultado: una re-indexación completa de 1.400+ chunks requiere <30 segundos si nada ha cambiado.

Integración Nativa con AI Assistant

El sistema no es una aplicación standalone con una UI que mantener. Está integrado directamente en el asistente AI a través del protocolo MCP (Model Context Protocol), exponiendo 8 operaciones:

Búsqueda — Consulta en lenguaje natural con filtros opcionales
Recuperación — Todos los chunks de un documento específico
Catálogo — Lista completa de las fuentes indexadas
Ingestión — Adición de nuevos documentos bajo demanda
Navegación del grafo — Búsqueda de entidades, relaciones, vecindad N-hop
Estadísticas — Estado del sistema en tiempo real

Cuando el asistente AI recibe una pregunta, consulta automáticamente el RAG antes de responder. No "inventa" — recupera hechos verificados de la knowledge base empresarial.

¿Por Qué No un SaaS?

Los sistemas RAG-as-a-Service (Pinecone, Weaviate Cloud, Zilliz) cuestan €200-2.000/mes para volúmenes enterprise. Tienen sentido para quienes no tienen competencias de infraestructura.

Para quienes ya tienen una base de datos PostgreSQL en producción, añadir pgvector es una extensión — no un nuevo servicio. El coste marginal es literalmente cero: mismos servidores, misma base de datos, mismo backup.

La verdadera ventaja no es el ahorro: es el control. Los datos empresariales nunca abandonan la infraestructura propia. Sin vendor lock-in, sin riesgo de sorpresas en el pricing, sin dependencia de APIs que pueden cambiar sus términos de servicio.

Lecciones Aprendidas

1. El híbrido supera al puramente vectorial. La búsqueda solo semántica genera demasiados falsos positivos en contextos enterprise donde la precisión importa más que el recall. El BM25 al 40% aporta el "grounding" necesario.

2. El knowledge graph no es un lujo. Para empresas con estructuras organizativas complejas, el grafo de relaciones responde preguntas que ningún sistema vectorial puede resolver. "¿Quién es responsable de qué?" es una pregunta de grafo, no de similitud.

3. La dedup ahorra más de lo que parece. En un sistema que re-indexa periódicamente, la dedup basada en hash reduce el consumo de API en más del 90% en las ejecuciones posteriores a la primera.

4. El chunking inteligente es el 50% del resultado. Chunks demasiado pequeños pierden contexto. Demasiado grandes diluyen la relevancia. La segmentación por estructura del documento (headers, funciones, secciones) con overlap preserva tanto el contexto como la precisión.

5. Zero-cost no significa zero-effort. Se necesitan competencias de data engineering, NLP e infraestructura. Pero una vez construido, el coste operativo del sistema es esencialmente cero.

Para Quién Tiene Sentido

Este enfoque es ideal para:

Empresas con 10+ empleados que acumulan conocimiento en documentos dispersos
Equipos técnicos que ya tienen PostgreSQL en producción
Organizaciones multi-vertical con knowledge bases heterogéneas
Cualquiera que gaste >€200/mes en herramientas de knowledge management

No tiene sentido para:

Startups con 2-3 personas (el conocimiento cabe en la cabeza)
Empresas sin competencias técnicas internas (mejor un SaaS)
Casos de uso con <100 documentos (overkill)

Este sistema es parte de SCALA AI OS, el sistema operativo AI para empresas multi-vertical. Descubre más o solicita una demo.