Sistemas RAG | iSeeCI

Resumen del Curso

RAG transforma los LLMs de chatbots de propósito general a expertos de dominio. Al recuperar contexto relevante antes de la generación, eliminas alucinaciones y fundamentas las respuestas en tus datos reales. Este curso cubre todo el stack RAG desde recuperación básica hasta enfoques avanzados basados en grafos.

Fundamentos de Embeddings

Cómo el texto se convierte en vectores. Modelos de embedding, dimensionalidad y similitud semántica.

OpenAI Ada Cohere Sentence Transformers

Bases de Datos Vectoriales

Almacenamiento y consulta de embeddings a escala. Tipos de índice, filtrado y búsqueda híbrida.

Pinecone ChromaDB Weaviate

Estrategias de Chunking

Preprocesamiento de documentos, tamaños de chunks, overlap y enfoques de chunking semántico.

Recursivo Semántico Agéntico

Estrategias de Recuperación

Más allá de la búsqueda por similitud: reranking, expansión de queries y recuperación multi-query.

Cohere Rerank HyDE Multi-Query

GraphRAG

Grafos de conocimiento para RAG. Extracción de entidades, mapeo de relaciones y recorrido de grafos.

Neo4j LlamaIndex Microsoft GraphRAG

Evaluación y Optimización

Midiendo la calidad de RAG. Métricas de recuperación, calidad de generación y mejora continua.

RAGAS Faithfulness Relevance

Arquitectura del Pipeline RAG

┌─────────────────────────────────────────────────────────────────────────┐ │ PIPELINE DE INGESTA │ ├─────────────────────────────────────────────────────────────────────────┤ │ Documentos → Chunker → Embedder → Vector DB │ │ ↓ ↓ ↓ ↓ │ │ [PDF/MD] [Split] [Ada-3] [Pinecone] │ │ [HTML] [Overlap] [Cohere] [ChromaDB] │ │ [JSON] [Semantic] [Weaviate] │ └─────────────────────────────────────────────────────────────────────────┘ ┌─────────────────────────────────────────────────────────────────────────┐ │ PIPELINE DE RECUPERACIÓN │ ├─────────────────────────────────────────────────────────────────────────┤ │ Query → Expansión → Recuperación → Reranking → Contexto │ │ ↓ ↓ ↓ ↓ ↓ │ │ [User] [HyDE/MQ] [Top-K] [Cohere] [Prompt] │ │ [Decompose] [Hybrid] [CrossEnc] │ └─────────────────────────────────────────────────────────────────────────┘ ┌─────────────────────────────────────────────────────────────────────────┐ │ PIPELINE DE GENERACIÓN │ ├─────────────────────────────────────────────────────────────────────────┤ │ Contexto + Query → Template → LLM → Respuesta + Citas │ │ ↓ ↓ ↓ ↓ │ │ [Merged] [System] [Claude] [Grounded] │ │ [Few-shot] [GPT-4] [Sourced] │ └─────────────────────────────────────────────────────────────────────────┘

Patrones Estructurales para RAG

Los sistemas RAG se benefician de patrones estructurales que gestionan la complejidad y permiten intercambiar componentes de forma flexible.

Composite

Construye árboles de documentos donde carpetas contienen documentos que contienen chunks. Procesa jerarquías completas de forma uniforme.

Flyweight

Comparte instancias de modelos de embedding y conexiones de vector DB entre retrievers. Evita cargar los mismos recursos costosos múltiples veces.

Bridge

Separa la abstracción de recuperación de la implementación. Cambia entre Pinecone, ChromaDB o Weaviate sin cambiar la lógica del retriever.

Template Method

Define el esqueleto del pipeline RAG: chunk → embed → store → retrieve → generate. Deja que subclases personalicen pasos específicos.

Comparación de Bases de Datos Vectoriales

Base de Datos	Mejor Para	Escalado	Setup
Pinecone	Producción, servicio gestionado	Automático, serverless	`pip install pinecone-client`
ChromaDB	Desarrollo local, prototipado	Máquina única	`pip install chromadb`
Weaviate	Búsqueda híbrida, API GraphQL	Kubernetes, cloud	Docker o Weaviate Cloud
Qdrant	Filtrado avanzado, rendimiento Rust	Modo cluster	`pip install qdrant-client`
pgvector	Infraestructura Postgres existente	Escalado Postgres	Extensión Postgres

Proyectos Prácticos

Construir un sistema RAG básico con ChromaDB y sentence-transformers
Implementar el patrón Template Method para un pipeline RAG configurable
Crear un patrón Bridge para intercambiar entre Pinecone y ChromaDB
Construir un iterador de documentos que procesa 10GB de PDFs eficientemente
Implementar HyDE (Hypothetical Document Embeddings) para expansión de queries
Añadir reranking de Cohere para mejorar la calidad de recuperación
Construir un sistema GraphRAG con Neo4j y extracción de entidades
Evaluar tu sistema RAG con métricas RAGAS

¿Listo para Construir Sistemas de Conocimiento?

Da a tus aplicaciones de IA acceso al conocimiento empresarial. Continúa con Fine-Tuning y Personalización para crear modelos específicos de dominio.

Inscribirse Ahora

RAG y
Sistemas de Conocimiento

Resumen del Curso

Fundamentos de Embeddings

Bases de Datos Vectoriales

Estrategias de Chunking

Estrategias de Recuperación

GraphRAG

Evaluación y Optimización

Arquitectura del Pipeline RAG

Patrones Estructurales para RAG

Composite

Flyweight

Bridge

Template Method

Comparación de Bases de Datos Vectoriales

Proyectos Prácticos

¿Listo para Construir Sistemas de Conocimiento?

Pregunta a iSeeCI

RAG ySistemas de Conocimiento

Resumen del Curso

Fundamentos de Embeddings

Bases de Datos Vectoriales

Estrategias de Chunking

Estrategias de Recuperación

GraphRAG

Evaluación y Optimización

Arquitectura del Pipeline RAG

Patrones Estructurales para RAG

Composite

Flyweight

Bridge

Template Method

Comparación de Bases de Datos Vectoriales

Proyectos Prácticos

¿Listo para Construir Sistemas de Conocimiento?

Pregunta a iSeeCI

RAG y
Sistemas de Conocimiento