Resumen del Curso
RAG transforma los LLMs de chatbots de propósito general a expertos de dominio. Al recuperar contexto relevante antes de la generación, eliminas alucinaciones y fundamentas las respuestas en tus datos reales. Este curso cubre todo el stack RAG desde recuperación básica hasta enfoques avanzados basados en grafos.
Fundamentos de Embeddings
Cómo el texto se convierte en vectores. Modelos de embedding, dimensionalidad y similitud semántica.
Bases de Datos Vectoriales
Almacenamiento y consulta de embeddings a escala. Tipos de índice, filtrado y búsqueda híbrida.
Estrategias de Chunking
Preprocesamiento de documentos, tamaños de chunks, overlap y enfoques de chunking semántico.
Estrategias de Recuperación
Más allá de la búsqueda por similitud: reranking, expansión de queries y recuperación multi-query.
GraphRAG
Grafos de conocimiento para RAG. Extracción de entidades, mapeo de relaciones y recorrido de grafos.
Evaluación y Optimización
Midiendo la calidad de RAG. Métricas de recuperación, calidad de generación y mejora continua.
Arquitectura del Pipeline RAG
Patrones Estructurales para RAG
Los sistemas RAG se benefician de patrones estructurales que gestionan la complejidad y permiten intercambiar componentes de forma flexible.
Composite
Construye árboles de documentos donde carpetas contienen documentos que contienen chunks. Procesa jerarquías completas de forma uniforme.
Flyweight
Comparte instancias de modelos de embedding y conexiones de vector DB entre retrievers. Evita cargar los mismos recursos costosos múltiples veces.
Bridge
Separa la abstracción de recuperación de la implementación. Cambia entre Pinecone, ChromaDB o Weaviate sin cambiar la lógica del retriever.
Template Method
Define el esqueleto del pipeline RAG: chunk → embed → store → retrieve → generate. Deja que subclases personalicen pasos específicos.
Comparación de Bases de Datos Vectoriales
| Base de Datos | Mejor Para | Escalado | Setup |
|---|---|---|---|
| Pinecone | Producción, servicio gestionado | Automático, serverless | pip install pinecone-client |
| ChromaDB | Desarrollo local, prototipado | Máquina única | pip install chromadb |
| Weaviate | Búsqueda híbrida, API GraphQL | Kubernetes, cloud | Docker o Weaviate Cloud |
| Qdrant | Filtrado avanzado, rendimiento Rust | Modo cluster | pip install qdrant-client |
| pgvector | Infraestructura Postgres existente | Escalado Postgres | Extensión Postgres |
Proyectos Prácticos
- Construir un sistema RAG básico con ChromaDB y sentence-transformers
- Implementar el patrón Template Method para un pipeline RAG configurable
- Crear un patrón Bridge para intercambiar entre Pinecone y ChromaDB
- Construir un iterador de documentos que procesa 10GB de PDFs eficientemente
- Implementar HyDE (Hypothetical Document Embeddings) para expansión de queries
- Añadir reranking de Cohere para mejorar la calidad de recuperación
- Construir un sistema GraphRAG con Neo4j y extracción de entidades
- Evaluar tu sistema RAG con métricas RAGAS
¿Listo para Construir Sistemas de Conocimiento?
Da a tus aplicaciones de IA acceso al conocimiento empresarial. Continúa con Fine-Tuning y Personalización para crear modelos específicos de dominio.
Inscribirse Ahora