Formación Avanzada

RAG y
Sistemas de Conocimiento

Construye pipelines de generación aumentada por recuperación que dan a los LLMs acceso a tus datos. Bases de datos vectoriales, estrategias de embeddings, GraphRAG y grafos de conocimiento—crea sistemas de IA que saben lo que tú sabes.

36 Horas
Intermedio-Avanzado
Vector DBs + Neo4j

Resumen del Curso

RAG transforma los LLMs de chatbots de propósito general a expertos de dominio. Al recuperar contexto relevante antes de la generación, eliminas alucinaciones y fundamentas las respuestas en tus datos reales. Este curso cubre todo el stack RAG desde recuperación básica hasta enfoques avanzados basados en grafos.

1

Fundamentos de Embeddings

Cómo el texto se convierte en vectores. Modelos de embedding, dimensionalidad y similitud semántica.

OpenAI Ada Cohere Sentence Transformers
2

Bases de Datos Vectoriales

Almacenamiento y consulta de embeddings a escala. Tipos de índice, filtrado y búsqueda híbrida.

Pinecone ChromaDB Weaviate
3

Estrategias de Chunking

Preprocesamiento de documentos, tamaños de chunks, overlap y enfoques de chunking semántico.

Recursivo Semántico Agéntico
4

Estrategias de Recuperación

Más allá de la búsqueda por similitud: reranking, expansión de queries y recuperación multi-query.

Cohere Rerank HyDE Multi-Query
5

GraphRAG

Grafos de conocimiento para RAG. Extracción de entidades, mapeo de relaciones y recorrido de grafos.

Neo4j LlamaIndex Microsoft GraphRAG
6

Evaluación y Optimización

Midiendo la calidad de RAG. Métricas de recuperación, calidad de generación y mejora continua.

RAGAS Faithfulness Relevance

Arquitectura del Pipeline RAG

┌─────────────────────────────────────────────────────────────────────────┐ │ PIPELINE DE INGESTA │ ├─────────────────────────────────────────────────────────────────────────┤ │ Documentos → Chunker → Embedder → Vector DB │ │ ↓ ↓ ↓ ↓ │ │ [PDF/MD] [Split] [Ada-3] [Pinecone] │ │ [HTML] [Overlap] [Cohere] [ChromaDB] │ │ [JSON] [Semantic] [Weaviate] │ └─────────────────────────────────────────────────────────────────────────┘ ┌─────────────────────────────────────────────────────────────────────────┐ │ PIPELINE DE RECUPERACIÓN │ ├─────────────────────────────────────────────────────────────────────────┤ │ Query → Expansión → Recuperación → Reranking → Contexto │ │ ↓ ↓ ↓ ↓ ↓ │ │ [User] [HyDE/MQ] [Top-K] [Cohere] [Prompt] │ │ [Decompose] [Hybrid] [CrossEnc] │ └─────────────────────────────────────────────────────────────────────────┘ ┌─────────────────────────────────────────────────────────────────────────┐ │ PIPELINE DE GENERACIÓN │ ├─────────────────────────────────────────────────────────────────────────┤ │ Contexto + Query → Template → LLM → Respuesta + Citas │ │ ↓ ↓ ↓ ↓ │ │ [Merged] [System] [Claude] [Grounded] │ │ [Few-shot] [GPT-4] [Sourced] │ └─────────────────────────────────────────────────────────────────────────┘

Patrones Estructurales para RAG

Los sistemas RAG se benefician de patrones estructurales que gestionan la complejidad y permiten intercambiar componentes de forma flexible.

Composite

Construye árboles de documentos donde carpetas contienen documentos que contienen chunks. Procesa jerarquías completas de forma uniforme.

Flyweight

Comparte instancias de modelos de embedding y conexiones de vector DB entre retrievers. Evita cargar los mismos recursos costosos múltiples veces.

Bridge

Separa la abstracción de recuperación de la implementación. Cambia entre Pinecone, ChromaDB o Weaviate sin cambiar la lógica del retriever.

Template Method

Define el esqueleto del pipeline RAG: chunk → embed → store → retrieve → generate. Deja que subclases personalicen pasos específicos.

Comparación de Bases de Datos Vectoriales

Base de Datos Mejor Para Escalado Setup
Pinecone Producción, servicio gestionado Automático, serverless pip install pinecone-client
ChromaDB Desarrollo local, prototipado Máquina única pip install chromadb
Weaviate Búsqueda híbrida, API GraphQL Kubernetes, cloud Docker o Weaviate Cloud
Qdrant Filtrado avanzado, rendimiento Rust Modo cluster pip install qdrant-client
pgvector Infraestructura Postgres existente Escalado Postgres Extensión Postgres

Proyectos Prácticos

¿Listo para Construir Sistemas de Conocimiento?

Da a tus aplicaciones de IA acceso al conocimiento empresarial. Continúa con Fine-Tuning y Personalización para crear modelos específicos de dominio.

Inscribirse Ahora
Pregunta a iSeeCI