Kurzy a certifikace AI
Vývoj
RAG – Retrieval-Augmented Generation
12.500 CZK
Cena (bez DPH)
Days1
23. 3. 2026
virtual
CZ
Tento workshop ukazuje, jak postavit RAG jako praktický architektonický vzor pro práci s firemními znalostmi a dokumenty. Projdeme si celou pipeline ingestion - retrieval - generation, kde pochopíte , proč je kvalita retrievalu klíčová, a vyzkoušíte si návrh i ladění vyhledávání včetně hybridních přístupů (vector + fulltext), fúze výsledků (RRF) a technik jako query rewriting nebo metadata-aware retrieval.
Cílová skupina:
- Backend / Full-stack vývojáři
- Tech lead / Architekti
- AI / ML engineers
- Vývojáři pracující s firemními dokumenty a LLM
Cíle workshopu:
- RAG jako architektonický vzor
- typy vyhledávání a jejich kombinace
- retrieval jako klíčový faktor úspěchu RAG
- volba přístupu: RAG × hybrid × agentní přístup
Osnova kurzu
Úvod do RAG
- Proč RAG vznikl
- limity LLM (knowledge cutoff, halucinace)
- proč „víc promptu“ nefunguje
- grounding odpovědí
- Kdy RAG použít
- firemní dokumenty
- znalostní báze
- technická, právní, procesní data
- Kdy RAG nepoužít
- jednoduché CRUD dotazy
- strukturovaná data bez textu
Architektura RAG systému
- High-level architektura
- ingestion pipeline
- embeddings
- vector store
- retrieval
- generation
- Varianty RAG
- basic RAG
- conversational RAG
- hybrid RAG
- agentic RAG (náhled)
- Typické problémy
- špatný retrieval
- nekvalitní data
- přetížený kontext
Data ingestion, chunking & metadata
- Typy vstupních dat
- PDF, DOCX, HTML
- SharePoint / Confluence
- e-maily, tabulky
- Chunking strategie
- fixed-size
- semantic chunking
- adaptive chunking
- overlap vs kontext
- Metadata (kritické)
- jazyk
- zdroj
- typ dokumentu
- datum / verze
- oprávnění
Embeddings & Vector Databases
- Embeddings
- co embedding reprezentuje
- dimenze, normalizace
- vícejazyčnost
- limity embeddingů
- Vectorová databáze
- PostgreSQL + pgvector
- specializované vector DB
- škálování (miliony chunků)
- Indexy & výkon
- cosine / dot / L2
- HNSW vs IVF
- latency × přesnost
Typy vyhledávání v RAG
- Vector similarity search (baseline)
- sémantická podobnost
- top-k, threshold
- slabiny (čísla, názvy, přesné termíny)
- Fulltext / BM25
- lexikální relevance
- silné pro názvy, ID, verze
- slabé na parafráze
- Hybridní vyhledávání (Vector + FTS)
- paralelní vyhledávání
- dvoufázové strategie
- vážené kombinace
- RRF / RRT (Reciprocal Rank Fusion)
- fúze pořadí místo skóre
- robustní vůči špatnému scoringu
- ideální pro: vector + FTS, multi-query, agentní retrieval
- Query rewriting (LLM-assisted)
- přeformulování dotazu
- domain-specific dotazy
- guardrails, náklady
- Multi-query retrieval
- jeden dotaz → více dotazů
- fúze výsledků (RRF)
- lepší pokrytí vágních dotazů
- Metadata-aware retrieval
- filtrace před / po vyhledávání
- jazyk, zdroj, datum
- zásadní pro enterprise RAG
- Hierarchické vyhledávání
- dokument → kapitola → chunk
- vhodné pro dlouhé dokumenty
- snížení šumu
- Agent-assisted retrieval (úvod)
- agent jako orchestrátor
- iterativní vyhledávání
- adaptivní strategie
Generation & prompt design
- Kontextové prompty
- systémový prompt
- pravidla citací
- práce se zdroji
- Grounding odpovědí
- „odpovídej jen z kontextu“
- fallback strategie
- kontrola halucinací
- Typické chyby
- příliš mnoho kontextu
- špatné pořadí chunků
- ignorování relevance
Pokročilé RAG scénáře
- Conversational RAG
- práce s historií
- re-query podle kontextu
- Agentic RAG
- agent jako planner
- iterativní retrieval
- validace odpovědí
- GraphRAG (úvod)
- entity & vztahy
- kdy dává smysl
- kdy je overkill
Kdy RAG (ne)používat
- Anti-patterny
- RAG místo SQL
- RAG bez metrik
- RAG bez kvalitních dat
- Decision framework
- LLM only × RAG × Hybrid × Agent
- náklady
- latence
- údržba
Technické požadavky:
- Notebook s připojením k internetu
- Python prostředí (lokálně nebo v cloud IDE)
- Přístup k LLM API (klíč / účet)
- Doporučeno: VS Code + základní tooling pro práci s JSON/logy
Požadavky na účastníky:
- základní práce s LLM API
- znalost Pythonu
- základ databází / SQL