Kurzy a certifikace AI
IT a vývoj
RAG – Retrieval-Augmented Generation
12.500 CZK
Cena (bez DPH)
Days1
18. 8. 2026
virtual
CZ
22. 9. 2026
virtual
CZ
19. 10. 2026
virtual
CZ
Tento workshop ukazuje, jak postavit RAG jako praktický architektonický vzor pro práci s firemními znalostmi a dokumenty. Projdeme si celou pipeline ingestion - retrieval - generation, kde pochopíte , proč je kvalita retrievalu klíčová, a vyzkoušíte si návrh i ladění vyhledávání včetně hybridních přístupů (vector + fulltext), fúze výsledků (RRF) a technik jako query rewriting nebo metadata-aware retrieval.
Cílová skupina:
- Backend / Full-stack vývojáři
- Tech lead / Architekti
- AI / ML engineers
- Vývojáři pracující s firemními dokumenty a LLM
Cíle workshopu:
- RAG jako architektonický vzor
- typy vyhledávání a jejich kombinace
- retrieval jako klíčový faktor úspěchu RAG
- volba přístupu: RAG × hybrid × agentní přístup
Osnova kurzu
Úvod do RAG
- Proč RAG vznikl
- limity LLM (knowledge cutoff, halucinace)
- proč „víc promptu“ nefunguje
- grounding odpovědí
- Kdy RAG použít
- firemní dokumenty
- znalostní báze
- technická, právní, procesní data
- Kdy RAG nepoužít
- jednoduché CRUD dotazy
- strukturovaná data bez textu
Architektura RAG systému
- High-level architektura
- ingestion pipeline
- embeddings
- vector store
- retrieval
- generation
- Varianty RAG
- basic RAG
- conversational RAG
- hybrid RAG
- agentic RAG (náhled)
- Typické problémy
- špatný retrieval
- nekvalitní data
- přetížený kontext
Data ingestion, chunking & metadata
- Typy vstupních dat
- PDF, DOCX, HTML
- SharePoint / Confluence
- e-maily, tabulky
- Chunking strategie
- fixed-size
- semantic chunking
- adaptive chunking
- overlap vs kontext
- Metadata (kritické)
- jazyk
- zdroj
- typ dokumentu
- datum / verze
- oprávnění
Embeddings & Vector Databases
- Embeddings
- co embedding reprezentuje
- dimenze, normalizace
- vícejazyčnost
- limity embeddingů
- Vectorová databáze
- PostgreSQL + pgvector
- specializované vector DB
- škálování (miliony chunků)
- Indexy & výkon
- cosine / dot / L2
- HNSW vs IVF
- latency × přesnost
Typy vyhledávání v RAG
- Vector similarity search (baseline)
- sémantická podobnost
- top-k, threshold
- slabiny (čísla, názvy, přesné termíny)
- Fulltext / BM25
- lexikální relevance
- silné pro názvy, ID, verze
- slabé na parafráze
- Hybridní vyhledávání (Vector + FTS)
- paralelní vyhledávání
- dvoufázové strategie
- vážené kombinace
- RRF / RRT (Reciprocal Rank Fusion)
- fúze pořadí místo skóre
- robustní vůči špatnému scoringu
- ideální pro: vector + FTS, multi-query, agentní retrieval
- Query rewriting (LLM-assisted)
- přeformulování dotazu
- domain-specific dotazy
- guardrails, náklady
- Multi-query retrieval
- jeden dotaz → více dotazů
- fúze výsledků (RRF)
- lepší pokrytí vágních dotazů
- Metadata-aware retrieval
- filtrace před / po vyhledávání
- jazyk, zdroj, datum
- zásadní pro enterprise RAG
- Hierarchické vyhledávání
- dokument → kapitola → chunk
- vhodné pro dlouhé dokumenty
- snížení šumu
- Agent-assisted retrieval (úvod)
- agent jako orchestrátor
- iterativní vyhledávání
- adaptivní strategie
Generation & prompt design
- Kontextové prompty
- systémový prompt
- pravidla citací
- práce se zdroji
- Grounding odpovědí
- „odpovídej jen z kontextu“
- fallback strategie
- kontrola halucinací
- Typické chyby
- příliš mnoho kontextu
- špatné pořadí chunků
- ignorování relevance
Pokročilé RAG scénáře
- Conversational RAG
- práce s historií
- re-query podle kontextu
- Agentic RAG
- agent jako planner
- iterativní retrieval
- validace odpovědí
- GraphRAG (úvod)
- entity & vztahy
- kdy dává smysl
- kdy je overkill
Kdy RAG (ne)používat
- Anti-patterny
- RAG místo SQL
- RAG bez metrik
- RAG bez kvalitních dat
- Decision framework
- LLM only × RAG × Hybrid × Agent
- náklady
- latence
- údržba
Technické požadavky:
- Notebook s připojením k internetu
- Python prostředí (lokálně nebo v cloud IDE)
- Přístup k LLM API (klíč / účet)
- Doporučeno: VS Code + základní tooling pro práci s JSON/logy
Požadavky na účastníky:
- základní práce s LLM API
- znalost Pythonu
- základ databází / SQL