Kurzy a certifikace AI

IT a vývoj

RAG – Retrieval-Augmented Generation

12.500 CZK

Cena (bez DPH)

Days1
18. 8. 2026
virtual
CZ
22. 9. 2026
virtual
CZ
19. 10. 2026
virtual
CZ

Tento workshop ukazuje, jak postavit RAG jako praktický architektonický vzor pro práci s firemními znalostmi a dokumenty. Projdeme si celou pipeline ingestion - retrieval - generation, kde pochopíte , proč je kvalita retrievalu klíčová, a vyzkoušíte si návrh i ladění vyhledávání včetně hybridních přístupů (vector + fulltext), fúze výsledků (RRF) a technik jako query rewriting nebo metadata-aware retrieval.

Cílová skupina:

  • Backend / Full-stack vývojáři
  • Tech lead / Architekti
  • AI / ML engineers
  • Vývojáři pracující s firemními dokumenty a LLM

Cíle workshopu:

  • RAG jako architektonický vzor
  • typy vyhledávání a jejich kombinace
  • retrieval jako klíčový faktor úspěchu RAG
  • volba přístupu: RAG × hybrid × agentní přístup

Osnova kurzu

Úvod do RAG

  • Proč RAG vznikl
    • limity LLM (knowledge cutoff, halucinace)
    • proč „víc promptu“ nefunguje
    • grounding odpovědí
  • Kdy RAG použít
    • firemní dokumenty
    • znalostní báze
    • technická, právní, procesní data
  • Kdy RAG nepoužít
    • jednoduché CRUD dotazy
    • strukturovaná data bez textu

Architektura RAG systému

  • High-level architektura
    • ingestion pipeline
    • embeddings
    • vector store
    • retrieval
    • generation
  • Varianty RAG
    • basic RAG
    • conversational RAG
    • hybrid RAG
    • agentic RAG (náhled)
  • Typické problémy
    • špatný retrieval
    • nekvalitní data
    • přetížený kontext

Data ingestion, chunking & metadata

  • Typy vstupních dat
    • PDF, DOCX, HTML
    • SharePoint / Confluence
    • e-maily, tabulky
  • Chunking strategie
    • fixed-size
    • semantic chunking
    • adaptive chunking
    • overlap vs kontext
  • Metadata (kritické)
    • jazyk
    • zdroj
    • typ dokumentu
    • datum / verze
    • oprávnění

Embeddings & Vector Databases

  • Embeddings
    • co embedding reprezentuje
    • dimenze, normalizace
    • vícejazyčnost
    • limity embeddingů
  • Vectorová databáze
    • PostgreSQL + pgvector
    • specializované vector DB
    • škálování (miliony chunků)
  • Indexy & výkon
    • cosine / dot / L2
    • HNSW vs IVF
    • latency × přesnost

Typy vyhledávání v RAG

  • Vector similarity search (baseline)
    • sémantická podobnost
    • top-k, threshold
    • slabiny (čísla, názvy, přesné termíny)
  • Fulltext / BM25
    • lexikální relevance
    • silné pro názvy, ID, verze
    • slabé na parafráze
  • Hybridní vyhledávání (Vector + FTS)
    • paralelní vyhledávání
    • dvoufázové strategie
    • vážené kombinace
  • RRF / RRT (Reciprocal Rank Fusion)
    • fúze pořadí místo skóre
    • robustní vůči špatnému scoringu
    • ideální pro: vector + FTS, multi-query, agentní retrieval
  • Query rewriting (LLM-assisted)
    • přeformulování dotazu
    • domain-specific dotazy
    • guardrails, náklady
  • Multi-query retrieval
    • jeden dotaz → více dotazů
    • fúze výsledků (RRF)
    • lepší pokrytí vágních dotazů
  • Metadata-aware retrieval
    • filtrace před / po vyhledávání
    • jazyk, zdroj, datum
    • zásadní pro enterprise RAG
  • Hierarchické vyhledávání
    • dokument → kapitola → chunk
    • vhodné pro dlouhé dokumenty
    • snížení šumu
  • Agent-assisted retrieval (úvod)
    • agent jako orchestrátor
    • iterativní vyhledávání
    • adaptivní strategie

Generation & prompt design

  • Kontextové prompty
    • systémový prompt
    • pravidla citací
    • práce se zdroji
  • Grounding odpovědí
    • „odpovídej jen z kontextu“
    • fallback strategie
    • kontrola halucinací
  • Typické chyby
    • příliš mnoho kontextu
    • špatné pořadí chunků
    • ignorování relevance

Pokročilé RAG scénáře

  • Conversational RAG
    • práce s historií
    • re-query podle kontextu
  • Agentic RAG
    • agent jako planner
    • iterativní retrieval
    • validace odpovědí
  • GraphRAG (úvod)
    • entity & vztahy
    • kdy dává smysl
    • kdy je overkill

Kdy RAG (ne)používat 

  • Anti-patterny
    • RAG místo SQL
    • RAG bez metrik
    • RAG bez kvalitních dat
  • Decision framework
    • LLM only × RAG × Hybrid × Agent
    • náklady
    • latence
    • údržba

Technické požadavky:

  • Notebook s připojením k internetu
  • Python prostředí (lokálně nebo v cloud IDE)
  • Přístup k LLM API (klíč / účet)
  • Doporučeno: VS Code + základní tooling pro práci s JSON/logy

Požadavky na účastníky:

  • základní práce s LLM API
  • znalost Pythonu
  • základ databází / SQL

Poptejte kurz u nás

Kurzy
Submit
* Povinné pole