Kurzy a certifikace Open Source

Cloud

Elasticsearch - fulltext v praxi

34.000 CZK

Cena (bez DPH)

29. 7. – 30. 7. 2024

virtual

19. 9. – 20. 9. 2024

virtual

31. 10. – 1. 11. 2024

virtual

Zpět

Kurz je určen pro všechny, kdo se chtějí naučit, jak na svém projektu vytvořit fulltextové vyhledávání, na které se v rámci kurz podíváme komplexně. Kromě využití Elasticsearch se naučíme i další koncepty uživatelského vyhledávání.

Během kurzu společně vytvoříme vyhledávání na reálných datech; od návrhu a architektury po plně funkční řešení, které budeme postupně rozšiřovat o pokročilou práci s českým jazykem, synonymy, překlepy, našeptávačem a dalšími funkcemi. Podíváme se, jak ovlivňovat relevanci v závislosti na uživatelském chování (hodnocení, nákupy, atd.) a dalších faktorech. Nakonec si ukážeme, jak celé řešení provozovat v produkčním prostředí.

Možnosti financování

Cena za účastníka 7.406 Kč vč. DPH s podporou v programu JSEM V KURZU v rámci Národního plánu obnovy (registrace zde).
Cena za účastníka 41.140 Kč vč. DPH bez podpory (tj. 34.000 Kč bez DPH).

Cílová skupina

Kurz je určen pro všechny vývojáře, kteří pracují na projektech, kde chtějí řešit vyhledávání pro uživatele (např. katalogy produktů, článků, atd.).

Garant kurzu

PETR NOVOTNÝ

Petrův odborný záběr je od solution architektury přes vlastní development (JavaScript, PHP) přes Elasticsearch, Oracle, PL/SQL až po agilní metodiky a SCRUM. Petr se zároveň věnuje již několik let technologii Elasticsearch a stal se kmenovým lektorem společnosti Datascript.

Osnova

Vyhledávání stavěné pro uživatele

Jak uživatelé na vašem webu vyhledávají?
Jak navrhnout vyhledávání, architektura
Proces zpracování uživatelského dotazu
Vyhledávací kontext
Identifikace entit (co uživatel skutečně hledá)?

Cluster pro fulltext

Návrh architektury clusteru pro fulltextové vyhledávání
Lab

Indexace dat do Elasticsearch

Synchronizace dat z relační databáze a dalších úložišť
Průběžné a jednorázové indexování dat
Sledování a zlepšování výkonu indexace dokumentů
Lab

Vytvoření fulltextového vyhledávání

Základy fulltextu, inverted index
Nastavení vhodného mappingu
Vazby mezi objekty, tipy z praxe
Základní analýza textu
Lab

Pracujeme s češtinou

Jak vyhledávat v čestině?
Základní přehled nástrojů pro práci s českým jazykem
Vyhledávání nezávisle na diakritice
Hledání kořenu slova
Dostupné Stemmery, Lematizace
Stemmery do hloubky, tvorba vlastních slovníků
Doporučený analyzer pro český jazyk
Tipy z praxe
Lab

Vyhledávací DSL dotaz

Tvorba vyhledávacího dotazu
Vyhledávání v jednom a více polích
Strategie vyhledávání ve více polích a jakou zvolit v jakém případě?
Zvýhoďnování celých frází
Tipy z praxe
Lab

Zapojujeme další pole

Zvýhodňování, boosting
Vyhledávání v kódech
Vyhledávání v parametrech, kategoriích, značkách, tagách
Jak nastavit váhy v jednotlivých polích
Signály
Lab

Synonyma

Jak a proč zapojit synonyma do procesu vyhledávání?
Slovník dostupných synonym pro češtinu a další jazyky
Tvorba a zapojení vlastních slovníků
Tipy z praxe
Lab

Relevance

Co je relevance?
Jak měřit relevanci?
Jak měřit změnu relevance při úpravě vyhledávání?
Score, jak Elasticsearch počítá relevanci
TF/IDF, BM25 a teorietické minimum
Lab

Ovlivňování relevance

Ovlivňování výsledků na základě uživatelských akcí (nákupy, hodnocení, atd.)
Ovlivňování na základě vlastností dokumentů
Rescoring dokumentů
Decay funkce
Lab

Našeptávač

Obecně k problematice "našeptávání"
Různé možnosti implementace na praktických ukázkách
Jak na stejné výsledky v našeptávači a výsledcích vyhledávání?
Dis_max a další query do hloubky
Lab

Překlepy

Základní ošetření překlepů
Vytváříme "Měli jste na mysli?"
Suggesters
Lab

Uživatelské filtry, facetová navigace

Jak na uživatelské filtry?
Agregace
Vytváříme "Měli jste na mysli?"
Suggesters
Lab

Jdeme do produkce

Nastavení clusteru pro produkční prostředí, konfigurace
Volíme počet nodů, shardů, replik
Nastavení monitoringu
Škálujeme na množství dat a návštěvnost
Lab

Technické specifikace

Počítač s jakýmkoliv OS (Linux, Windows, OS X)
SSH klient (na Windows např. Winsshterm, Putty), oprávnění připojit se vzdáleně na SSH (port 22)
Webový prohlížeč

Předpoklady účastníka

Základní znalost Elasticsearch, protokol HTTP, formát JSON, obecná znalost databázových systémů.

Předcházející kurz

Elasticsearch

Poptejte kurz u nás

Recenze

Michal Kubiš

19. 1. 2021

Nesmírně přínosné školení vedené odborníkem na slovo vzatým. Osobně jsem velmi ocenil i ochotu lektora poskytnout nesmírně kvalitní (a troufnu si říci i cenná) data, na základě kterých bylo celé školení postaveno. Zároveň oceňuji obrovské zkušenosti dané problematiky z mnoha různých firem, které zároveň jsou těmi největšími hráči na českém trhu. Michal Kubiš (HP Tronic)

všechny recenze

Kurzy a certifikace Open Source

Elasticsearch - fulltext v praxi

Možnosti financování

Cílová skupina

Garant kurzu

Osnova

Technické specifikace

Předpoklady účastníka

Předcházející kurz

Poptejte kurz u nás

Recenze

člen skupiny: