Kurzy a certifikace Data Science
Datová analýza s využitím programovacího jazyka Python
Cena (bez DPH)
Python je interpretovaný vysokoúrovňový programovací jazyk, který v současnosti patří mezi nejoblíbenější programovací jazyky vůbec. Jedná se o takzvaný multiparadigmatický jazyk, který podporuje různá programátorská paradigmata včetně objektového, imperativního, procedurálního nebo funkcionálního. I když Python bývá označován za skriptovací jazyk, jeho možnosti jsou ve skutečnosti daleko širší. V současnosti se masivně používá i pro numerické výpočty, analýzu dat, statistické výpočty, práci s grafy atd. Tento kurz je zaměřen na nástroje, které lze v Pythonu použít pro datovou analýzu.
Možnosti financování
Cena za účastníka 2.505 Kč vč. DPH s podporou v programu JSEM V KURZU v rámci Národního plánu obnovy (registrace zde).
Cena za účastníka 13.915 Kč vč. DPH bez podpory (tj. 11.500 Kč bez DPH).
Cílová skupina
- Uživatelé, kteří potřebují provádět datovou analýzu, od získávání dat z různých zdrojů přes jejich zpracování a analýzu až po tvorbu reportů.
Cíl kurzu
- Seznámit účastníky kurzu s technologiemi, které se používají pro sběr dat a pro datové analýzy. Výklad bude zaměřen na programovací jazyk Python a s ním související technologie: IPython, Jupyter Notebook, NumPy a Pandas.
Osnova kurzu
Představení prostředí IPython
- Nástroje online datové analýzy
- Jupyter Notebook
- Architektura
- Instalace
- JupyterLab
- Export výstupů do PDF a jiných formátů
Přehled datových struktur v Pythonu
- Proměnná
- Pole
- Struktura
- Objekt
- List
- Tuple
Knihovna Pandas
- Zobrazení obsahu datových rámců
- Vykresl ení grafů a validace dat
- Práce s datovými řadami (series)
Knihovna NumPy
- Datové typy prvků
- Konstruktory polí
Import dat z různých zdrojů
- Tabulkové formáty a procesory (Excel, CSV)
- Databáze (SQL)
- TSV
- JSON
- HTML Scraping
Zpracování dat
- Přeměna tabulkových dat
- Přidávání chybějících hodnot
- Sledování
- Spojování dat
Pokročilé zpracování dat
- Spojování datových rámců s využitím append, concat, merge a join
- Stacking, unstacking
- Melting
Spojování a agregace dat
- Rozdělení dat do skupin na základě zvolených kritérií
- Využití funkcí
- Kombinace výsledků do datové struktury
- Transformace
- Filtrace
Vizualizace
- Generování grafů
- Bodový, sloupcový a spojnicový graf
- Graf s KDE (Kernel density estimation)
- Vykreslení hodnot prvků z datové řady formou grafu
- Seskupení dat do grafů
Doplňující témata
Funkce časové řady
- Přehled
- Timestamps
- Time spans
- Timedelta
- DateTimeIndex
Předpoklady účastníka
- Základní znalost programování, alespoň rámcová znalost Pythonu, jazyka R či statistických a analytických funkcí v Excelu.
Další požadavky
- Počítač s jakýmkoli operačním systémem, ideálně Linux (není podmínkou)
- Webový prohlížeč
- Terminál (konzole)