Kurzy a certifikace TIBCO Statistica

Data Mining

Neuronové sítě

12.900 CZK
Days2

Neuronové sítě patří mezi oblíbené moderní techniky, které umožňují nový a často i efektivnější přístup pro zpracování dat. Dvoudenní kurz umožňuje seznámení jak s teoretickými principy fungování neuronových sítí, tak s jejich praktickou aplikací prostřednictvím modulu STATISTICA Automatizované neuronové sítě. Kurz poskytne přehled o architektuře neuronových sítí a metodách učení. Postup, jak dosáhnout pomocí neuronových sítí co nejlepších výsledků, bude demonstrován při řešení praktických úloh. 


Cílová skupina

  • Analytik, statistik či datový specialista, který potřebuje zpracovávat velké objemy dat.
  • Zájemce o problematiku neuronových sítí.
  • Ti, kteří mají v datech složité nelineární závislosti a chtějí i přes to tvořit modely pro predikci či klasifikaci.
  • Typickými posluchači mohou být analytici například z oblasti průmyslu, či specializovaných oblastí medicíny.
  • Ti, kteří se chtějí seznámit s modulem neuronových sítí v softwaru TIBCO Statistica.


Cíle kurzu

  • Seznámit se teoreticky, ale i prakticky s podstatou modelování pomocí neuronových sítí.
  • Mimo jiné se účastníci naučí sestavovat a interpretovat predikční modely. Vyhodnotit jejich kvalitu či vybrat, který z výsledných modelů je pro danou situaci nejvhodnější.
  • Ukázat, jaké možnosti má v této oblasti software TIBCO Statistica.
  • Účastníci se také naučí pracovat v prostředích Receptů a částečně také v prostředí Workspace.


Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Práce s recepty (wizardem)

  • Princip, možnosti, využití 

Práce s recepty (wizardem)

  • Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů)
  • Detekce a případné odstranění podobných vstupních příznaků (prediktorů)
  • Výběr důležitých prediktorů pro požadovanou úlohu
  • Vytváření klasifikačních a regresních modelů
  • Vyhodnocení kvality vytvořeného modelů
  • Nasazení modelu v praxi

Principy neuronových sítí

  • Neuron, model neuronu
  • Základní typy sítí (MLP, RBF Kohonenova)
  • Struktura neuronové sítě, princip učení, reprezentace znalostí

Práce s neuronovými sítěmi

  • Rozdělování dat na trénovací, validační a testovací množiny, bootstrapping, křížová validace
  • Nastavení parametrů sítí (počet vrstev, neuronů, typy neuronů, post-synaptické funkce, aktivační funkce, algoritmy učení – backpropagation, problém lokálního minima, heuristiky a další)
  • Automatizovaný a vlastní návrh sítě 

Využití neuronových sítí

  • Klasifikace
  • Regrese
  • Analýza časových řad
  • Shluková analýza pomocí Kohonenovy neuronové sítě (SOM)

Metody výběru vhodných příznaků 

Sdružování rozsáhlých skupin hodnot příznaků (binning) 

Vyhodnocení kvality vytvořeného modelu

  • Korelační analýza
  • ROC křivka
  • grafy zisku a navýšení (Gains a Lift chart)

Nasazení modelu v praxi 

Práce v prostředí modulu STATISTICA Data Miner

  • Práce v rámci pracovní plochy (workspaces)
  • Využití přednastavených úloh
  • Implementace vlastních uzlů


Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows


Předchozí kurzy

Není nutné absolvovat před tímto kurzem jiné kurzy, nicméně znalost základů statistického uvažování je vhodná.


Navazující kurzy

Je možné a vhodné rozšířit znalost prostředí Workspace (které je v tomto kurzu probráno jen částečně) prostřednictvím kurzu:

Data mining v praxi v prostředí Workspace.

Pokud se chcete vzdělat také v dalších metodách, které mohou být alternativním řešením pro neuronové sítě, pak doporučujeme kurzy:

Klasifikační a regresní stromy,

Data mining (dvoudenní varianta) nebo Data mining(třídenní varianta).


Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Poptejte kurz u nás

Kurzy
Submit
* Povinné pole