Kurzy a certifikace TIBCO Statistica

Obecná analýza dat

Logistická, ordinální a multinomická regrese

7.900 CZK
Days1

Cílem jednodenního kurzu je seznámit posluchače s nejpoužívanějšími regresními modely pro dichotomickou (0/1), ordinální a multinomickou (kategoriální) odezvu. Posluchačům bude vysvětlen pojem poměru šancí (odds ratio) a jeho vztah k logistické regresi, jež umožňuje modelovat závislost 0/1 odezvy (typicky indikátoru zda nastala nebo nenastala nějaká událost) na kvalitativních i kvantitativních prediktorech obdobně jako v klasické lineární regresi. Model logistické regrese bude postupně dáván do souvislosti s klasickými postupy (dvouvýběrový t-test, analýza rozptylu, lineární regrese). V další části kurzu navážeme multinomickým logistickým modelem (multinomial logit model, umožňuje modelovat kategoriální odezvu) a dále modelem proporcionálních šancí (proportional odds model).

V poslední části ukážeme využití logistické regrese k vytvoření binárního klasifikátoru (diagnostický test) a vysvětlíme související pojmy sensitivity, specificity, pozitivní a negativní prediktivní hodnoty, ROC křivky. Jednotlivé metody budou ilustrovány na příkladech z lékařského i bankovního prostředí (credit skóring).


Cílová skupina 

  • Statistici, datoví specialisté či analytici, kteří potřebují řešit úlohu predikce kategorické veličiny.
  • S potřebou takovýchto regresních modelů se setkáváme v oblasti bankovnictví, pojišťovnictví, medicíny, ale také například v oblasti společenských věd.
  • Ti, kteří se potřebují naučit, jak provést výše zmíněné typy regrese v softwaru TIBCO Statistica.


Cíle kurzu

  • Seznámit posluchače s nejpoužívanějšími regresními modely pro dichotomickou (0/1), ordinální a multinomickou (kategoriální) odezvu.
  • Naučit posluchače pracovat a porozumět charakteristikám jako jsou poměr šancí nebo ROC křivka.
  • Naučit se vybrat, kterými metodami modelovat daná kategorická data, které proměnné přidat do finálního modelu a které ne.
  • Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica. 


Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy


Inference o proporci  (stručně, je též obsahem kurzu „Analýza kategoriálních dat“) 

Kvantifikace odlišnosti dvou skupin vzhledem k proporci

  • Rozdíl proporcí
  • Relativní riziko
  • Poměr šancí – odds ratio


Jednoduchá logistická regrese

Vícenásobná logistická regrese

Multinomická logistická regrese

Model proporcionálních šancí

Logistická regrese k vytvoření binárního klasifikátoru

  • Pojem ROC křivky


Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows, výhodou je předchozí absolvování kurzu Analýza kategoriálních dat, ale není podmínkou.


Předchozí kurzy

Doporučujeme absolvovat kurz Analýza kategoriálních dat, na který kurz Logistické, ordinální a multinomické regrese logicky navazuje.


Navazující kurzy

Tématiku regresních modelů pro spojité veličiny je možné doplnit kurzy:

Analýza rozptylu,

Regresní analýza.

 

Možností, jak předpovídat kategorickou odezvu, je více. Mohou se hodit například dataminingové metody:

Klasifikační a regresní stromy nebo

Data mining (dvoudenní varianta) .


Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Poptejte kurz u nás

Kurzy
Submit
* Povinné pole