Apache Spark, jak to jiskří v MSD...

Na co se můžete těšit:

Apache Spark se rychle stal jedním z nejpopulárnějších frameworků pro zpracování dat. Jeho univerzální API stejně jako široká škála analytických nástrojů vybudovaných jako nadstavba nad Sparkem ho předurčují jako dobrou volbu pro efektivní zpracování různých typů dat (jak v podobě streamu, tak i pro klasické batch zpracování).  Podíváme se na to, jak rychle a jednoduše se Sparkem začít pracovat.

 

  • Základní koncepty, co je Resilient Distributed Dataset, DataFrame a Dataset; jak se Spark změnil ve své druhé verzi?
  • Jak rozjet Spark na svém počítači během pěti minut?
  • První Spark ingest, aneb škálovatelné ETL.
  • Spark a SQL, jak to jde dohromady?
  • Data Science Notebooks – co je vlastně v mých datech?
  • Jak to všechno rozběhnout v produkci na clusteru?
  • Spark streaming – když čas dovolí…

 

Prezentující:  Ivo Lašek (Software Architect Big Data at MSD Czech Republic s.r.o.)

Ivo pracuje jako softwarový architekt v Big Data týmu v MSD. Před nástupem do MSD spoluzakládal několik startupů následně úspěšně prodaných firmám Mladá fronta a Seznam.cz. S Apache projekty orientovanými na zpracování dat pracuje už více než 8 let (Apache Solr a později Elastic, Hadoop od verze 0.2, Apache Spark od roku 2015). Ivo získal PhD. v oblasti Sémantický web a zpracování dat na webu na Fakultě informačních technologií ČVUT.

 

Místo konání: DataScript s.r.o. (areál Classic 7, BUDOVA C.), Jankovcova 1037/49, Praha 7

Jak se na snídani dopravit? 

Doporučujeme využít hromadnou dopravu.

  • Tramvají: Ortenovo náměstí nebo Maniny
  • Autem - v okolí školícího střediska jsou modré parkovací zóny (ul. Jankovcova parkovací hodiny 15,-/hod.)

 

Těšíme se na Vaši účast, team DataScriptu

Podmínky registrace

Podmínkou bezplatné účasti na našich snídaních je uvedení Vaší společnosti, jmenného emailu a platného telefonního čísla. V opačném případě si vyhrazujeme právo Vaši účast odmítnout.

Bezplatně registrovat na Morning Talks

Kurzy
Submit
* Povinné pole