REKVALIFIKACNI-KURZY.info

Kurzy, školení, semináře a/nebo rekvalifikace # APACHE SPARK FOR DATA ENGINEERS ADVANCED OPTIMIZATIONS

 
Rekvalifikační-kurzy.info | Tvorba webu, PHP, ASP, mySQL, Apache > Apache Spark for Data Engineers - Advanced Optimizations

Apache Spark for Data Engineers - Advanced Optimizations



Cena kurzu:
    ... bez DPH: 15.000 Kč/Kurz
    ... včetně DPH: 18.150 Kč/Kurz


Apache Spark je distribuovaný výpočetní engine, který poskytuje unifikovaný framework pro zpracování velkých objemů dat, interaktivní analýzu, machine learning, analýzu grafu a streaming. V průběhu posledních několika let se stává standardem pro zpracování těchto workloadů a to nejen v prostředí velkých dat. Jedním z důvodů proč roste popularita Sparku je také jeho programové API, neboli tzv. DataFramy, které nabízejí univerzální datovou abstrakci, již je možné použít ve všech výše zmíněných obl ... © DataScript s.r.o.
 
Přihláška na kurz & termín:




Apache Spark for Data Engineers - Advanced Optimizations

Téma kurzu: Tvorba webu, PHP, ASP, mySQL, Apache, ,

Určeno pro ...

Cílová skupina: Datový inženýři, scientisti a další uživatelé Sparku, kteří již mají se Sparkem nějakou zkušenost a chtějí se naučit optimalizovat Sparkové joby pro dosažení maximálního výkonu.

Přednáší ...

: David Vrba Ph.D. David pracuje v Emplifi (dříve Socialbakers) jako datový inženýr. Na denní bázi se zabývá optimalizací Spakových aplikací a vyvíjí Sparkové joby, které zpracovávají data na různých škálách od jednotek GBs až po desítky TBs. Vedle toho se zabývá výukou Sparkových trainingů a jeho školení mi již prošla celá řada týmů zejména datový analytici, scientisti a inženýři. David je také Sparkovým kontributorem, přispěl do zdrojového kódu a pravidelně mluví na konferencích a meetupech jako je Spark + AI Summit, MLPrague nebo Spark + AI Prague meetup.


Program kurzu, obsah studia ...

Cíle kurzu:

  • Rozumět a orientovat se ve fyzických plánech Spark SQL
  • Přepsat query za účelem dosažení efektivnějšího plánu
  • Používat některá konfigurační nastavení
  • Připravit Sparkem data pro efektivní analytiku ve Sparku
  • Diagnostikovat botlneck Sparkoveho jobu

* :
  • Rozumět a orientovat se ve fyzických plánech Spark SQL
  • Přepsat query za účelem dosažení efektivnějšího plánu
  • Používat některá konfigurační nastavení
  • Připravit Sparkem data pro efektivní analytiku ve Sparku
  • Diagnostikovat botlneck Sparkoveho jobu

Garant kurzu: David Vrba Ph.D. David pracuje v Emplifi (dříve Socialbakers) jako datový inženýr. Na denní bázi se zabývá optimalizací Spakových aplikací a vyvíjí Sparkové joby, které zpracovávají data na různých škálách od jednotek GBs až po desítky TBs. Vedle toho se zabývá výukou Sparkových trainingů a jeho školení mi již prošla celá řada týmů zejména datový analytici, scientisti a inženýři. David je také Sparkovým kontributorem, přispěl do zdrojového kódu a pravidelně mluví na konferencích a meetupech jako je Spark + AI Summit, MLPrague nebo Spark + AI Prague meetup.
Osnova : Spark SQL internals (Query Execution)
  • Logical planning  (Catalog, Analyzer, Cache Management, Optimizer)
    • Catalyst API
    • Extending the optimizer
    • Limiting the optimizer

  •  Physical planning
    • Query planner, strategies
    • Spark plan
    • Executed plan
    • Understanding operators in the physical plan

  • Cost based optimizer
  • How cost-based optimizations work
  • Statistics collection
  • Statistics usage

Query optimization
  • Shuffle elimination
    • Bucketing
    • Data repartition (when and how)

  • Optimizing joins
    • Shuffle-free join
    • One-side shuffle-free join
    • Broadcast join vs sort-merge join

  • Data reuse
  • Caching
  • Checkpointing
  • Exchange reuse

Optimization tips
  • Choose the appropriate number of shuffle partitions
  • Nondeterministic expressions
  • Configuration settings
Data layout
  • Different file formats
    • Parquet vs Json

  • Partitioning and bucketing
    • How bucketing works
    • How to ensure the proper number of files

  • Tables management
    • Working with the Catalog API

  • Delta-io
  • Open-source storage layer with ACID transactions


Předpoklady na účastníka:
  • Tento kurz je navazujícím kurzem ke školení Apache Spark - od jednoduchých transformací po vysoce výkonné joby , ve kterém člověk mimo jiné získá dobrou znalost DataFramového API a základní přehled o interních procesech ve Sparku.
  • Pro absolvování tohoto kurzu je tedy dobré mít předchozí zkušenosti se Sparkem (např. na úrovni výše zmíněného kurzu), znát DataFramové API a chápat základní principy distribuovaného počítání.
 


Cíl školení / poznámka ke kurzu

Cíle kurzu:

  • Rozumět a orientovat se ve fyzických plánech Spark SQL
  • Přepsat query za účelem dosažení efektivnějšího plánu
  • Používat některá konfigurační nastavení
  • Připravit Sparkem data pro efektivní analytiku ve Sparku
  • Diagnostikovat botlneck Sparkoveho jobu


Informace o rekvalifikaci


Tento kurz není rekvalifikační





Apache Spark for Data Engineers - Advanced Optimizations
Seznam kurzů & jednotlivých termínů


Termín kurzu
Místo konání
Rekvalifikační kurz a/nebo školení
Téma rekvalifikace
Akreditace - Certifikát - Zkouška
Cena
[včetně DPH]

[Přihláška]


Praha 7 - Praha, Jankovcova 49 17000

Apache Spark for Data Engineers - Advanced Optimizations (kurz)


16. 5. 2024
* Počet dní: 1
* Cena: 15.000 CZK
Cena (bez DPH)


18.150 Kč/Kurz





Další naše kurzy a školení


Termín kurzu není k dispozici nebo vám nevyhovuje vypsaný termín? Můžete vložit a o novém termínu kurzu Vás budem informovat


Hledat podobné kurzy: | Apache | Spark | for | Data | Engineers | Advanced | Optimizations
 



Pořadatel kurzu: DataScript s.r.o.

DataScript je autorizovaným poskytovatelem IT kurzů a certifikací. V našich školících prostorách poskytujeme řadu vysoce odborných a respektovaných IT kurzů, specializovaných technologických školení i certifikací IT specialistů, systémových administrátorů a techniků. V nabídce naší činnosti nechybí ani speciální tréninky určené ke zvýšení profesionálních dovedností a schopností odborných pracovníků. DataScript klade důraz nejen na dokonalou teoretickou přípravu a odborné znalosti, ale rovněž na jejich praktické využití a řešení konkrétních situací. DataScript je součástí koncernu Servodata. Společnost Servodata je významným Value Added Distributorem komponent a infrastruktury podnikových ICT řešení. Dlouhodobě se specializuje na distribuci serverových technologií, řešení data storage v širším kontextu řízení životního cyklu dat, bezpečnostních technologií, softwarové infrastruktury včetně licenční správy a komponent pro ukládání dat. Svoji činnost společnost zahájila již v roce 1991 a v současnosti se řadí mezi 30 největších ICT společností na tuzemském trhu. ...dále viz: DataScript s.r.o.
 


 

Dotaz ke kurzu


Dotaz ke kurzu Apache Spark for Data Engineers - Advanced Optimizations
text dotazu,
ostatní data (tel/email) se samozřejmě nezveřejňují a nezobrazují, pouze budou přeposlána školící firmě
pro kontrolu zadejte znovu Váš email
Vaše jméno     a příjmení
Vložte potvrzovací kód Vložte číslo       



     

Pro změnu potvrzovacího kódu je možno znovu načíst stránku (antispam)
 
URL kurzu:


Zkrácený odkaz na kurz:
http://www.rekvalifikacni.info/kurz-83390


Sdílet:       G+   Tw   fb

Podobné kurzy

Apache Spark for Data Engineers - Advanced Optimizations


  • 16.05.2024 Praha 7 - Apache Spark for Data Engineers - Advanced Optimizations DataScript s.r.o.


    ... jiné, ale podobné kurzy/školení
    ... nebo hledat další podobné kurzy Apache Spark for Data Engineers - Advanced Optimizations


  •  

    Poslední zprávy z oblasti vzdělávání & studia & rekvalifikace

    Kurzy a akce

    kurzy rekvalifikace
    2022-05-11 


    ^

    Summit Academy RAZU sport kurzy - Pustevny

    kurzy rekvalifikace
    2022-02-09 


    ^

    kurz freedivingu

    kurz rekvalifikace
    2022-02-04 


    ^

     

    Rekvalifikační kurzy a/nebo školení


    Rekvalifikační kurzy | Manažerské kurzy | Komunikační a prezentační dovednosti | Obchod a prodejní dovednosti, logistika | Personalistika a osobnostní rozvoj | Marketingové kurzy | Účetní a daňové kurzy, mzdy a pojištění | Finanční kurzy | VŠ studium, BBA, MBA programy | Systémy řízení a ISO | Právo a legislativa | Počítačové a IT kurzy | Kancelářský software | Programování | Počítačová grafika | Podnikové informační systémy | Počítačové sítě | Zpracování dat | Virtualizace | Technické kurzy, doprava | Stavebnictví, nemovitosti, reality | Školství, zdravotnictví a sociální oblast | Jazykové kurzy | Sport, umění a ostatní kurzy

     

    Registrace nové školící firmy


    Registrace nové školící firmy a/nebo vzdělávací instituce ZDARMA
     

    REKVALIFIKAČNÍ-KURZY.info


    MENU # seznam kurzu Termíny kurzů, školení | rekvalifikace poptávka Seznam poptávek kurzů | rekvalifikace seznam firem Seznam školících firem a institucí | novinky Novinky a zprávy | SLEVA Zlevněné kurzy

     


    rekvalifikacni-kurzy.info 2009 - 2024 | Kontakt | Tel.: 775 193 488 | Zatelefonujeme vám zpět - vraťte se ke kurzu a klikněte na odkaz: VYŽÁDÁNÍ KONTAKTU
    CZ 617 00 Brno, Potoční 8, eMail: info(at)rekvalifikacni-kurzy.info