Delavnica: Uvod v obdelavo velepodatkov v Pythonu

Europe/Ljubljana
MS TEAMS

MS TEAMS

Mladen Borovič (UM FERI)
Description

Kratek opis: Udeleženci bodo spoznali osnove knjižnice Pandas, ki je trenutno najbolj razširjena knjižnica za delo s podatki za potrebe strojnega učenja, podatkovne znanosti in visoko zmogljivega računalništva. Predstavljene bodo osnovne podatkovne strukture, ki jih nudi knjižnica in funkcije za nalaganje podatkov v formatih CSV in JSON skupaj s funkcijami za analizo in delo s podatki. Na primeru večje obstoječe podatkovne zbirke bo prikazana uporaba namenskih funkcij za prečiščevanje, filtriranje in enostavno vizualizacijo podatkov.

Podrobnejši opis: Na tej delavnici bodo udeleženci pridobili poglobljeno razumevanje osnov knjižnice Pandas, ene izmed najbolj priljubljenih knjižnic za obdelavo podatkov, posebej primerne za potrebe strojnega učenja, podatkovne znanosti in visoko zmogljivega računalništva. Program delavnice bo zajemal predstavitev temeljnih podatkovnih struktur, kot so podatkovni okvirji in serije, ki omogočajo učinkovito shranjevanje in obdelavo podatkov v različnih oblikah. 

Osrednji del izobraževanja bo usmerjen v uporabo funkcij knjižnice Pandas za nalaganje podatkov, predvsem v formatih CSV in JSON. Udeleženci bodo spoznali ključne postopke za uvoz in pripravo podatkov, kar vključuje čiščenje, združevanje in organizacijo podatkov ter delo z manjkajočimi vrednostmi. Poleg tega bodo obravnavani pomembni vidiki obdelave podatkov, kot so filtriranje, združevanje ter izvajanje osnovnih statističnih analiz. Delavnica bo vsebovala praktični primer uporabe Pandas na obsežnejši, realni podatkovni zbirki, pri čemer bodo udeleženci pridobili vpogled v postopke čiščenja podatkov, filtriranja in priprave na analizo. Poudarek bo tudi na osnovah vizualizacije, ki omogoča učinkovito predstavitev in raziskovanje podatkov, kar udeležencem omogoča, da odkrijejo pomembne vzorce in trende.

Zahtevnost: Osnovna

Jezik: Slovenski

Termin: 27. 11. 2024 od 9.00 - 13.00

Omejitev števila udeležencev: 30

Virtualna lokacija: MS TEAMS

Priporočeno predznanje: Osnovno poznavanje programskega jezika Python

Ciljna publika: Raziskovalci, inženirji, študenti, podatkovni znanstveniki, podatkovni analitiki 

Potek izobraževanja: Izobraževanje poteka na daljavo v okolju MS Teams. Udeleženci sodelujejo s pomočjo zvezkov Jupyter, ki jih odprejo na platformi Google Colab.

Na izobraževanju pridobljena znanja:

  • Razumevanje postopkov obdelave velepodatkov
  • Uporaba osnovnih funkcij knjižnice Pandas za obdelavo velepodatkov
  • Uporaba naprednih funkcij knjižnice Pandas za delo z velepodatki
  • Optimizacija nalaganja in shranjevanja velepodatkov
  • Vizualizacija in analiza velepodatkov

 

Organizator:

Predavatelji:

Ime:Mladen Borovič
Opis:Mladen Borovič je asistent na Fakulteti za elektrotehniko, računalništvo in informatiko Univerze v Mariboru (UM FERI). Njegova raziskovalna področja so aplikacije umetne inteligence, priporočilni sistemi in iskalnike, sistemi za detekcijo podobnih vsebin, obdelava naravnega jezika in visokozmogljivo računalništvo.
E-mail:mladen.borovic@um.si 

 


Registration
Registration