Dati .csv fajlovi sadrže podatke koji odgovaraju šemi sa slike.
Napisati jednu pySpark skriptu koja:
- Za svakog zaposlenog računa ukupnu sumu novca koju je primao po godinama. Razultat treba da bude u obliku
(ime, prezime, godina, suma novca),
- Pronalazi radnike kojima se plata nikada nije smanjivala. Rezultat je oblika:
(ime, prezime)
- Za svakog radnika ispisati kom departmanu pripada i ko mu je menadžer.
(imeRadnika, prezimeRadnika, imeDepartmana, imeMenadžera, prezimeMenadžera)
- Pronaći departman koji je isplatio najviše novca.
(imeDepartmana, kolicinaNovca)
Primer učitavanja jednog .csv fajla u odgovarajući RDD
Rešenja -> radnici.py: