På dette kursus lærer du i Python at løse data science opgaver med Pandas, NumPy og Matplotlib.
Vi ser først på hvilke pakker der skal være tilgængelige på systemet, og hvorledes man kommer i gang med at bruge Pandas, NumPy og Matplotlib fra en IDE og/eller Jupyter Notebook.
Man introduceres til NumPy som tilbyder effektive matematiske beregninger på arrays og matricer, og som sammen med Pandas anses for være vigtige dele af Pythons data science økosystem.
Vi lærer at indlæse dataset og gemme data mht forskellige datakilder og filformater.
Vi afdækker muligheder for at klargøre data, udføre dataanalyser og visualisere dataset og resultater med matplotlib.
Der vil være opmærksomhed på områder som: Brugen af matplotlib, Categorical Data, Streng håndtering bl.a med regular expressions, Tidsserier, Håndtering af større dataset.