Product image media
Product image media

Python, Pandas og NumPy

9.600,00 kr

Beskrivelse


På dette kursus lærer du i Python at løse data science opgaver med Pandas, NumPy og Matplotlib. Vi ser først på hvilke pakker der skal være tilgængelige på systemet, og hvorledes man kommer i gang med at bruge Pandas, NumPy og Matplotlib fra en IDE og/eller Jupyter Notebook. Man introduceres til NumPy som tilbyder effektive matematiske beregninger på arrays og matricer, og som sammen med Pandas anses for være vigtige dele af Pythons data science økosystem. Vi lærer at indlæse dataset og gemme data mht forskellige datakilder og filformater. Vi afdækker muligheder for at klargøre data, udføre dataanalyser og visualisere dataset og resultater med matplotlib. Der vil være opmærksomhed på områder som: Brugen af matplotlib, Categorical Data, Streng håndtering bl.a med regular expressions, Tidsserier, Håndtering af størrer dataset.

Indhold

  • Kom i gang med Python, pakker og værktøjer
  • Pandas, NumPy og matplotlib
  • IDE og/eller Jupyter Notebook
  • Introduktion til numpy
  • Numpy ndarray
  • Numpy Array vs Python List
  • Arrays og Vektoriserede beregninger.
  • Kom i gang med Pandas
  • Series, DataFrame og Index objects
  • Vigtig funktionalitet
  • Indexing, Selection and Filtering
  • Integer Indexes
  • Aritmetik og Data alignment
  • Boolean Indexes
  • Axis Indexes
  • Sortering og rangorden
  • Opsummeringer og beskrivende statistikker.
  • Options og indstillinger
  • Dataindlæsning, gem og filformater
  • Læs og skriv data
  • Dataoprensning og -klargøring
  • Håndtering af manglende data
  • Streng håndtering bl.a med regular expressions
  • Data tilpasning: Join, Combine og Reshape
  • Kombiner og sammensæt datasets
  • Plotting og visualisering
  • Introduktion til matplotlib
  • Plotting med pandas
  • Data Aggregering og Gruppe Operationer
  • Group By
  • Data Aggregering
  • Apply
  • Tidsserier
  • Advanced Pandas
  • Categorical Data
  • Håndtering af større dataset