Beskrivelse
Kurset gennemgår best practices og løsninger indenfor data science og statistik i Python. Python er et godt sprog indenfor Big Data-behandling, og på dette kursus får du forståelse for og erfaring med databehandling i Python. Du lærer at skabe rammerne for en holdbar data science løsning. Kurset vil arbejde både med Python, web og sql, så en basal viden om web og sql er at anbefale. Derudover til kurset berøre naturlig sprogforståelse via Python, samt hvor man kan simulere begivenheder med Python.
Indhold
- Simpel data repræsentation og behandling
- NumPy, Matplotlib og Pandas
- Machine learning med scikit-learn
- Machine learning modeller og deres anvendelse
- Regression-, Classification modeller brugt på datasæt
- Neurale netværk og deep learning
- Datasæts skalering og normalisering
- MultiLayer Perceptronen og dens praktiske anvendelse
- Natural Language processing
- Natural Language toolkit (NLTK) til data-analyse
- Håndtering af eksterne datakilder
- SQL databaser
- NoSQL databaser, MongoDB
- Fra servere