Beskrivelse
Lær hvordan du kan løse mange ofte stillede Data Science problemstillinger med R. Dette kursus introducerer dig til de vigtigste redskaber for Data Science i R, så du effektivt kan løse mange praktisk forekommende problemstillinger.
Data Science er et spændende felt, og efterspørgslen efter personer med kvalifikationer heri synes kun at stige i takt med, at virksomheder retter fokus mod digitalisering og data exploration. Målet med dette tre dages kursus er at gennemgå nogle basale værktøjer til at tackle en bred vifte af Data Science udfordringer gennem et fokus på praktisk opgaveløsning.
Deltagerprofil
Dette kursus er for dig, som gerne vil lære at anvende R i dit arbejde med Data Science.
Du har erfaring med programmering gennem dit daglige arbejde med data eller fra din uddannelse og har en grundlæggende matematisk forståelse. Grundlæggende kendskab til R vil også være nyttigt.
Indhold
Introduktion til RStudio IDEen, den mest populære IDE for R programmering.
Importering af data fra flat files og databaser. Data kommer fra en række forskellige kilder, derfor er det vigtigt at vide, hvordan man får data fra disse kilder ind ...
%%%
... i R.
Manipulation af data med et fokus på en meget anvendt pakke for datamanipulation kaldet dplyr. dplyr indeholder en grammatik for datamanipulation, der gør det nemmere og sjovere at manipulere data i R, hvilket er hvad mange analytikere bruger størstedelen af deres tid på.
Plot data med fokus på ggplot2 pakken. ggplot2 indeholder en lignende grammatik for plotning i R. Det at kunne plotte er vigtigt, når konklusioner skal drages og deles med kollegaer.
Programmér en prædiktionsmodel i R også kaldet supervised learning. Lær hvordan man implementerer modeller i R gennem øvelser med et fokus på populære machine learning modeller.
Basal Clustering i R også kaldet unsupervised learning. Lær hvordan du klynger lignende observationer sammen i grupper.
Interaktiv rapportering af resultater til kollegaer med R Markdown. En erhvervet viden om data er ikke meget værd, hvis man ikke kan kommunikere denne forståelse til andre. R Markdown er et stærkt værktøj for rapportering.
Med mere.
Underviser
Troels arbejder som Data Scientist, hvor han til hverdag bruger SQL, Python, Scala, Spark og R til Big Data analyse. Han har en kandidat i Matematisk Investering fra Aarhus Universitet, hvor han har undervist i flere år i statistiske og matematiske kurser. Han er meget interesseret i Data Science fra et teoretisk og praktisk perspektiv.
Forudsætning
Kurset er for dig, som gerne vil lære at anvende R i dit arbejde med Data Science, og som har erfaring med programmering gennem dit daglige arbejde med data eller fra din uddannelse. Du har en grundlæggende matematisk forståelse og grundlæggende kendskab til R vil også være nyttigt.
Lær, hvordan du løser de mest almindelige Data Science-problemstillinger med R. Du får kendskab til basale og vigtige værktøjer og prøver dem af gennem praktisk opgaveløsning. Efterspørgslen efter personer med kvalifikationer inden for Data Science stiger i takt med, at virksomheder retter fokus mod digitalisering og data exploration.
Lær at bruge de vigtigste redskaber i R
Lær at løse Data Science-problemstillinger i R
Bliv introduktion til RStudio IDEen, den mest populære IDE for R programmering
Lær at importere data fra flat files og databaser til R
Lær om Supervised og unsupervised Learning
Indhold
Introduktion til RStudio IDEen, den mest populære IDE for R programmering
Importering af data fra flat files og databaser. Data kommer fra en række forskellige kilder, derfor er det vigtigt at vide, hvordan man får data fra disse kilder ind i R
Manipulation af data med et fokus på en meget anvendt pakke for datamanipulation kaldet dplyr. dplyr indeholder en grammatik for datamanipulation, der gør det nemmere og sjovere at manipulere data i R, hvilket er hvad mange analytikere bruger størstedelen af deres tid på
Plot data med fokus på ggplot2 pakken. ggplot2 indeholder en lignende grammatik for plotning i R. Det at kunne plotte er vigtigt, når konklusioner skal drages og deles med kollegaer
Programmér en prædiktionsmodel i R også kaldet supervised learning. Lær hvordan man implementerer modeller i R gennem øvelser med et fokus på populære machine learning modeller
Basal Clustering i R også kaldet unsupervised learning. Lær hvordan du klynger lignende observationer sammen i grupper
Interaktiv rapportering af resultater til kollegaer med R Markdown. En erhvervet viden om data er ikke meget værd, hvis man ikke kan kommunikere denne forståelse til andre. R Markdown er et stærkt værktøj for rapportering
Med mere