DAT200 Anvendt maskinlæring
Studiepoeng:10
Ansvarlig fakultet:Fakultet for realfag og teknologi
Emneansvarlig:Fadi al Machot
Campus / nettbasert:Undervises campus Ås
Undervisningens språk:Engelsk
Frekvens:Årlig
Forventet arbeidsmengde:Undervisning 78 timer, øvelser 26 timer, kollokvier og egenstudier mm: 146 timer.
Undervisnings- og vurderingsperiode: Emnet starter i vårparallellen. Emnet har undervisning/vurdering i vårparallellen.
Om dette emnet
Innføring i grunnleggende maskinlæringsmetodikk med moderne, beregningskraftige dataverktøy. Metodikken som dekkes omfatter:
- preprosessering og tilrettelegging av data: egenskapsuttrekking (PCA, LDA), variabelseleksjon/-viktighet, visualisering, skalering, formatering av datatyper
- klustring: blant andre K-means
- klassifikasjon: KNN, logistisk regresjon, LDA, SVM, decision trees
- regresjon: OLS, regularisering, polynomisk regresjon, trebaserte metoder, PCR, PLS
- strategier for modellvalidering og parameteroptimering
Kurset gir en innføring i metodenes grunnleggende teoretiske egenskaper, men har hovedfokus på anvendt modellering med reelle datasett. Studentene vil lære å lage effektive og treffsikre modeller som, avhengig av applikasjon, kan støtte opp om flere av FNs bærekraftsmål, blant andre 3, 11, 12, 14, 15.
Dette lærer du
Ferdigheter og innsikt i grunnleggende teknikker for maskinlæring. Grunnleggende forståelse av ulike modellers matematiske egenskaper og virkemåte. Studenten lærer seg å beherske analysemetoder som passer til 1) Eksplorativ dataanalyse (diagnose og visualisering), 2) Forbehandling av data fra varierende kilder, 3) Modellering og prediksjon med kontinuerlige og kategoriske responser (regresjon og klassifikasjon) og validering av prediktive modeller.
Studentene lærer å koble ulike problemstillinger til valg av hensiktsmessig analysemetodikk.
- Undervisningen består av forelesninger og praktiske øvelser med bruk av datamaskin og moderne maskinlæringsprogramvare (med bistand fra øvingslærere).
Maskinlæring er et fagområde i konstant utvikling, og læringsstøtteressurser på internett vil knyttes opp mot forelesninger og oppgaver via kurshjemmesidene i Canvas.
Studentene kan utover dette avtale kontakt med ansvarlig lærer på kontoret i treffetiden eller via epost.
- Pensumlitteratur, programvare, hjelpelitteratur, pensumoversikt m.m. oppgis på kursets hjemmeside.
DAT110 (tidligere MATH-INF110), alternativt STAT100 eller tilsvarende.
MATH113/MATH131 eller tilsvarende grunnleggende lineær algebra
INF120 eller et tilsvarende emne i grunnleggende programmering (ferdigheter i Python forutsettes).
INF200 eller et tilsvarende emne i videregående programmering (versjonskontroll og god programmeringspraksis antas kjent)
- MATH280 bør tas samtidig.
- Skriftlig eksamen, 3,5 timer. A-F.
Skriftlig eksamen Karakterregel: Bokstavkarakterer Hjelpemiddel: A1 Ingen kalkulator, ingen andre hjelpemidler - Ekstern sensor deltar sammen med intern sensor ved utformingen av eksamensoppgavene og sensorveiledningen. Ekstern sensor kontrollerer intern sensors vurdering av et tilfeldig utvalg kandidater som en kalibrering med visse mellomrom i henhold til fakultetets retningslinjer for sensur.
- Obligatoriske innleveringsoppgaver. Regler for godkjenning av obligatorisk aktivitet kunngjøres ved kursstart.
- Forelesninger: 4 timer/uke. Øvinger: 2 timer/uke.