DAT200 Anvendt maskinlæring

Studiepoeng:10

Ansvarlig fakultet:Fakultet for realfag og teknologi

Emneansvarlig:Fadi al Machot

Campus / nettbasert:Undervises campus Ås

Undervisningens språk:Engelsk

Frekvens:Årlig

Forventet arbeidsmengde:Undervisning 78 timer, øvelser 26 timer, kollokvier og egenstudier mm: 146 timer.

Undervisnings- og vurderingsperiode:

Emnet starter i vårparallellen.

Emnet har undervisning/vurdering i vårparallellen.

Om dette emnet

Innføring i grunnleggende maskinlæringsmetodikk med moderne, beregningskraftige dataverktøy. Metodikken som dekkes omfatter:

  • preprosessering og tilrettelegging av data: egenskapsuttrekking (PCA, LDA), variabelseleksjon/-viktighet, visualisering, skalering, formatering av datatyper
  • klustring: blant andre K-means
  • klassifikasjon: KNN, logistisk regresjon, LDA, SVM, decision trees
  • regresjon: OLS, regularisering, polynomisk regresjon, trebaserte metoder, PCR, PLS
  • strategier for modellvalidering og parameteroptimering

Kurset gir en innføring i metodenes grunnleggende teoretiske egenskaper, men har hovedfokus på anvendt modellering med reelle datasett. Studentene vil lære å lage effektive og treffsikre modeller som, avhengig av applikasjon, kan støtte opp om flere av FNs bærekraftsmål, blant andre 3, 11, 12, 14, 15.

Dette lærer du

Ferdigheter og innsikt i grunnleggende teknikker for maskinlæring. Grunnleggende forståelse av ulike modellers matematiske egenskaper og virkemåte. Studenten lærer seg å beherske analysemetoder som passer til 1) Eksplorativ dataanalyse (diagnose og visualisering), 2) Forbehandling av data fra varierende kilder, 3) Modellering og prediksjon med kontinuerlige og kategoriske responser (regresjon og klassifikasjon) og validering av prediktive modeller.

Studentene lærer å koble ulike problemstillinger til valg av hensiktsmessig analysemetodikk.

  • Læringsaktiviteter
    Undervisningen består av forelesninger og praktiske øvelser med bruk av datamaskin og moderne maskinlæringsprogramvare (med bistand fra øvingslærere).
  • Læringsstøtte

    Maskinlæring er et fagområde i konstant utvikling, og læringsstøtteressurser på internett vil knyttes opp mot forelesninger og oppgaver via kurshjemmesidene i Canvas.

    Studentene kan utover dette avtale kontakt med ansvarlig lærer på kontoret i treffetiden eller via epost.

  • Pensum
    Pensumlitteratur, programvare, hjelpelitteratur, pensumoversikt m.m. oppgis på kursets hjemmeside.
  • Forutsatte forkunnskaper

    DAT110 (tidligere MATH-INF110), alternativt STAT100 eller tilsvarende.

    MATH113/MATH131 eller tilsvarende grunnleggende lineær algebra

    INF120 eller et tilsvarende emne i grunnleggende programmering (ferdigheter i Python forutsettes).

    INF200 eller et tilsvarende emne i videregående programmering (versjonskontroll og god programmeringspraksis antas kjent)

  • Anbefalte forkunnskaper
    MATH280 bør tas samtidig.
  • Vurderingsordning, hjelpemiddel og eksamen
    Skriftlig eksamen, 3,5 timer. A-F.

    Skriftlig eksamen Karakterregel: Bokstavkarakterer Hjelpemiddel: A1 Ingen kalkulator, ingen andre hjelpemidler
  • Sensorordning
    Ekstern sensor deltar sammen med intern sensor ved utformingen av eksamensoppgavene og sensorveiledningen. Ekstern sensor kontrollerer intern sensors vurdering av et tilfeldig utvalg kandidater som en kalibrering med visse mellomrom i henhold til fakultetets retningslinjer for sensur.
  • Obligatorisk aktivitet
    Obligatoriske innleveringsoppgaver. Regler for godkjenning av obligatorisk aktivitet kunngjøres ved kursstart.
  • Undervisningstider
    Forelesninger: 4 timer/uke. Øvinger: 2 timer/uke.