Vi trenger nye verktøy for å analyse tidsrekker. En utfordring man ofte møter når man analyserer tidsrekker er at de er uregelmessige. Uregelmessige tidsrekker har egenskaper som gjør dem vanskelige å bruke til beslutningsstøtte. Uregelmessigheter i tidsrekker kan være: manglende data (dvs. at tidsrekken mangler verdi på noen tidspunkt), mye støy (f.eks. vil billige sensorer ofte ha mye mer støy i enn tilsvarende høykvalitetssensorer).
En utfordring man ofte møter når man analyserer tidsrekker er at de er uregelmessige. Uregelmessige tidsrekker har egenskaper som gjør dem vanskelige å bruke til beslutningsstøtte. Uregelmessigheter kan f.eks. være: manglende data (dvs. at tidsrekken mangler verdi på noen tidspunkt), mye støy (f.eks. vil billige sensorer ofte ha mye mer støy i enn tilsvarende høykvalitetssensorer).
Prosjektet vil fokusere på følgende oppgaver:
- Prognoser: å predikere fremtidige verdier for tidsrekken basert på historiske data.
- Imputering/støyreduksjon: Lage “ren” data når man observerer tidsrekker med støy eller manglende data.
- Avviks- og feilprediksjon, som handler om å vite hvilke observasjoner er unormale eller som indikerer at et system er i en kritisk tilstand.
- Syntetiske data.
Det siste punktet er sterkt knyttet til å lage datasett som sikrer personvern. Et eksempel hvor dette er relevant er sensordata hentet fra mobiltelefonen, som i utgangspunktet ikke er anonyme data. Nyere forskning viser at det likevel kan være mulig å generere syntetiske data som statistisk oppfører seg som reelle data, men som samtidig er anonyme. Prosjektet har også fokus på reproduserbar forskning og utvikling av åpen kildekode.
ML4ITS er i samarbeid mellom SINTEF Digital og tre institutter ved NTNU: Institutt for datateknologi og informatikk (IDI), Institutt for Matematiske fag (IMF), og Institutt for elektroniske systemer (IES).