Ved SINTEF arbeider vi med å lage materialer for ny bærekraftig teknologi som industrien trenger, slik som batterier, solceller, LED-belysning og biomaterialer. Materialene må ha eksakte egenskaper, være holdbare og inneholde minst mulig miljø- og helsefarlige stoffer.
Design av nye materialer går nå raskere takket være kraftige datamaskiner og avanserte beregninger. Det har blitt utviklet en rekke ulike materialdatabaser som kan gi informasjon om egenskapene til de ulike materialene. Disse databasene kan brukes til å trene KI-modeller for å optimalisere materialer.
– For å kunne lage nye, korrekte KI-modeller trenger vi store mengder data fra alle relevante databaser. Men, de ulike databasene har også forskjellige grensesnitt og måter å representere dataene på. Dette har gjort det vanskelig å bruke dem sammen, sier Casper Welzel Andersen, forsker ved SINTEF.
Enklere tilgang til materialdatabaser
De siste åtte årene har det blitt utviklet en ny standard for å dele digitale data om materialer; OPTIMADE (Open databases integration for materials design). Standarden lar brukere kommunisere med ulike materialdatabaser på samme måte. Den er basert på eksisterende webbaserte protokoller og utviklet i samarbeid med store materialdatabaser i Europa og USA. Et stort internasjonalt nettverk med over 30 institusjoner over hele verden, deriblant SINTEF, står bak.
– Med OPTIMADE kan forskere ved universiteter eller i industrien enkelt kommunisere med alle disse databasene og forstå informasjonen de mottar, sier Gian-Marco Rignanese, professor ved Institutt for kondensert materie og nanovitenskap ved UCLouvain i Belgia.
Enorme mengder ulike data
Kraftige datamaskiner brukes i dag til å gjøre avanserte simuleringer av hvordan elektroner beveger seg i materialer, som igjen gir informasjon om de ulike materialegenskapene. Disse beregningene gir store mengder data som kan brukes til å trene opp maskinlæringsmodeller. KI-modellene kan deretter forutsi egenskapene til nye materialer basert på nye beregninger.
Men, det kreves enorme mengder data for å trene modellene. Over tid har det blitt samlet inn mange slike databaser fra ulike forskningsgrupper og prosjekter. Hver enkelt av disse databasene har sin egen måte å gjøre søk på, sin egen måte å beskrive dataene, og sin egen måte å beskrive hva dataene representerer. Med OPTIMADE er data fra storskala simuleringer, og generelle data om materialer, tilgjengelige gjennom samme protokoll. På denne måten blir søk og datarepresentasjon lik.
– Den siste versjonen av OPTIMADE gir en kraftig forbedret mulighet til å nøyaktig beskrive egenskapene til ulike materialer ved hjelp av tydelige, maskinlesbare definisjoner. Med disse kan vi forstå data fra de forskjellige databasene og bruke dem sammen, sier Casper Welzel Andersen.
Gir forskere mer tid til vitenskapelig arbeid
OPTIMADE-standarden er et høyt verdsatt verktøy for forskere innen materialvitenskap ved SINTEF.
– I et av våre AI-prosjekter stod vi overfor utfordringer med å få eksperimentelle resultater og simuleringsresultarer for noen viktige metallurgiske data til å stemme overens. Det viste seg at selv om begge disse miljøene har snakket om de samme tingene i mange år, var det vanskelig å bygge bro mellom dem. Løsninger som OPTIMADE bringer til bordet, kan hjelpe oss med å bruke mer tid på vitenskapelige og tekniske utfordringer og mindre tid på å håndtere problemer som blir «tapt» i oversettelsen, sier forsker Daniel Marchand.
Standarden OPTIMADE har allerede blitt brukt i det EU-finansierte prosjektet OntoTrans. Her har det blitt utviklet en Open Translation Environment, som er en verktøykasse for å forstå og løse industriens problemer knyttet til ulike materialer. Verktøykassen bruker blant annet OPTIMADE for å gi brukeren tilgang til et bredt spekter av beregningsresultater. OntoTrans er nå i sin sluttfase, men verktøykassen har allerede blitt videreført i industrikonsortiet Semantic Materials, hvor SINTEF er en av kjernebidragsyterne.