Data-analytiikka
Data-analytiikka jalostaa tietomassaa
Data-analytiikan avulla suuresta tietomäärästä voidaan analysoida prosessiin liittyviä ominaisuuksia, etsiä poikkeuksia tai hakea muuten vaikeasti saatavaa tietoa. Data-analytiikan avulla data saadaan myös visualisoitua helpommin ymmärrettävään muotoon, jolloin prosessin luonnetta on helpompi selittää myös sitä heikommin tunteville.
Data-analytiikan työkaluja voidaan käyttää koottaessa dataa koneoppimismallin koulutusta varten. Datan visualisointi helpottaa prosessiasiantuntijaa näkemään datan kokonaisuutena, joten data-analyytikon ja prosessiasiantuntijan on helpompi kommunikoida keskenään ja perustaa päätöksenteko puhtaasti dataan.
Data-analyysin edut
Koneoppimisalgoritmien käyttö perustuu laadukkaaseen aineistoon eli dataan. Olipa kyse millaisesta koneoppimismallista tahansa, datan kelvollisuus pitää varmistaa kaikissa olosuhteissa. Jos esimerkiksi kuvaan perustuvassa mallissa ympäristön valaistus muuttuu dramaattisesti, luodaan eri olosuhteille omat datasetit eli tietoaineistot ja niiden perusteella koulutetaan olosuhteita vastaava päivityksestä tulee suoraviivaista.
Kaavioon on lisätty tekstit ”Päätös jatkosta”. Tämä tarkoittaa koneoppimismallin käyttöönottoa. Sekä tilaajan että toimittajan tulee olla projektin aikana tietoisia siitä, että haluttuja tuloksia ei välttämättä saavuteta käytettävissä olevin keinoin. Toisaalta data-analyysi voi paljastaa prosessista aiemmin tuntemattomia lineaarisuuksia tai riippuvuuksia, joiden perusteella prosessin ohjausta voidaan muuttaa ilman koneoppimisalgoritmeja.
Prosessidataan kokonaan tai osittain perustuvassa mallissa pitää myös varmistaa datan kelvollisuus. Prosessidatan esikäsittelyssä olisi hyvä olla mukana prosessin tunteva henkilö, jotta datasta saadaan poistettua sinne kuulumattomia arvoja sekä osataan korvata puuttuvia tietoja oikeilla arvoilla.