Johdanto
Monessa organisaatiossa tietovarastointi on kasvanut vuosien varrella useista erillisistä ratkaisuista: Excel-raporteista, SQL-näkymistä ja yksittäisistä integraatioista. Kun datan määrä, lähteet ja käyttäjät kasvavat, kokonaisuus muuttuu nopeasti monimutkaiseksi ja vaikeasti hallittavaksi. Tämän vuoksi nykyaikaisissa toteutuksissa korostuvat kaksi periaatetta:
Rakenteellinen hallittavuus (Data Vault)
Toiminnallinen kerroksellisuus (Medallion-arkkitehtuuri)
Yhdessä nämä muodostavat tietovaraston, joka kestää aikaa, muutoksia ja laajentumista — ja mahdollistaa reaaliaikaisen analytiikan myös kriittisissä ympäristöissä.
Arkkitehtuuriperiaatteet
Tietovaraston tulisi vastata kolmeen kysymykseen:
MISTÄ TIETO TULEE?
Raakadata ja sen lähteet tallennetaan sellaisenaan (Bronze-kerros).
MITEN TIETO MUUNNETAAN?
Data Vault -malli mahdollistaa historian säilyttämisen ja versioinnin (Silver-kerros).
MITEN TIETO PALVELEE?
Kulta-kerros (Gold) kokoaa operatiiviset ja analytiikkatiedot yhtenäisiin näkymiin.
Tämä rakenne erottaa datan keruun, jalostamisen ja hyödyntämisen toisistaan, mikä helpottaa ylläpitoa ja auditointia. Arkkitehtuuri tukee myös modernia CI/CD-kehitystä ja automatisoitua testausta – ominaisuuksia, joita yritykset kuten Fortum ja VR arvostavat erityisesti datan luotettavuuden näkökulmasta.
Miksi Data Vault ja Medallion toimivat yhdessä
Data Vault tuo kurinalaisuuden ja historiallisen jäljitettävyyden:
Jokainen liiketoiminnan entiteetti (juna, komponentti, huoltotapahtuma) saa oman hubin.
Tapahtumat tallennetaan linkkeinä.
Muutokset kirjataan satelliitteihin, jolloin mikään tieto ei häviä.
Medallion-arkkitehtuuri puolestaan järjestää datan elinkaaren:
Bronze: raakadata
Jota ei koskaan ylikirjoiteta.
Silver: rikastettu tieto
Liiketoimintasäännöillä rikastettu ja yhdistetty tieto.
Gold: analytiikka
Analytiikkakäyttöön optimoitu, selkeä tietomalli.
Näiden yhdistelmä tarjoaa sekä rakenteellisen pysyvyyden että toiminnallisen ketteryyden. Tämä oli lähtökohtana myös VR Kunnossapidon tietovaraston suunnittelussa.
Esimerkki käytännöstä: VR Kunnossapito
VR Kunnossapito ylläpitää Suomen junakalustoa – satoja vetureita, vaunuja ja komponentteja, joiden huoltotapahtumia kertyy miljoonia vuodessa. Yritys tarvitsi ratkaisun, joka mahdollistaa ennakoivan huollon, kustannusseurannan ja datan yhdistämisen eri järjestelmistä.
Toteutimme arkkitehtuurin Snowflake-ympäristöön, jossa yhdistyivät:
DATA VAULT -MALLI
Kaluston, huoltotapahtumien ja komponenttien välisiin suhteisiin
MEDALLION-KERROKSET
Erotti raakadatan, jalostetun tiedon ja raportointikerroksen
AUTOMAATIO
Automaattinen latausketju ja validointi, jotka varmistavat datan eheän virran kentältä analytiikkaan
Tulokset ja hyödyt
ENNAKOIVA HUOLTO
Huollon suunnittelu siirtyi reaktiivisesta ennakoivaksi: datan avulla tunnistetaan riskikomponentit ennen vikaantumista
REAALIAIKAINEN RAPORTOINTI
Raportointiviive lyheni päivistä minuutteihin, mikä mahdollisti reaaliaikaisen seurannan
YHTEINEN TIETOMALLI
Yhteinen tietomalli yhdisti aiemmin erilliset huolto-, varaosa- ja käyttöjärjestelmät
SKAALAUTUVUUS
Skalaarinen arkkitehtuuri mahdollistaa uusien datalähteiden lisäämisen ilman rakenteellisia muutoksia
Opit ja johtopäätökset
Projektin tärkein oppi oli, että tekninen arkkitehtuuri on vain puolet kokonaisuudesta. Yhtä tärkeää on rakentaa hallittu prosessi datan elinkaarelle – siitä, miten raakadata muuttuu luotettavaksi tiedoksi ja miten sitä hyödynnetään liiketoiminnassa.
Tämä sama periaate on sittemmin toiminut lähtökohtana myös Gasgridin kaasumarkkinan analytiikkaratkaisussa ja Koiviston Auton liikennedatan tietovarastossa.