VR Kunnossapito

VR Kunnossapito

Tietovaraston arkkitehtuurin parhaat käytännöt

Johdanto

Monessa organisaatiossa tietovarastointi on kasvanut vuosien varrella useista erillisistä ratkaisuista: Excel-raporteista, SQL-näkymistä ja yksittäisistä integraatioista. Kun datan määrä, lähteet ja käyttäjät kasvavat, kokonaisuus muuttuu nopeasti monimutkaiseksi ja vaikeasti hallittavaksi. Tämän vuoksi nykyaikaisissa toteutuksissa korostuvat kaksi periaatetta:

Rakenteellinen hallittavuus (Data Vault)

Toiminnallinen kerroksellisuus (Medallion-arkkitehtuuri)

Yhdessä nämä muodostavat tietovaraston, joka kestää aikaa, muutoksia ja laajentumista — ja mahdollistaa reaaliaikaisen analytiikan myös kriittisissä ympäristöissä.

975 työntekijää
Helsinki, Suomi
Rautatieliikenne
240,7M€

Arkkitehtuuriperiaatteet

Tietovaraston tulisi vastata kolmeen kysymykseen:

🔍

MISTÄ TIETO TULEE?

Raakadata ja sen lähteet tallennetaan sellaisenaan (Bronze-kerros).

🔮

MITEN TIETO MUUNNETAAN?

Data Vault -malli mahdollistaa historian säilyttämisen ja versioinnin (Silver-kerros).

🎯

MITEN TIETO PALVELEE?

Kulta-kerros (Gold) kokoaa operatiiviset ja analytiikkatiedot yhtenäisiin näkymiin.

Tämä rakenne erottaa datan keruun, jalostamisen ja hyödyntämisen toisistaan, mikä helpottaa ylläpitoa ja auditointia. Arkkitehtuuri tukee myös modernia CI/CD-kehitystä ja automatisoitua testausta – ominaisuuksia, joita yritykset kuten Fortum ja VR arvostavat erityisesti datan luotettavuuden näkökulmasta.

Miksi Data Vault ja Medallion toimivat yhdessä

Data Vault tuo kurinalaisuuden ja historiallisen jäljitettävyyden:

Jokainen liiketoiminnan entiteetti (juna, komponentti, huoltotapahtuma) saa oman hubin.

Tapahtumat tallennetaan linkkeinä.

Muutokset kirjataan satelliitteihin, jolloin mikään tieto ei häviä.

Medallion-arkkitehtuuri puolestaan järjestää datan elinkaaren:

Bronze: raakadata

Jota ei koskaan ylikirjoiteta.

Silver: rikastettu tieto

Liiketoimintasäännöillä rikastettu ja yhdistetty tieto.

Gold: analytiikka

Analytiikkakäyttöön optimoitu, selkeä tietomalli.

Näiden yhdistelmä tarjoaa sekä rakenteellisen pysyvyyden että toiminnallisen ketteryyden. Tämä oli lähtökohtana myös VR Kunnossapidon tietovaraston suunnittelussa.

Esimerkki käytännöstä: VR Kunnossapito

VR Kunnossapito ylläpitää Suomen junakalustoa – satoja vetureita, vaunuja ja komponentteja, joiden huoltotapahtumia kertyy miljoonia vuodessa. Yritys tarvitsi ratkaisun, joka mahdollistaa ennakoivan huollon, kustannusseurannan ja datan yhdistämisen eri järjestelmistä.

Toteutimme arkkitehtuurin Snowflake-ympäristöön, jossa yhdistyivät:

🗄️

DATA VAULT -MALLI

Kaluston, huoltotapahtumien ja komponenttien välisiin suhteisiin

🥇

MEDALLION-KERROKSET

Erotti raakadatan, jalostetun tiedon ja raportointikerroksen

⚙️

AUTOMAATIO

Automaattinen latausketju ja validointi, jotka varmistavat datan eheän virran kentältä analytiikkaan

Tulokset ja hyödyt

🔮

ENNAKOIVA HUOLTO

Huollon suunnittelu siirtyi reaktiivisesta ennakoivaksi: datan avulla tunnistetaan riskikomponentit ennen vikaantumista

REAALIAIKAINEN RAPORTOINTI

Raportointiviive lyheni päivistä minuutteihin, mikä mahdollisti reaaliaikaisen seurannan

🔗

YHTEINEN TIETOMALLI

Yhteinen tietomalli yhdisti aiemmin erilliset huolto-, varaosa- ja käyttöjärjestelmät

📈

SKAALAUTUVUUS

Skalaarinen arkkitehtuuri mahdollistaa uusien datalähteiden lisäämisen ilman rakenteellisia muutoksia

Opit ja johtopäätökset

Projektin tärkein oppi oli, että tekninen arkkitehtuuri on vain puolet kokonaisuudesta. Yhtä tärkeää on rakentaa hallittu prosessi datan elinkaarelle – siitä, miten raakadata muuttuu luotettavaksi tiedoksi ja miten sitä hyödynnetään liiketoiminnassa.

Tämä sama periaate on sittemmin toiminut lähtökohtana myös Gasgridin kaasumarkkinan analytiikkaratkaisussa ja Koiviston Auton liikennedatan tietovarastossa.

VR Kunnossapito tietovarasto ja junien ennakoiva huolto

Teknologiat

Snowflake Data Vault 2.0 Medallion-arkkitehtuuri Inkrementaalinen lataus Automatisoitu ajoastus Python