Haku

Tietojoukkojen anonymisointi ja jälleentunnistaminen

QR-koodi

Tietojoukkojen anonymisointi ja jälleentunnistaminen

Nykyään ihmisistä kerätään ja tallentuu massiivisia määriä henkilökohtaista dataa, mutta kyseisen datan yksityisyydensuojasta ja turvallisuudesta ei aina voida olla täysin varmoja. Kun ihmisten henkilökohtaisia tietoja, kuten sairaushistoriaa tai hoitotietoja, julkaistaan esimerkiksi tutkimuskäyttöön, tulee tiedot anonymisoida riittävällä tavalla eli käsitellä siten, ettei yksittäisiä henkilöitä kyetä tunnistamaan tiedoista. Vaikka anonymisointitekniikoita on useita ja ne voivat olla tehokkaita, eivät ne ole täydellisiä: joskus anonymisointi voi pettää ja ihmisten mahdollisesti arkaluontoisiakin tietoja voi tulla julki ja päätyä vääriin käsiin. Anonymisoinnin pettäminen voi johtua joko ihmisten tietoja sisältävän tietokannan hallinnoijan virheestä, tai vastustajan – tietojen paljastamista haluavan henkilön – aktiivisista toimista. Tämän kirjallisuuskatsauksen tarkastelun kohteena on tietojoukkojen anonymisointi sekä deanonymisointi eli jälleentunnistaminen. Tutkimuskysymyksenä on selvittää, ovatko nykyiset tietojoukkojen anonymisointitoimenpiteet riittäviä ihmisten yksityisyyden takaamiseksi tietojoukoissa, eli voidaanko anonymisointiin täysin luottaa nykyajan digitaalisessa maailmassa. Katsauksessa tutustutaan erilaisiin tietojoukkojen anonymisointitekniikoihin ja -menetelmiin sekä niiden epäonnistumisiin eli tapauksiin, joissa anonymisointi on pettänyt ja deanonymisointi on onnistunut, jolloin yksityishenkilöiden piilotettuja identiteettejä on kyetty paljastamaan. Yhteenvetona voidaan todeta, että täydellisesti anonyymiä ja samanaikaisesti hyödyllistä tietojoukkoa ei ole mahdollista luoda, sillä muun muassa täydentävää, ulkopuolista informaatiota hyväksikäyttäen yksityishenkilöistä on mahdollista paljastaa tunnistavaa henkilökohtaista informaatiota.

Tallennettuna: