Tänapäeval teab ilmselt igaüks, et nutitelefonid, äppid, veebibrauserid ja iga muu nutikas seade kogub Sinu kohta päris märkimisväärsel hulgal informatsiooni. Kui arvate, et kõik see info uurijatel ja teenusepakkujatel kuhugi solgitorusse voolab, siis arvate väga valesti. Samamoodi arvate tõenäoliselt valesti, kui arvate, et keegi viitsib teie kui indiviidiga sellisel määral tööd teha, et ainult teid jälgida. See ongi aga koht, kus tuleb mängu big data analysis.

Maailma üks kuulsamaid big data analüütikuid Michal Kosinski on alates 2008. aastast välja töötanud selle kallal, et inimesi nende Facebooki profiilide põhjal profileerida. Ma ei hakka täpsema süsteemi välja töötamise tutvustamisele siin tähemärke kulutama, sest Vice on selle kohta kirjutanud juba väga hea ja ülevaatliku artikli, mis muuhulgas räägib sellest, kuidas big data aitas tõenäoliselt Donald Trumpil võimule saada. Artiklit on võimalik lugeda siin.

Süsteemi põhiloogika

Lühidalt öeldes, on igal asjal, mida Sa Facebookis oled likenud mingi nii-öelda “tüüp”. Näiteks on suurem osa kosmeetikabrändide likejaid naised, samamoodi tõenäoliselt suurem osa mingi rallilehekülje likejatest mehed. Suurem osa näiteks Ellen DeGenerese likejatest liberaalid ning suurem osa Donald Trumpi likejatest pigem konservatiivid. Mida rohkem selliseid üldistatavaid asju oled likenud, seda lihtsam on big data analüüsi põhjal öelda, et mis Sulle tõenäoliselt veel meeldiks või mis Sulle ei meeldiks ning isegi pakkuda Su isiksusetüüpi, sugu, vanust ja kõike muud.

Kosinski väitel on süsteem võimeline hindama inimest täpsemalt kui inimese kolleeg vaid 10 like põhjal, 70 like põhjal paremini kui sõbrad, 150 puhul paremini kui inimese vanemad ning 300 like puhul paremini kui inimese partner. Üle 300 like puhul võib süsteem inimese kohta teada saada isegi rohkem, kui inimene ise enda kohta teab. Päris hirmutav, eks?

Testi ennast

Vaatamata sellele, et kõik see on päris hirmutav, on Cambridge’i ülikooli töögrupp, kus Kosinski enda projektiga tegeleb, avaldanud enda süsteemi ka tavainimesele testimiseks. Tähele tuleb seejuures panna lehekülgede arvu, mida süsteem Sinu analüüsiks kasutanud on – mida suurem on see lehekülgede arv, seda täpsem on analüüs. Süsteem võtab kahjuks aga kasutusele ainult inglisekeelsed ning suuremad Facebooki lehed. Tahad näha, mida süsteem Sinu kohta ütleb? Vaata siia.