Ruski programeri protiv svjetskih pedofila

ShutterStock/Legion-Media
Stručnjaci ruskog sveučilišta "Visoka škola ekonomije" zajedno s europskim kolegama izradili su program koji po chatu otkriva pedofile na internetu.

Stručnjaci Nacionalnog istraživačkog sveučilišta "Visoka škola ekonomije" (VŠE) u Moskvi su 2011. godine zajedno s europskim znanstvenicima napravili računalni program za analizu velikih količina nestrukturiranih tekstova. Softver se može koristiti za rješavanje različitih problema, ali je najzanimljivija sfera njegove primjene otkrivanje pedofila na internetu.

Danas taj program uspješno primjenjuje policija Amsterdama. Naziv softverskog paketa nije poznat, kao ni pojedinosti vezane za njegovu primjenu.

 

Tko je "pedofil" po mišljenju kompjutera?

Program koji su napravili ruski znanstvenici analizira sadržaj chata i otkriva čestu uporabu leksika seksualnog karaktera. Tako službenici policije dobivaju vizualnu prezentaciju o odnosima između sudionika u chatu, leksika koji je korišten i mogućih akcija seksualnog karaktera. Na temelju toga kriminolozi zatim izvode zaključke.

Program ima najmanje šest komponenata. Ruska komponenta vrši analizu velike količine teksta na temelju formalnih pojmova (Formal Concept Analysis). Pomoću nje se podaci redaju u takozvani dijagram rešetke pojmova, koji je vizualno vrlo pregledan. Sada je ta komponenta dio automatiziranog sustava znanstvenih istraživanja Formal Concept Analysis Research Toolbox (FCART).

"Baza podataka s gledišta kompjutorskog programa formalizira pojmove kao što su 'pedofil', 'zločin', 'udvaranje' ili 'osobni susret'", objašnjava stariji znanstveni suradnik Laboratorija sofisticiranih sustava i strukturne analize VŠE Aleksej Neznanov. "Tako smo mi pomogli da se u kompjuter prenesu znanja stručnjaka za kriminalistiku, tako da se sada po dijagramima mogu vizualno definirati potrebne karakteristike tekstova. Ranije su kriminolozi morali pregledavati i analizirati gotovo sve tekstove u chatovima".

 

I prijestupnici koriste LOL

Program može otkriti prijestupnika čak i ako on koristi različite nadimke, i to na temelju sličnosti vokabulara, analizom različitih chat sesija i redoslijeda nastanka fragmenata teksta, kao i njihove vremenske povezanosti. Na razvoju te funkcije radili su belgijski i nizozemski znanstvenici.

Programeri su morali uzeti u obzir osobnost chata na internetu. "Bilo je neophodno da se u bazu podataka unesu žargonski nazivi dijelova tijela i sleng u kojem se fragmenti riječi zamjenjuju brojevima, primjerice, broj 2 koji znači "to", 4 sa značenjem" for", a također standardne kratice u chatu poput LOL i popularne varijante pisanja riječi s pogreškama", objasnio je Neznanov za RBTH.

Pored toga, postojala je potreba da se osigura sigurnost profesionalnih "pričaonica". "Klasičan primjer su chatovi fotografa koji razgovaraju o grupnim snimkama djece u prirodi", kaže Aleksej Neznanov. "Specijalno smo za takve slučajeve morali precizirati pojam 'traženja fotografija ili video materijala', polazeći od toga da fotografi većinom svakako nisu pedofili.

 

Kako otkriti ruskog ili francuskog pedofila?

Program je testiran na velikoj količini tekstova američkog društva za borbu protiv pedofila, kao i na edukativnoj bazi podataka o stvarnim zločinima. Softver se može koristiti za chat sesije, ali i za druge tekstove na internetu, uključujući i društvene mreže.

On skenira otvorene "pričaonice", ali i zatvorene chatove maloljetnih članova društva uz dozvolu roditelja. Sa zatvorenim chatovima policajci rade inkognito, s time što chat sesija poslije čuvaju u policijskim bazama podataka.

U ovom trenutku program može analizirati engleski, nizozemski i njemački jezik. S drugim jezicima, uključujući i ruski, znanstvenici nisu radili. Prema njihovim riječima, za ruski, francuski i neke druge jezike zasad ne postoje dostupni softverski instrumenti s dovoljno kvalitetnim lingvističkim algoritmima.

Više