Vihapuhetta tunnistavat tekoälyt menevät sekaisin ”rakkaudesta”

Vihapuheen ja loukkaavan kommentoinnin määrä verkossa vain kasvaa. Sen hillitsemiseksi tarvitaan automaattisia työkaluja, jotka tunnistavat verkkopalvelujen sääntöjen vastaisen tai jopa laittoman sisällön.
Nyt Aalto-yliopiston Secure Systems -tutkimusryhmä on kuitenkin löytänyt parhaistakin koneoppimiseen perustuvista vihapuheentunnistimista merkittäviä heikkouksia. Käyttäjien on yllättävän helppo kiertää vihapuheen suitsemiseen kehitettyjä tekoälytyökaluja. Tarkoituksellinen tai tahaton huono kielioppi ja kirjoitusvirheet voivat tehdä vihanlietsonnasta ja loukkauksista tekoälylle vaikeita tunnistaa.
Ryhmä kokeili seitsemän uuden tunnistamistyökalun tarkkuutta. Kaikki reputtivat testit.
Nykyaikaiset luonnollisen kielen prosessointiin käytetyt mallit pystyvät luokittelemaan tekstiä merkkien, sanojen ja lauseiden piirteiden perusteella. Kun mallit joutuvat analysoimaan tekstidataa, jollaista ei ole käytetty niiden opettamiseen, tulosten laatu alkaa kärsiä.
”Lisäsimme vihapuheeksi tai loukkaavaksi määriteltyjen kommenttien sekaan kirjoitusvirheitä, muokkasimme sanojen rajoja tai lisäsimme joukkoon neutraaleja sanoja. Välilyöntien poistaminen sanojen välistä osoittautui englanninkielisen sisällön manipuloinnissa tehokkaimmaksi. Kaikkia keinoja yhdistelemällä saimme jopa Googlen kommenttien arvottamiseen käyttämän Perspective-työkalun sekaisin”, kertoo Tommi Gröndahl, Aalto-yliopiston tohtorikoulutettava.
Google Perspective luokittelee kommenttien loukkaavuutta tai ”toksisuutta” eri tekstianalyysin menetelmien avulla. Vuonna 2017 Washingtonin yliopiston tutkijat osoittivat, että Perspectiveä voi kuitenkin huijata lisäämällä tekstiin pieniä kirjoitusvirheitä.
Gröndahl havaitsi kollegoineen, että Perspective on sittemmin oppinut tunnistamaan myös kirjoitusvirheet, mutta se on edelleen huijattavissa muunlaisella manipuloinnilla, esimerkiksi poistamalla välilyöntejä ja lisäämällä harmittomia sanoja, kuten love, ’rakkaus’.
Perspectiven ja monen muun edistyneen vihapuheentunnistimen seulan läpäisi esimerkiksi lause ”I hate you” (”minä vihaan sinua”), kun se muokattiin muotoon ”Ihateyou love”.
Tutkijat huomauttavat, että asiayhteys määrittää pitkälti sen, tulkitaanko yksittäinen kommentti vihaksi vai vain asiattomaksi tai mauttomaksi. Vihapuhe on subjektiivista ja kontekstisidonnaista, ja tutkijoiden mukaan pelkät koneelliset tekstianalyysimenetelmät eivät riitä sen tarkkaan tunnistamiseen.
”Ihmiset muuttavat toimintaansa ja alkavat kokeilla eri tapoja kirjoittaa, koska he haluavat välttää kiinnijäämistä. Ollakseen tehokas tekoäly tarvitsee avukseen ihmisen tekemää tulkintaa”, uskoo tutkimusryhmän johtaja, Aalto-yliopiston professori N. Asokan.
Tekstiä analysoivien koneoppimismallien kehittämisessä tulisi tutkijoiden mukaan kiinnittää huomiota mallien opettamiseen käytettävän datan laatuun ja monipuolisuuteen, eikä niinkään mallien rakenteiden hiomiseen.
Ryhmän tulokset osoittavat myös, että vihapuheentunnistimet voisivat olla nykyistä tarkempia, jos ne analysoisivat tekstiä yksittäisten merkkien ja niiden yhdistelmien tasolla. Lisäksi kommenttien kontekstin luokittelua pitäisi saada hienovaraisemmaksi, jotta mallit osaisivat erottaa toisistaan esimerkiksi rasismin, seksismin ja henkilökohtaiset hyökkäykset.
Tutkimus tehtiin yhteistyössä Aalto-yliopiston Secure Systems -ryhmän ja Padovan yliopiston tutkijoiden kanssa. Tulokset esitellään lokakuussa ACM AISec -konferenssissa Torontossa.
Ryhmän artikkeli ”All You Need is "Love": Evading Hate-speech Detection” on osa Aalto-yliopiston Secure Systems -ryhmän projektia, joka tutkii tekstianalyysin keinoin valheellisen tai vilpillisen sisällön tunnistamista verkossa.
Tutkimusartikkeli:
Tommi Gröndahl, Luca Pajola, Mika Juuti, Mauro Conti, N.Asokan:
All You Need is "Love": Evading Hate-speech Detection.
https://arxiv.org/abs/1808.09115
Avainsanat
Yhteyshenkilöt
Tommi Gröndahl, tohtorikoulutettava
Aalto-yliopisto
Secure Systems -ryhmä
tommi.grondahl@aalto.fi
puh. 0400 426 523
N. Asokan, professori
Aalto-yliopisto
Secure Systems -ryhmä
n.asokan@aalto.fi
puh. 050 483 6465
Kuvat

Linkit
Tietoja julkaisijasta
Aalto-yliopistossa tiede ja taide kohtaavat tekniikan ja talouden. Rakennamme kestävää tulevaisuutta saavuttamalla läpimurtoja avainalueillamme ja niiden yhtymäkohdissa. Samalla innostamme tulevaisuuden muutoksentekijöitä ja luomme ratkaisuja maailman suuriin haasteisiin. Yliopistoyhteisöömme kuuluu noin 13 000 opiskelijaa ja yli 4 500 työntekijää, joista 400 on professoreita. Kampuksemme sijaitsee Espoon Otaniemessä.
Tilaa tiedotteet sähköpostiisi
Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.
Lue lisää julkaisijalta Aalto-yliopisto
Aalto-yliopiston tutkija ratkoi väitöskirjassaan Newtonin ajoista asti kutkuttanutta matematiikkapulmaa23.10.2025 10:30:00 EEST | Tiedote
Tutkija löysi sivuamisluvulle (engl. kissing number) kolme uutta alarajaa korkeissa ulottuvuuksissa. Pulma on kiehtonut mieliä jo vuosisatoja, ja viimeisimmätkin parannukset sivuamislukujen alarajoille alle 16-ulotteisissa avaruuksissa ovat yli 20 vuoden takaa.
Tutkijat kytkivät lähes ikiliikkuvan aikakiteen ensimmäistä kertaa ulkoiseen värähtelijään – voi kasvattaa kvanttitietokoneiden laskentatehoa16.10.2025 12:00:00 EEST | Tiedote
Aikakide on moninkertaisesti pitkäikäisempi kuin muut kvanttijärjestelmät, joten sitä voitaisiin hyödyntää esimerkiksi kvanttitietokoneiden laskentatehon sekä mittauslaitteistojen tarkkuuden kasvattamiseen.
Hiilipohjaiset radikaalit ovat tulevaisuuden aurinkokennoteknologiaa14.10.2025 08:10:00 EEST | Tiedote
Kansainvälisen tutkimusryhmän löydös on merkittävä askel kohti kevyitä, joustavia ja energiatehokkaita aurinkokennoja.
Aalto-yliopiston tutkijat YK:n COP30-ilmastokokouksessa9.10.2025 10:45:00 EEST | Tiedote
Tarvitsetko asiantuntijahaastateltavaa ilmastoon liittyvistä teemoista? Aalto-yliopiston tutkijoiden ja professorien asiantuntemus on käytettävissä ennen YK:n ilmastokokousta ja sen aikana. Tutkijoitamme osallistuu myös kokoukseen Brasiliassa. Energiamurros Mika Järvinen (professori) taitaa energiamurroksen ison kuvan: minkä pitää muuttua ja miten. Hän keskittyy tutkimuksessaan hiilidioksidin talteenottoon, vedyn tuotantoon eri menetelmillä, sekä kestävien polttoaineiden valmistukseen. Opetuksessaan Järvinen keskittyy muun muassa uusiutuvan energian tuottamiseen tuuli- ja aurinkovoimalla. Järvinen on myös juuri julkaissut aiheesta laajan suosion saaneen oppikirjan, ja osaa esittää monimutkaiset asiat ymmärrettävästi. Järvinen on paikalla ilmastokokouksessa Brasiliassa 10.–16.11. Hänet tavoittaa numerosta +358 40 754 2171 ja sähköpostista mika.jarvinen@aalto.fi Rakentamisen tulevaisuus Matti Kuittinen (professori) tutkii kestävää rakentamista. Hänen johtamansa tutkimusryhmä tutkii sitä,
Endurance ei ollutkaan aikansa vahvin laiva ja sen puutteet olivat tiedossa – tutkimusmatkailija Shackletonin aluksen uppoamisesta paljastui uutta tietoa6.10.2025 13:00:00 EEST | Tiedote
Uusi tutkimus osoittaa, että tutkimusmatkailija Ernest Shackletonin kuuluisa Endurance-alus ei ollut rakenteellisesti riittävän kestävä ahtojäiden puristukseen. Shackleton myös tiesi aluksen puutteista ennen huonosti päättynyttä matkaansa Etelämantereelle.
Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.
Tutustu uutishuoneeseemme
