Väitös: Tehokkaampi vihapuheen tunnistus voi lisätä myös tietoturvariskejä

23.8.2021 12:44:05 EEST | Aalto-yliopisto | Tiedote

Jaa

Kieliteknologian kehittyminen helpottaa paitsi moderointia myös sensuuria, sanoo kieliteknologiamenetelmistä väittelevä Tommi Gröndahl.

Neuroverkot prosessoivat kieltä tehokkaasti, mutta eivät välttämättä samoin kuin ihminen. Kuva: Matti Ahlgren, Aalto-yliopisto.

Tohtorikoulutettava Tommi Gröndahl väittelee 23. elokuuta kieliteknologioista Aalto-yliopistossa. Kieliteknologia on yksi yleisimmistä tekoälyn muodoista, ja Gröndahl testasi sen menetelmiä muun muassa valheiden ja vihapuheen tunnistamisessa.

”Tekoälyä tarvitaan, kun massiivista datamääristä pitää seuloa ja siivilöidä haluttuja asioita. Kieliteknologiat ovat kuitenkin olleet musta laatikko eli niitä on käytetty ilman, että on oikeastaan ymmärretty, miten ne prosessoivat kieltä”, Gröndahl sanoo.

Gröndahlia kiinnostivat erityisesti menetelmien seuraukset tietoturvan ja yksityisyydensuojan näkökulmasta.

”Jos kieliteknologiamenetelmiä kehitetään, se parantaa sekä moderoinnin että sensuroinnin mahdollisuuksia. Tekniikat ovat ihan samoja, on tekstin luokittelulla mitä tahansa seurauksia kirjoittajalle”, Gröndahl sanoo.

Gröndahl vertasi tutkimuksessa syväoppivia neuroverkkoja perinteisempiin sääntöpohjaisiin menetelmiin. Niissä ihminen luo järjestelmään säännön, jota sitten hyödynnetään automatisoinnissa. Menetelmien väliltä löytyi suuria eroja.

”Monimutkaisissa neuroverkkomalleissa on niin valtavasti numeroita, että on vaikea tietää, mitä tekstin piirrettä kukin edustaa ja mitä tekstille tapahtuu, kun jokin numeroista muuttuu. Kun teksti kaipaa yksityiskohtaista jäsentämistä, yleisimmin käytetyt neuroverkkomallit eivät aina ole luotettavia. Neuroverkkomallilla saattaa esimerkiksi olla vaikeuksia tehdä eroa lauseen ja sen kielteisen vastineen välillä”, Gröndahl sanoo.

Sääntöpohjaisten menetelmien vahvuus taas ei ole isojen datamäärien seulomisessa. Siksi on oleellista yhdistää eri menetelmien parhaat puolet.

Menetelmät helposti huijattavissa

Tekstin luokittelu perustuu tyypillisesti melko yksinkertaisiin piirteisiin, kuten tiettyihin yksittäisiin sanoihin. Esimerkiksi valheentunnistuksessa menetelmät eivät oikeastaan tunnista valheita vaan juuri näitä yksinkertaisia piirteitä datassa. Monimutkaiset koneoppimismallit jäävät kiinni tällaisiin piirteisiin yhtä lailla kuin yksinkertaisemmat mallit. Tämä asettaa mallit alttiiksi hyökkäyksille; esimerkiksi vihapuheentunnistimet ovat helposti ihmisten huijattavissa, kun tekstistä poistetaan välilyöntejä tai tekstin sekaan lisätään esimerkiksi sana ’rakkaus’.

Gröndahlin mukaan annettu tehtävä ja harjoitusdata vaikuttavat siihen, miten hyvin tekoälyyn perustuva luokittelija onnistuu tehtävässään.

”Kun koneoppimismallit ovat massiivisia, on tärkeää, että luokittelija saa tarpeeksi harjoitusdataa. Se voi helposti jäädä kiinni myös ei-toivottuihin piirteisiin, jos harjoitusdata on vinoutunutta eli jollain tapaa epäedustavaa. Monimutkaiset koneoppimismallit eivät tiedä, milloin joku sana tai merkki kannattaa ottaa huomioon ja milloin ei vaan toimivat annetun harjoitusdatan perusteella”, Gröndahl sanoo.

Gröndahl tutki vihapuheen ja valheentunnistuksen lisäksi myös kieliteknologian mahdollisuuksia kirjoitustyylin automaattisessa muuttamisessa sekä automaattisessa tekstinmuokkauksessa. Tavoitteena voi olla esimerkiksi se, että kirjoittajaa ei pystytä tunnistamaan.

Esimerkiksi kirjoitustyylin automaattisessa muuttamisessa neuroverkko tuotti konekäännöksen tapaisen muunnoksen, jonka lopputuloksena saattoi olla saman tekstin toistaminen tai tekstisisällön merkityksen muuttuminen. Sääntöpohjaisissa menetelmissä pystytään kontrolloimaan yksityiskohtaisemmin esimerkiksi tietyn sanan, vaikkapa synonyymin tai vastakohdan, vaikutusta lauseen muunnokseen.

Avainsanat

aalto aalto-yliopisto HAIC kieliteknologia tietoturva yksityisyydensuoja

Yhteyshenkilöt

Tommi Gröndahl
Tohtorikoulutettava
Aalto-yliopisto
tommi.grondahl@aalto.fi
puh. 0400 426 523

Kuvat

Kognitiotieteisiin ja kielen tutkimukseen erikoistunut Tommi Gröndahl päätyi tekemään väitöskirjaa tietotekniikan professori N. Asokanin tutkimusryhmään avustettuaan ryhmää käyttäjätutkimuksessa. Tänään väittelevä Gröndahl viimeistelee myös toista väitöskirjaa kääntämisen kognitiotieteestä Helsingin yliopistolle. Kuva: Tommi Gröndahl.

Linkit

Tietoja julkaisijasta

Aalto-yliopisto
PL 18000
00076 AALTO

puh. 09 47001 / viestinta@aalto.fi https://www.aalto.fi/

Aalto-yliopistossa tiede ja taide kohtaavat tekniikan ja talouden. Rakennamme kestävää tulevaisuutta saavuttamalla läpimurtoja avainalueillamme ja niiden yhtymäkohdissa. Samalla innostamme tulevaisuuden muutoksentekijöitä ja luomme ratkaisuja maailman suuriin haasteisiin. Yliopistoyhteisöömme kuuluu 16 000 opiskelijaa ja 5 200 työntekijää, joista 446 on professoreita. Kampuksemme sijaitsee Espoon Otaniemessä.

aalto.fi

facebook.com/aaltouniversity

bsky.app/profile/aalto.fi

youtube.com/aaltouniversity

Tilaa tiedotteet sähköpostiisi

Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.

Lue lisää julkaisijalta Aalto-yliopisto

Unohda ruutuaika, kuormitus syntyy puhelimen toistuvasta räpläämisestä23.3.2026 11:15:12 EET | Tiedote

Tuore tutkimus paljastaa, että kuormitusta ei selitä pelkkä ruutuaika. Eniten kuormittaa pätkittäinen käyttö: jatkuva lyhyt vilkuilu ja viestittely pitkin päivää. Näistä rutiineista on myös vaikea päästä eroon.

Katalyysi uudessa valossa: mikrotason vuorovaikutukset voivat tehostaa puhtaan energian teknologioita13.3.2026 11:30:00 EET | Tiedote

Uusi tutkimus avaa tarkemman näkymän siihen, miten katalyytit toimivat kemiallisten reaktioiden aikana. Löydös voi auttaa kehittämään tehokkaampia materiaaleja esimerkiksi vihreän vedyn tuotantoon ja kestävämpään kemianteollisuuteen.

Aalto-yliopisto sai oman kvanttitietokoneen – AaltoQ20 kouluttaa tulevaisuuden kvanttiosaajat11.3.2026 12:01:00 EET | Tiedote

AaltoQ20 on maailmallakin harvinainen ja Suomessa täysin ainutlaatuinen huipputason kvanttitietokone, jolla paitsi koulutetaan tulevaisuuden osaajia, myös tutkitaan kvantti-ilmiöitä ja kehitetään uutta teknologiaa.

Aalto University unveils AaltoQ20 – a state-of-the-art quantum computer for educating quantum talent of the future11.3.2026 12:01:00 EET | Press release

AaltoQ20 is a unique quantum computer that researchers can also use to study quantum phenomena and develop new technology.

“Mesoskaalan” uimarit voivat avata tien kehon sisäisille lääkeroboteille3.3.2026 11:10:00 EET | Tiedote

Tutkijat ovat selvittäneet, miten pienet eliöt rikkovat fysiikan lakeja uidakseen nopeammin. Löytö voi auttaa esimerkiksi lääkkeitä annostelevien robottien kehittämisessä.

Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.

Tutustu uutishuoneeseemme