Helsingin yliopisto

Kolmenkymmenentuhannen käyttäjän ja 38 miljoonan viestin avulla selvitettiin suomalaisten Twitter-käyttäjien kielivalintoja ja maantieteellistä sijaintia

Jaa

Helsingin yliopiston monitieteinen tutkimusryhmä tarkasteli suomalaisten Twitter-käyttäjien kielivalintoja sekä kielten ja käyttäjien jakautumista Suomen alueella.

Kuva: Tuomas Väisänen
Kuva: Tuomas Väisänen

Tutkimukseen kerättiin 38 miljoonaa Twitter-viestiä kolmeltakymmeneltätuhannelta käyttäjältä, joista kaksi miljoonaa sisälsi paikkatietoa. Lisäksi tutkijat tarkastelivat kielimaiseman monimuotoisuuden muutosta ajassa ja tilassa. Tutkimuksessa määritettiin myös käyttäjien kotipaikka kunta- ja maakuntatasolla heidän paikkatietohistoriansa perusteella. Käyttäjien kielet tunnistettiin automaattisen kielentunnistuksen avulla. 

Valtakielet ovat suomi ja englanti 

–Kuten arvata saattaa, Twitterin valtakielet Suomessa ovat suomi ja englanti, apulaisprofessori Tuomo Hiippala kertoo.

 –Maaseudulla käytetään keskivertoa enemmän suomea ja keskivertoa vähemmän englantia. Muutoin suomi ja englanti jakautuvat melko tasaisesti. 

 Hiippalan mukaan Twitter-viestit sisältävät kuitenkin harvemmin paikkatietoa kuin esimerkiksi Instagram-julkaisut. Tutkijoiden havainnot vastaavat pitkälti Suomen kielellisiä realiteetteja ja se kertoo siitä, että kotipaikan- ja kielen tunnistukseen käytetyt algoritmit ovat melko luotettavia. 

 –On kuitenkin tärkeää pitää mielessä, ettei Twitterin käyttäjäkunta edusta koko väestöä, Hiippala muistuttaa. –Seuraava luonnollinen askel on tarkastella yksittäisten kielten käyttöä ja niiden sisäistä vaihtelua. Esimerkiksi suomen kielen murteiden esiintyminen Twitterissä olisi mielenkiintoinen tutkimuskohde. 

 Väitöskirjatutkija Tuomas Väisäsen mukaan kielten alueellisessa jakaumassa korostuu historiallinen ja maantieteellinen ulottuvuus: ruotsia käytetään keskimääräistä enemmän rannikon ruotsinkielisillä alueilla, kun taas venäjää esiintyy enemmän itärajan tuntumassa. Viron osalta havainnot keskittyvät Etelä-Suomeen. 

 –Ajallisesta ja maantieteellisestä näkökulmasta Twitterin digitaalinen kielimaisema havainnollistaa kuinka digitaalinen ja fyysinen maailma kytkeytyvät toisiinsa koko Suomessa paikasta riippumatta, Väisänen toteaa. 

 Kielentutkimukselle voi olla hyötyä maantieteellisestä näkökulmasta

 Valtaosa suomalaisista Twitter-käyttäjistä käyttää alustalla kuitenkin useampaa kuin yhtä kieltä, mutta kielten suhteelliset osuudet eivät jakaudu tasaisesti. Vain 18 % käyttäjistä käyttää vain yhtä kieltä. 

 –Tutkimus osoittaa, että kielentutkimus voi hyötyä maantieteellisestä näkökulmasta, sanoo akatemiatutkija Olle Järv

 –Ajallinen tarkastelu puolestaan täydentää tätä maantieteellistä kuvaa osoittamalla kuinka kielellinen monimuotoisuus vaihtelee päivä-, viikko- ja vuosirytmin tahdissa. Twitter-viestit ja muut massadatan lähteet avaavat uusia mahdollisuuksia kielentutkimukselle. 

 Yhtä kieltä suosivat käyttäjät paikantuvat keskimääräistä useammin maaseudulle, kun taas useampaa kieltä aktiivisesti käyttävät sijoittuvat rannikolle ja pääkaupunkiseudulle. Rikkaimmillaan kielimaisema on rannikon ruotsinkielisillä alueilla sekä Uudellamaalla. Toisaalta myös kielellisesti köyhimmällä alueella Pohjois-Karjalassa esiintyy 19 kieltä. 

 Tutkimus toteutettiin osana pääkaupunkiseudun kielimaisemaa kartoittavaa hanketta, jonka vastuullisena tutkijana toimii Tuomo Hiippala, Helsingin yliopiston humanistisesta tiedekunnasta.Hanketta rahoittaa Emil Aaltosen Säätiö. 

Tutkimusartikkelin muut kirjoittajat ovat Tuomas Väisänen, Tuuli Toivonen ja Olle Järv matemaattis-luonnontieteellisestä tiedekunnasta.  Englanninkielinen tutkimusartikkeli Mapping the languages of Twitter in Finland: richness and diversity in space and time 

Lisätietoja:  

apulaisprofessori Tuomo Hiippala, 050 377 3366, tuomo.hiippala@helsinki.fi, @tuomo_h  

Yhteyshenkilöt

Anna Maria Peltonen, tiedeviestinnän asiantuntija, Helsingin yliopisto, 050 406 2047, maria.peltonen@helsinki.fi

Kuvat

Kuva: Tuomas Väisänen
Kuva: Tuomas Väisänen
Lataa

Tietoja julkaisijasta

Helsingin yliopisto
Helsingin yliopisto
PL 3
00014 Helsingin yliopisto

02941 911 (vaihde)http://www.helsinki.fi/yliopisto

Helsingin yliopisto on yli 40 000 opiskelijan ja työntekijän kansainvälinen tiedeyhteisö, joka toimii neljällä kampuksella Helsingissä ja usealla muulla paikkakunnalla Suomessa. Se on toistuvasti maailman sadan parhaan yliopiston joukossa. Helsingin yliopisto on perustettu vuonna 1640.

Tilaa tiedotteet sähköpostiisi

Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat mediatiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.

Lue lisää julkaisijalta Helsingin yliopisto

Tutkijat selvittivät, kuinka rintasyöpä leviää – syöpägeeni käyttää apunaan proteiinia, joka toimii kuin sorkkarauta19.1.2021 09:30:00 EETTiedote

Helsingin yliopiston tutkijat ovat selvittäneet, kuinka syöpägeenit tuhoavat tyvikalvokapselin, joka estää kasvainsolujen tunkeutumisen terveisiin kudoksiin. Tutkimus osoitti, että syövissä yleinen soluviestintäreitti hyödyntää hepsiini-nimistä entsyymiä hajottaessaan tyvikalvon. Tyvikalvon hajoaminen voidaan kuitenkin pysäyttää hepsiinin toimintaa estävillä vasta-aineilla.

Yli 10 miljoonan euron EU-hanke valjastaa tekoälyn ja genomitiedon sairauksien ennaltaehkäisyyn18.1.2021 13:07:35 EETTiedote

Helsingin yliopiston koordinoimassa viisivuotisessa EU-hankkeessa pyritään kehittämään ja hyödyntämään uudenlaisia genomitietoon perustuvia sairastumisriskin arviointiin soveltuvia työkaluja. INTERVENE-hankkeen tavoitteena on osoittaa tekoälyn hyödyntämisen edut genomitietoon perustuvia sairastumisriskiarvioita laadittaessa sekä testata riskitiedon hyödyntämistä käytännön potilastyössä.

Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.

Tutustu uutishuoneeseemme