Ylen vaalikoneen arvokysymysten taustat ja valinta

Huom: Ensimmäinen julkaisu 27.2., mutta Ylen jutut erityisesti vaalikoneen arvo-osiosta tulevat julki vasta myöhemmin.

Kuten vuoden 2017 kuntavaalien yhteydessä, tein yhteistyötä Ylen kanssa arvokysymysten luomiseksi. Tällä kertaa itse kehitysprosessissa mukana oli myös pitkäaikainen kollegani Simo Järvelä, joka on ollut vahvasti vaikuttamassa koko alkuperäiseen moraalivaalikone-ideaan ja sen toteutukseen jo vuonna 2015 ja sen jälkeen Yle-yhteistyöhön 2017. Olin näin jälkikäteen katsottuna pari vuotta sitten kuitenkin melko epäselvä prosessista joka johti lopulta valittuihin kysymyksiin, joten avaan sitä tässä enemmän. Haluan samalla kiittää Ylen vaalikonetoimitusta ja erityisesti sisältöpäällikkö Ville Seuria, joka jaksoi ymmärtää täysin eri lähtökohdista tulevaa tutkimuksellista lähtökohtaa ja osallistui aktiivisesti kehitysprosessiin tuoden esiin hyödyllisiä näkökulmia joita itse en välttämättä olisi tullut ajatelleeksi.

Käsittelen jokaisen kysymyksen tarkempaa taustaa tarkemmin erillisessä blogauksessa, jossa käyn läpi myös sitä missä määrin kysymykset ovat muunnelmia yksittäisistä alkuperäisistä kysymyksistä ja missä määrin ne ovat laajempia abstrahointeja.

Varoitus: pitkä teksti, lyhennelmät välittömästi alaotsikoiden jälkeen kursiivilla.

Psykologiset piirteet politiikan taustalla

Lyhyesti: tavalliset aihekysymykset kertovat vastauksen vain siihen, mitä kysytään. Arvokysymyksillä haetaan syvempiä taipumuksia, joiden avulla voidaan tehdä todennäköisestä käyttäytymisestä laajempia päätelmiä.

“Arvokysymyksiksi” on tässä kutsuttu kysymyksiä, jotka perustuvat moraali- ja politiikan psykologian tietämykseen siitä, millaiset psykologiset tekijät vaikuttavat poliittisiin asenteisiin ja/tai käyttäytymiseen. Koko lähtökohta on siis erilainen verrattuna tavanomaisiin vaalikonekysymyksiin, joissa journalistit pyrkivät etsimään sopivasti jakavat kysymykset julkisuudessa käsitellyistä poliittisista aiheista. Pyrkimyksenä on päästä syvemmälle, psykologisiin piirteisiin jotka tutkimusten perusteella vaikuttavat siihen kuinka tietynlaiset ihmiset ovat tavanneet käyttäytyä. Molemmat päättämisperusteet ovat tärkeitä, ja ne täydentävät toisiaan. Keskittyessään muutamiin keskiarvoihin testitulokset saattavat jättää huomiotta sellaisia henkilökohtaisia seikkoja jotka juuri sinulle valitsijana ovat tärkeitä.

Piirteet ovat kaikilla ihmisillä toimivia ajatteluun ja käyttäytymiseen liittyviä melko pysyviä taipumuksia. Tutuimpia ovat persoonallisuuspiirteet, joilla tavallisesti tarkoitetaan tunnollisuuden ja ulospäinsuuntautuneisuuden kaltaisia jokapäiväiseen elämään liittyviä ominaisuuksia, mutta psykologisia piirteitä on muitakin, ja osa niistä liittyy suoraan politiikkaan. Keskeistä on, että vaikka piirteiden rakenne on samanlainen kaikilla ihmisillä, ne painottuvat eri ihmisillä eri tavalla. Kaikilla ihmisillä on se psykologinen mekanismi joka ilmenee tietynlaisena “tunnolliseksi” tulkittavana käytöksenä, mutta joillain se on vahvempi – eli jotkut ovat tunnollisempia kuin toiset.

Piirteiden vaikutus perustuu tunnejärjestelmään, joka on mielen toimeenpanokeskus – tunnejärjestelmä on se, joka ihmisen saa liikkeelle, toteuttamaan jotain tiettyä lukuisista mahdollisista tavoista käyttäytyä. Piirteet toimivat saamalla asiat tuntumaan tärkeiltä tai vääriltä, mikä synnyttää motivaation tehdä asialle jotakin. Ne myös laukaisevat voimakkaita tunnereaktioita jos niiden toimintaa estetään tai edistetään. Siten korkean tunnollisuuden ihminen voi kokea vaikkapa suurta suuttumusta kun kokee matalan tunnollisuuden ihmisen suhtautuvan liian kevyesti tärkeiksi näkemiinsä velvollisuuksiin. Sama pätee politiikkaan liittyviin piirteisiin: mm. moraaliin liittyy erilaisia piirteitä sen mukaan mitä kukakin pitää oikeana ja vääränä, ja esimerkiksi lojaalisuutta vahvasti moraalisena pitävä ihminen voi kokea vääränä uutisissa kuvatun tilanteen jossa päättäjät ovat asettaneet vaikkapa pakolaisten auttamisen suomalaisten edun edelle, ja suuttuu siitä. Joku toinen jolle lojaalisuus on selvästi vähemmän tärkeää kuin kaikista yhtäläisesti välittäminen, näkee taas auttamisen moraalisempana ja suuttuu siitä että joku haluaa olla auttamatta. Tämä suuttumus vaikuttaa käyttäytymiseen – sekä siihen miten ehdokas vastaa vaalikoneeseen, että siihen miten hän toimii ollessaan poliitikkona päättävässä asemassa.

Vaalikoneen arvokysymyksillä pyritään siis tavoittamaan näitä piirteitä. Koska piirteet vaikuttavat ihmisen käyttäytymiseen laaja-alaisesti mutta ennustettavasti, suuret erot puolueiden psykologisten piirteiden painottumisessa kertovat käyttäytymisestä laajemmin kuin yksittäiset, piirteisiin perustumattomat asiakysymykset. Siinä missä esim. kysymys “Asevelvollisuuden pitäisi koskea koko ikäluokkaa, ei vain miehiä” on selvä ja tarkka ja antaa informaatiota juuri tästä asiasta, se kysyy vain tasan tätä yhtä asiaa, se ei kerro perusteita miksi ihminen vastaa tietyllä tavalla, eikä anna juurikaan informaatiota siitä miten henkilö tai puolue todennäköisesti vastaa muihin vaalikoneen kysymyksiin[1] – puhumattakaan miten hän päättäisi muista politiikassa päätettäväksi tulevista aiheista joista vaalikoneessa ei kysytty. Hyvä piirrekysymys sen sijaan antaa juuri tällaista laajempaa tietoa: jos tiedämme vaikkapa puolueen keskimääräisen suhtautumisen kaikista välittämiseen ja lojaalisuuteen, osaamme ennustaa puolueen todennäköisen suhtautumisen poliittisiin kysymyksiin jotka perustuvat näihin moraalikysymyksiin.

Huomattavaa on, että sekä piirteiden luonne itsessään että niihin liittyvien kysymysten rajoitukset (ks. alla) EIVÄT MAHDOLLISTA johtopäätösten tekemistä yksittäisistä vastaajista. Tarkoituksena on, että vaalikoneen avulla äänestäjä pystyy PUOLUETASOLLA (tai jonkun muun suuremman ryhmän tasolla) vertailemaan KESKIMÄÄRÄISIÄ, TODENNÄKÖISIÄ piirteisiin liittyviä taipumuksia. Lisäksi on huomautettava, että tämä ei ole millään tavalla kliinistä psykologiaa, joka on täysin eri psykologian laji. Mikään käytetyistä mittareista ei ole sellainen joka liittyisi mielisairauksiin, vaan ne kuvaavat täysin normaalien käyttäytymistaipumusten vaihtelua.

Valinta- ja kehitysprosessi

Lyhyesti: vaalikoneen lyhyys ja muoto asettaa kysymysten valinnalle ja muotoilulle vaikeita ja ristiriitaisia vaatimuksia, ja lopputulos ei voi olla muuta kuin kompromissi näiden vaatimusten välillä.

Periaatteellisella tasolla siis voisimme laittaa kaikki ehdokkaat psykologisiin testeihin, joiden perusteella meillä äänestäjillä olisi paljon tietoa siitä millaisia ihmisiä he ovat ja millaisia päätöksiä tulevat (todennäköisesti, keskiarvoistettuna ryhmiin kuten puolueisiin) tekemään. Tällainen testaaminen ei ole kuitenkaan käytännössä mahdollista, eikä tällaisten tulosten julkistaminen olisi eettistäkään. Joudumme tyytymään siihen, mitä he vastaavat kysymyksiin vapaaehtoisesti julkisissa vaalikoneissa, ja vaalikoneet toimivat hyvin erilaisella logiikalla kuin psykologiset testit.

Vaalikoneiden on oltava helposti käytettäviä ja ymmärrettäviä, ja lyhyitä. Esimerkiksi Ylen n. 5000 vastaajan testiaineistossa kysymyksen järjestysnumeron vaikutus vastaajakatoon oli 0.05 %-yksikköä, eli kymmenenteen kysymykseen oli vastannut puoli prosenttia vähemmän, ja 30. kysymykseen puolitoista prosenttia vähemmän vastaajia kuin ensimmäiseen. Toimituksen mukaan noin 30 kysymyksen jälkeen vastaajien määrä alkaa pudota vielä enemmän, joten tuo lukumäärä kysymyksiä on se mihin vaalikoneen tekijät pyrkivät. Tavallisessa psykologisessa testissä sen sijaan on kymmeniä, jopa satoja kysymyksiä pelkästään yksittäisen piirrekokonaisuuden (teorian) tutkimiseen. Ja koska yhtä “politiikan piirteiden psykologista testiä” ei ole olemassa, lisäksi joudun yhteen piirrekokonaisuuteen keskittymisen sijaan huomioimaan useita erilaisia teorioita, piirteitä ja mittareita. Vuonna 2017 vaalikoneessa oli kuusi arvokysymystä; nyt lähdimme noin kymmenestä, päädyimme seitsemään, ja niitä on ilmeisesti vielä karsittu sen jälkeen kun sanoin itse viimeisen mielipiteeni asiaan. Ei liene vaikea nähdä kuinka tämä on melko haastava yhtälö.

Ensin valitsimme Simon kanssa joukon teorioita ja mittareita, jotka a) olivat empiirisen tutkimuksen kannalta merkittäviä poliittisen käyttäytymisen ennustajia, b) ovat periaatteessa mitattavissa yksinkertaisella itseraportointikysymyksellä, c) ovat kiinnostavia nimenomaan Suomen eduskuntavaalien kannalta, ja d) tunnemme itse sen verran hyvin että ymmärrämme miten ne toimivat ja mikä niissä on keskeistä. Käsittelimme näitä eri vaihtoehtoja vaalikonetoimituksen kanssa, ja teimme keskustelun perusteella fokusointia.

Tämän jälkeen meillä oli joukko kyselymittareita, kukin kooltaan yli kymmenestä yli kolmeenkymmeneen, joista piti tiivistää n. kymmenen yksittäistä kysymystä jotka kattaisivat nämä piirteet. Alkuperäiset kyselymittarit eivät toki ole huvikseen pitkiä – niiden kehittämisessä on jo tehty punnintaa siitä, mikä on minimimäärä kysymyksiä joilla haluttu teoreettinen konstrukti pystytään arvioimaan riittävän luotettavasti. Käytännössä siis kun mittaria lyhennetään radikaalisti, tuosta alkuperäiseen mittariin liitetystä luotettavuudesta on tingittävä lyhyyden saavuttamiseksi. Luotettavuuden “riittävyys” riippuu kuitenkin mittarin tarkoituksista: varsinaisissa psykologisissa mittareissa tarkoitus on paljon vahvemmin rajata sitä, että mittari osuu juuri oikeaan piirteeseen, ja se sisältää mahdollisimman vähän muita vaikutuksia (virhelähteitä). Vaalikoneenkin tarkoitus on toki sisältää mahdollisimman vähän virhelähteitä, mutta rima voi olla paljon matalammalla – informatiivisuutta ei arvioida tieteellisin kriteerein, vaan sen perusteella, jakaako kysymys puolueita tavoilla jotka voisivat kiinnostaa äänestäjiä tai olla heille hyödyllisiä.

Kysymysten määrällä on kuitenkin myös merkittävä vaikutus siihen, kuinka tiivistämisen radikaalisti lyhemmäksi voi käytännössä toteuttaa. Tyypillinen mittarin lyhennystapa on nimittäin valita ne yksittäiset kysymykset, jotka yhdessä ovat tutkitusti edelleen kyllin luotettavia, mutta tämä tapa on meidän tarkoitukseemme hyvin ongelmallinen.

Yleisesti on tunnettua että hyvän kyselykysymyksen periaate on karkeasti se, että kysymys on konkreettinen ja selkeä, ja tavoiteltujen vastaajien joukossa mahdollisimman moni sen lukeva ymmärtää sen samalla tavoin. Jos näin ei ole, henkilö X vastaa kysymykseen tavalla A ja henkilö Y tavalla B, jolloin heidän vastauksensa eivät ole toisiinsa nähden verrattavissa. Toinen periaate on, että kysymys kysyy vain yhtä asiaa. Jos näin ei ole, vaan kysymyksessä on esim. useita osia (“väite C ja väite D”, tai “koska väite C, niin väite D”), ei ole selvää mihin näistä osista vastaus kohdistuu (onko samaa/eri mieltä C:stä vai D:stä vai molemmista?), ja vastausten vertailtavuus on taas kyseenalainen. Vaalikoneen tavoiteltujen vastaajien joukko on koko äänestysoikeutettujen joukko Suomessa juuri täyttäneestä 18-vuotiaasta vanhimpaan mummoon, ja kysymysten on sovelluttava heille kaikille. Tämän huomaa siinä, että vaalikoneen asiakysymykset pyrkivät olemaan erittäin konkreettisia, selkeitä ja yksiselitteisiä.

Psykologisissa kyselyissä, kuten meilläkin lähtökohtana olevissa kyselymittareissa, pyritään kuitenkin tavoittamaan sellaisia ilmiöitä, joille ei ole olemassa suoraa, yksittäistä, selkeää kysymystä. “Oletko tunnollinen?” on huono persoonallisuuspiirrekysymys, koska “tunnollinen” tarkoittaa eri ihmisille eri asiaa. Siksi kyselyissä pyritään toteuttamaan näitä hyvien kysymysten periaatteita usein kysymällä paljon selkeitä konkreettisia kysymyksiä joiden tiedetään liittyvän tavoiteltuun piirteeseen – esimerkiksi tunnollisuuteen liittyen “jätän tavaroita minne sattuu” ja “pysyn aikataulussa” (vaikkapa asteikolla aina, usein, jne.) – jolloin näiden konkreettisten kysymysten vastausten kokonaisuudesta voidaan tehdä johtopäätöksiä niiden takana piilevästä piirteestä. Voi olla että hyvin tunnollinen ihminen sattuu satunnaisista syistä vastaamaan yksittäiseen kysymykseen eri tavoin (siinä on satunnaista virhelähdettä melko paljon), mutta kun kysymyksiä on tarpeeksi, voidaan luotettavasti sanoa millainen useimpiin näistä keskimäärin tietyllä tavalla vastannut ihminen on tämän piirteen suhteen (satunnaiset virhelähteet suodattuvat melko vähäisiksi).

Kyselyiden lyhentämisessä tyypillinen lähtökohta on siis valita näistä konkreettisista kysymyksistä se joukko, jotka yhdessä ovat riittävän luotettavia. Jos kysymyksiä on 30, mittari on luotettava, mutta 20:llakin pärjää. Vaalikoneeseen soveltaessamme tarkoituksena on, että kokonaisia piirteitä on tiivistettävä yksittäisiin kysymyksiin. Tällöin ei voida käyttää yksittäistä konkreettista kysymystä, koska luotettavuutta ei voida lisätä sillä että muut samaan piirteeseen liittyvät kysymykset auttavat satunnaisten virhelähteiden suodattamisessa.

Vaihtoehto on käyttää kysymystä, jossa jollain tavalla tiivistyy piirteen syvin olemus. Tällöin kuitenkin päädytään väkisin hyvin abstrakteihin tai muutoin epäselviin kysymyksiin, joita yleensä pyritään välttämään. Valintamme oli siis

  • käyttää konkreettisia ja selkeitä kysymyksiä, joiden ei ole alunperin tarkoituskaan yksin tavoittaa piirrettä sinänsä vaan ainoastaan sen jotain ilmenemismuotoa, ja hyväksyä sekä sen heikko yhteys piirteeseen että mahdollisesti suuri satunnainen virhelähde, tai
  • käyttää abstraktia muotoilua, joissa pyritään tavoittamaan piirre sinänsä, ja hyväksytään virhelähde siitä, että eri ihmiset saattavat ymmärtää sen eri tavoin, mikä huonontaa vastausten vertailtavuutta.

Arvokysymyksissä on muutama joissa on päädytty enemmän edeltävään vaihtoehtoon, kun niistä on löytynyt sellainen ilmenemismuoto joka on relevantti vaalikoneen tarkoitukseen: ehdokkaiden jaotteluun. Mutta suurimpaan osaan tällaista ilmenemismuotoa ei ole, tai se on mahdotonta ilmaista lyhyesti. Onneksi abstraktin muotoilun ongelmaa voidaan kuitenkin pienentää kohdistamalla muotoilua tunnereaktioon. Koska politiikkaan liittyvät piirteet toimivat erityisen vahvasti tunnejärjestelmän pohjalta – esim. verrattuna tunnollisuuteen tai muihin persoonallisuuspiirteisiin, ihmiset suuttuvat paljon useammin poliittisista aiheista – näihin kysymyksiin ei vastata niinkään miettimällä tietoisesti omaa aikaisempaa käytöstä (kuten yllä esitettyihin konkreettisiin tunnollisuuskysymyksiin), vaan useimmilla ihmisillä syntyy niihin välitön tunnereaktio. Vaikka vastaaja ei olisi varma siitä mihin kysymyksen jokin sana tai ilmaisu tarkalleen ottaen viittaa, hänelle useimmiten syntyy jokin käsitys, “fiilis”, sen yleisestä suunnasta ja tunnepohjainen suhtautuminen siihen. Vastauksen voi antaa tämän fiiliksen pohjalta, koska jos ihmisten fiilis perustuu samaan tunnemekanismiin, kysymyksen vastaukset ovat vertailtavissa tämän fiiliksen pohjalta vaikka yksittäiset sanat tai ilmaisut olisivat epämääräisiäkin.

Tämä voi tuntua vastaajien “huijaamiselta”, mutta siitä ei ole kyse: jokainen kysymys liittyy siihen asiaan mihin vastaaja kuvittelikin sen liittyvän. Kysymys myös pohjautuu piirteeseen liittyvään (oletettuun) psykologiseen mekanismiin joka on relevantti sekä ehdokkaiden että äänestäjien kannalta. Valitut piirteet ovat sellaisia, että ne kuvaavat moraaliin ja maailmankuvaan liittyviä eroja jotka ovat väestössä yleisiä ja legitiimejä. Kenen tahansa ehdokkaan kannattaa vastata vaikkapa vapauden moraaliperustaan pohjautuvan kysymyksen herättämän tunteen mukaisesti, koska myös äänestäjät jotka kokevat vapauden moraalisesti tärkeäksi (tai selvästi vähemmän tärkeäksi!) tunnistavat kysymyksen ja osaavat siten löytää ne ehdokkaat jotka tätä asiaa ajavat.

Tietenkin lisäksi osalle ihmisistä kysymys ei eri syistä satu osumaan siihen piirteeseen mihin sen oli tarkoitus osua. Vastaajalle ei synny intuitiota mitä kysymyksellä haetaan eikä fiilistä (hänelle) oikeasta vastauksesta. Vastaaja valitsee jonkun vaihtoehdon, joka hänen tapauksessaan on lähinnä melua suhteessa oletettuun piirteeseen liittyvään signaaliin, tai hän ohittaa kysymyksen. Tämä ei kuitenkaan juurikaan eroa tavallisista aihekysymyksistä: niitäkin tulkitaan usein siltä pohjalta mitä niissä ajatellaan haettavan, ja joskus selkeäkin aihekysymys tuntuu siltä, että siihen voisi löytää perusteet vastata kummalla tahansa tavalla, jolloin se ei täytä tarkoitustaan mielipiteidein jakajana joidenkin vastaajien kohdalla.

Ylläkuvatuista syistä kysymykset eivät voi (enimmäkseen) olla tavanomaiseen tapaan suoraan alkuperäisten kyselymittarien parhaista kysymyksistä valittuja, vaan niissä on siis myös käytetty vaihtoehtoista “tiivistetään piirteen teoreettisesti keskeinen psykologinen tunnemekanismi” -muodostusmenetelmää, jossa luotetaan vastaajien tunnejärjestelmään jonka pohjalta vastauksen voi antaa. Se on ärsyttävää, ja ymmärrän monien turhautumisen kysymyksiin jotka poikkeavat tyyliltään niin vahvasti tavallisista asiakysymyksistä, mutta väitän, että useimmilla heistäkin on yleensä intuitiivinen käsitys siitä mitä kysymyksellä haetaan, ja mikä olisi siten heidän kannaltaan “oikea” vastaus. Voin vain esittää anteeksipyyntöni siitä että valitsimme tämän keinon, koska arviomme mukaan se oli pienin paha riittävän luotettavuuden saavuttamiseksi.

Luonnollisesti kysymykset voisivat olla esitetyistä ristiriitaisista vaatimuksista huolimattakin varmasti parempia kuin mitä niistä lopulta tuli. Tieteessä kysymysten muotoilussa tehdään erikseen validointitutkimusta, eli selvitetään toimivatko kysymykset tosiasiassa sillä tavalla kuin niiden oletetaan toimivan, mm. suhteessa toisiin kyselyihin joiden toiminta tunnetaan entuudestaan. Huolimatta siitä että olen tehnyt vuoden 2015 jälkeen lukuisia apurahahakemuksia – siihen tarkoitukseen, että voisin rakentaa kysymykset alusta asti huolella, tehdä asianmukaiset validointitutkimukset, ja selvittää soveltuvuutta koko Suomen äänestysoikeutettujen joukkoon – rahoitusonni ei ole ollut suosiollista eikä minulla (eikä Simolla) ole nytkään ollut työhön erillistä rahoitusta [2]. Olemme siis tehneet kehitystyötä omalla ajalla ehtiessämme [3]. Ylen vaalikonetoimitus on ollut kiitettävän joustava yhteistyön aikana, mutta tietysti heidän työssään on olleet omat aikataulupaineensa, eikä kehitystyötä olla pystytty tekemään niin huolellisesti kuin olisimme varmasti kaikki toivoneet. Testiaineiston perusteella valitut kysymykset kuitenkin toimivat ainakin vastaajien jakamisessa, ja niiden lopullinen hyödyllisyys vaalikoneen osana nähdään sitten kun ehdokkaat ovat niihin vastanneet.

 


Huomautukset

[1] Monissa tapauksissa toki tavallisilla asiakysymyksilläkin on yhteys muihin kysymyksiin. Kuka tahansa Suomen politiikkaa vähänkään seuraava hahmottaa, että vastaus kysymykseen “Uusien bensa- ja dieselautojen myynti on kiellettävä viimeistään vuonna 2030” on luultavasti melko samankaltainen kuin kysymykseen “Metsähakkuita Suomessa tulee rajoittaa ilmastonmuutoksen hillitsemiseksi”, koska näiden nähdään molempien kuvastavan jotain politiikassa selvänä kulkevaa jakolinjaa, tässä vihreyttä tai suhtautumista ympäristöasioihin ja ilmastonmuutostaisteluun. Monissa muissa tapauksissa tällaista suoraa yhteyttä ei kuitenkaan ole. Piirteillä on lisäksi kaksi etua suhteessa tällaisiin yhteyksiin: (1) ne ulottuvat tunnettujen jakolinjojen ulkopuolelle, ja (2) piirteiden yhteys käyttäytymiseen on kausaalista, ei pelkästään korrelatiivista. Piirteet (tietyt, eivät mitkä tahansa) aiheuttavat käyttäytymistä, ne eivät pelkästään kuvaa observoitavissa olevia havaittavia yhteyksiä (mutta tämä on teoreettinen kiista tieteen keskuudessakin, eivätkä kaikki allekirjoita väitettä).

[2] Hei säätiöt! Mites ois ennen 2021 kuntavaaleja?

[3] Nk. “tee ite ilmaseks parempi” -puolustus.

No, seriously. Jos osaat, teen mielelläni yhteistyötä ensi kerralla.