Osa 2. Kokemuksia Elements of AI- kurssista

Elements of AI tai Tekoälyn perusteet on Helsingin Yliopiston ja Reaktorin yhteishanke, joka saavutti tämän vuoden aikana hurjan suosion. Hankkeen ja kurssin ideana oli saada 1% suomalaisista opiskelemaan tekoälyn perusteita. Käsittelen kolmessa kirjoituksessa ajatuksiani aiheesta kurssin edessä. Voit lukea ensimmäisen osan (kattaen kurssit luvut 1&2) täältä

Luku 3. 

Edellisessä luvussa käsiteltiin aiheita joissa vaihtoehdot olivat rajalliset ja tiedetty. Nyt lähdetään haastavammalle alueelle eli tietämättömiin mahdollisuuksiin, sattumaan sekä tekoälyn huijaamiseen. 

Tekoäly suhtautuu epävarmuuteen eri tavalla kuin ihminen. Se ei ota paineita, mutta toisaalta sillä ei myöskään ole empatiakykyä. Tekoäly suhtautuu epävarmuuteen todennäköisyyksien kautta -> todennäköisimmät tapahtumat sisältävät vähemmän epävarmuutta. Luvussa haastetaan meitä ajattelemaan epävarmuutta elämässä todennäköisyyksien kautta, epävarmuus ei aina ole silkkaa sattumaa, vaan sitä pystyy myös tarkastelemaan rationaalisesti - vaikkei aukottomasti. Monet alat hyödyntävät sattuman muuttamista todennäköisyyksiksi - riskeiksi ja hyödyiksi; esimerkiksi pörssien tulevaisuudesta ei koskaan voi olla täysin varma, mutta laskemalla tiettyjä avainlukuja yrityksistä ja markkinoista saadaan todennäköisyyksiä riskeistä ja hyödyistä. Samaa teoriaa käytetään esim. uusia lääkkeitä kehittäessä. Aivan kaikista sivuvaikutuksista ei voida olla varmoja, koska kaikkia mahdollisia sivuvaikutuksia ei voida tutkia, mutta jos on tarpeeksi selkeää näyttöä tarpeeksi suuresta hyödystä, sattuman riski voidaan ottaa. 

Tässä luvussa ollaan liikuttu vahvasti minun epämukavuusalueella, eli numeroissa. Sille on syy, miksi kiinnostuin asiakkaista, käyttäytymisestä ja sisältömarkkinoinnista; en ole kovin taitava numeroiden kanssa tai edes kiinnostunut niistä. Opintomateriaaleissa sanotaan: "Please read the previous sentence a few times.” YEP, tätä ollaan tehty! Tässä tapauksessa kyseessä on todennäköisyyslaskenta ja nyt keskitytään laajasti käytettävissä olevaan Bayesin sääntöön. Itse kaava on yksinkertainen, kun sen ymmärtää mutta ymmärtäminen vaatiikiin tarkempaa tekstin syynäystä. 2/3 laskutoimituksesta meni kuitenkin oikein, joten jotain sentään ymmärsin! 

Luku 4.

Machine learning = extracting knowledge from data.

Koneopin juuret ovat datan tunnistamisessa ja sen sijoittamisessa oikeaan kategoriaan tai ryhmiin, kuten vaikkapa numeroiden ja kirjainten jakamisessa omiin ryhmiinsä tai vaikkapa elefantin tunnistamiseen 10 kissakuvan joukosta. Kehittyneemmissä tekniikoissa voidaan yrittää koneopin avustuksella esim. tunnistaa feikit twitter-profiilit tai arvioida vaikkapa verrokkikohteiden perusteella asuntosi keskimääräinen neliöhinta. 

Machine learningin ”ongelma” tai haaste on se, että usein kategoriat tai ominaisuudet päättää kuitenkin ihminen, tällöin kyseisen ihmisen omat ajatukset, stereotypiat ja tapa nähdä maailmaa vaikuttaa kategorioiden lopputulokseen. Esim. minun mielipiteeni siitä, mikä tekee asunnosta arvokkaan voi olla erilainen jonkun toisen mielipiteeseen. Tästä syystä meidän kategoriaehdot olisivat erilaiset ja data jakaantuisi eri tavoin. 

Seuraavassa osiossa materiaali käsittelee tekoälyavusteisia suosittelumekanismeja, joista arkipäivää meille ovat mm. Netflixin tai vaikkapa Spotifyn suosittelemat sisällöt meille sillä perusteella, mitä itse olemme kuluttaneet aikaisemmin ja myös mitä muut, meidän tavoin kuluttaneet ihmiset kuluttivat seuraavaksi. Ongelma on kuitenkin se, että suositukset usein johtavat entistä enemmän samantyyppiseen kulutukseen ja käyttäytymiseen, kuin saman median löytäminen itse. Tällöin omasta mediakulutuksesta tulee helposti ”kuplautunutta”. Samoin tavoin kuin jos seuraat Instagramissa vain bikinimalleja, voi ajan kuluessa käsityksesi "normaalista" vartalosta ja ”normaalista” elämästä muovaantua. 

Mitä tulee koneoppimiseen, lähes koskaan ei voida kuitenkaan todeta suoraa kausaalisuutta tai korrelaatiota, vain arvioita siitä mitä ehkä, jonkinmoisella todennäköisyydella tapahtuu seuraavaksi. Siksi arvioiden ja päätösten suhteen tulee noudattaa varovaisuutta. Esimerkiksi koneoppiin pohjautuen, voidaan jollain todennäköisyydella sanoa että tupakoimattomat, kasviksia syövät ihmiset elävät kauemmin kuin tupakoivat ja ei-kasviksia syövät, mutta aukoton teoria tämä ei kuitenkaan ole koska se ei ota huomioon esim. perintötekijöitä, onnettomuuksia ja silkkaa sairauksien sattumaa. Mitä koneoppimisella voidaan kuitenkin saavuttaa? Siihen perustuu esim. vakuutusyhtiöiden hinnat ja korvaukset. Entistä useammat arkipäiväisetkin yritykset hyödyntävät koneoppimista ja tekoälyä toiminnassaan.