– Tekoäly on tosi iso konsepti, joka tullut aika uutena hittinimenä vastikään pinnalle. Se on aina ihmisen luoma ja sillä on aina jokin tarkoitus. Sillä halutaan useimmiten optimoida. Se on hyvin samantyylistä kuin automaatio, mutta siinä on vähän enemmän älyä mukana, aloitti luentonsa paimiolaislähtöinen data- ja operaatiospesialisti Teppo Lindberg Iskun talolla Paimiossa viime torstaina.
Lindberg työskentelee turkulaisessa tekoälykonsulttitalossa Silo AI Oy:ssä. Hän kysyi Aikuisten Olohuoneen yleisölle pitämänsä luennon alussa kuulijoiden tietämystä tietotekniikasta ja tekoälystä. Kuulijat tiesivät, miten tietokoneet toimivat, mutta tekoäly oli heille vierasta.
– Tekoäly on mikä tahansa laite, joka havaitsee ympäristöään. Laitteessa voi esimerkiksi olla antureita. Tai ihan peruskamera voi tulkita sen, mitä se on luotu tulkitsemaan. Se havaitsee ja tekee toimenpiteitä sen mukaan, mitä se näkee, että se saavuttaa jonkin mahdollisimman hyvän lopputuloksen.
Tekoäly on dataan pohjautuvien optimoitujen mallien rakentamista. Malleilla pyritään Lindbergin mukaan saavuttamaan tarkin ja oikeellisin haluttu lopputulos. Se keskittyy johonkin koneeseen tai sitten se voi olla jonkin sorttinen sovellus.
– Algoritmien mukaan tekoäly pystyy oppimaan itsenäisesti siitä datasta, mitä se voi vastaanottaa. Mutta se voi tarvita ihmisen tukea, Lindberg selvitti.
Käytännössä data voi olla mitä vain. Se voi olla kuvia, tekstiä, ääntä. Mutta lähtökohtaisesti kaikki tapahtuu tietokoneen sisällä. Toki, jos siinä on anturi, joka näkee esimerkiksi kameran kautta jotain, se kuva on oikeasta maailmasta. Käytännössä tekoäly on aina ihmisen luoma.
Konenäkö huomaa virheet
Tekoälyn yhteydessä puhutaan myös koneoppimisesta.
– Koneoppimisen mallin kehittäminen vaatii yleensä tuhansia lähtödatapisteitä. Se tarkoittaa esimerkiksi paria tuhatta kuvaa, joissa on määritelty kissa ja koira, että saadaan niiden eroavaisuus. Koneoppimisen malleja voi jakaa, että on esimerkiksi konenäköä tai luonnollisen tiedon käsittelyä eli NLP:tä.
Lindberg kertoi, että konenäkö on useimmiten kiinni sensoreissa. Esimerkiksi paperirullia tuottavan tehtaan tuotantolinjastolla voi olla kamera. Jos siellä paperiin tulee yhtäkkiä virheellinen jälki, tekoäly tunnistaa sen saman tien ja pysäyttää koneen. Ihmistä ei tarvita painamassa stop-nappulaa, vaan kone toimii tunnistettuaan vian.
– Jos mennään koneoppimisen vielä vähän syvemmälle tasolle, se on syväoppimista, deep learning. Niissä useimmiten vaaditaan jopa miljoona lähtödatapistettä. Näin pystytään rakentamaan digitaalisia neuroverkkoja, joiden avulla voidaan ratkaista monitasoisiakin ongelmia.
– Esimerkiksi ääniraidasta pystyy tunnistamaan linnun ja piirtämään, mikä lintu se on. Tieto menee useammalle eri tasolle, vähän samoin kuin ihmisen aivot toimivat. Tässä voi olla konenäköön ja NLP:hen liittyviä ominaisuuksia. Tästä esimerkkejä ovat tekstistä kuviksi generoivat mallit, kuten DALL-E, Lindberg luettelee.
Prosessissa harjoittelu, määrittely ja testi
Miten mallien rakennus sitten tapahtuu? Teppo Lindberg selvitti, että pelkistetyssä kuvaajassa prosessi lähtee siitä, että on jotain dataa. Se voi olla kuvaa, tekstiä tai jopa ääntä. Dataa halutaan ensiksi käsitellä, annotoida. Eli määritellä sellaisia kohtia, jotka kiinnostavat mallissa, jotka halutaan tehdä. Esimerkiksi meillä voi olla paljon kuvia ja niistä annotoidaan eli merkitään, missä on kissa ja missä on koira.
Sitten tämä data jaetaan harjoittelusetteihin, määrittelysetteihin ja testisettiin. Harjoittelusettiä käytetään mallin opettamiseen. Siinä sitä korjaillaan. Sen jälkeen tarkistetaan, osaako se erotella koirat kissoista.
– Joka tapauksessa käytetään määrittelysettiä ja parannetaan lopputulosta eli sitä, miten malli toimii. Sitten meillä on malli, jonka jälkeen käytetään testisettiä, että saadaan vielä varmistettua, että mallit toimii, kuten pitää. Tätä mallia voidaan käyttää niin, että muutkin pääsevät tunnistamaan kissat koirista. Ja malli menee julkiseen jakeluun.
Kielen käsittelyssä on mihin tahansa ihmisen kieleen pohjautuvia malleja. Siinä voi olla suomen, englannin, ruotsin tai minkä tahansa kielen sanoja käytettynä. Esimerkkinä chatGPT, joka on yksi työkalu. Se löytyy internetistä. Ja voi olla tekoälyavusteisia chattibotteja. Chattibotti on tietokoneohjelma, joka on suunniteltu käymään keskustelua ihmisen kanssa. Niihin moni on voinut jo törmätä vaikkapa asioidessaan nettikauppojen sivustoilla.
Hyvää ja huonoa tekoälyssä
Teppo Lindberg selvitti, mikä tekoälyssä on hyvää ja mikä huonoa.
– Otetaan ensin hyvät puolet. Käytännössä tekoälyllä pystytään nopeuttamaan prosesseja kuten tehdasesimerkissä, kun saman tien linjasto pysähtyy, jos löytyy jokin huomiota herättävä anomalia. Se vähentää inhimillistä virhettä, koska ihminen on erehtyväinen. Jos meillä on kone, joka tekee yhtä asiaa, se ei erehdy. Se mahdollistaa ihmisille turvallisempia töitä, jos tietyt tehtävät ulkoistetaan tekoälyllä. Ja tekoäly on saatavilla 24/7, kuten esimerkiksi internetistä kuvien tai tekstin generoimistyökalut.
– Jos taas pitäisi kirjoittaa jokin artikkeli, eikä tiedä, paljonko oikeaa tekstiä saa, pystyy käyttämään työkalua, joka luo täytetekstiä. Viimeisenä on ”luovuus kuuluu kaikille”. Netistä löytyy tekoälyavusteisia kuvageneroimistyökaluja, joilla kuka tahansa pystyy luomaa hienon maiseman tai piirroksen koirasta. Kaikilla on mahdollisuus.
Lindberg totesi, että tekoälyn suurin ongelma on väärinkäyttö. Siihen sisältyvät kaikki mahdolliset huijaukset. Esimerkiksi tekoälyn avulla on kehitetty äänenmuuntimia niin, että joku ihminen voi puhua omaan mikrofoniinsa ja se saattaa kuulostaa toisessa päässä vaikka Sauli Niinistöltä.
– Myös datan omistajuuskysymykset ovat ongelma. Se, että jos ihmiset itsenäisesti rakentavat tekoälymalleja, eivätkä he itse omista tätä dataa, siinä on iso tekijänoikeusongelma. Sauli Niinistö -esimerkissä henkilö on netistä ladannut paljon hänen haastattelujaan ja on sitä dataa käyttänyt laittomasti ja tehnyt sellaisen mallin. Se on ongelmallista, koska ei pystytä kunnolla seuraamaan, mistä data on peräisin, ellei päästä käsiksi itse lähdeaineistoon siinä mallissa.
Lindberg toteaa myös sen, että tekoäly tekee juuri sen, minkä se ohjelmoidaan tekemään niin hyvässä kuin pahassa.
– Eli jos tekee mallin, se saattaa olla hyvin puolueellinen. Puolueettomuuteen pyritään. Tällä hetkellä laaditaan paljon tekoälyyn liittyviä lakeja, mutta niitä ei ole aivan lukkoon lyöty. On hyviä käytäntöjä, mutta ei selkeitä lakeja. Huonona asiana on myös ”luovuus kuuluu kaikille”. Kuka tahansa voi tekoälyllä rakentaa ns. kaunista, jolloin ihmisen tekemä taide voi kokea aikamoisen deflaation.
Lopuksi yleisö pääsi testaamaan kuvapareja, joista piti arvata, kumpi oli aito valokuva ja kumpi tekoälyn tuotos. Tehtävä oli vaikea. Yksi tällainen tekoälytesti löytyy vaikkapa Ylen sivuilta.