Jopa 80 prosenttia yritysten keräämästä datasta on rakenteetonta, kuten tekstiä tai ääntä. Perinteiset analysointityökalut eivät kykene käsittelemään rakenteetonta dataa, ja isojen datamassojen manuaalinen läpikäynti on yksinkertaisesti mahdotonta. Seurauksena organisaatioissa jää hyödyntämättä valtava määrä liiketoiminnan kehittämisen kannalta mielenkiintoista tietoa.

Ratkaisuksi on tarjolla tekoälyn muoto, luonnollisen kielen analytiikka. Valamiksen Sales Manager Markus Hellas ja seniorkonsultti Jonas Olme työskentelevät aiheen parissa. Tapasimme heidät aurinkoisena syyspäivänä Tapiola Golfin rangella.

– Luonnollisen kielen analytiikan myötä raportointiin saadaan talouslukujen ja muiden mittareiden rinnalle kokonaan uusi datalähde. Kun luonnollista kieltä ymmärtävä tekoäly käy läpi isot tekstiaineistot, pystytään näkemään aiemmin pimentoon jääneitä asioita, Hellas sanoo.

“ Luonnollisen kielen analytiikan myötä raportointiin saadaan talouslukujen ja muiden mittareiden rinnalle kokonaan uusi datalähde. “

Hän tarjoaa esimerkin siitä, miten laadullista dataa voidaan hyödyntää keinoälyn avulla.

Isot yritykset saavat vuosittain jopa satoja tuhansia asiakaspalautteita, jotka sisältävät tyypillisesti rakenteetonta tekstiä. Tekoälyn avulla on mahdollista selvittää, kuinka iso osa annetuista palautteista on positiivisia ja negatiivisia sekä nähdä, mitkä ovat yleisimmät syyt palautteeseen.

– Luonnollisen kielen analytiikalla voidaan selvittää viestien sävyä ja semanttista merkitystä sekä luokitella niitä. Näin saadaan selville negatiivisen palautteen yleisimmät syyt: onko tietyn tuotteen tai palvelun kanssa enemmän ongelmia tai epäonnistutaanko jossain kanavassa useammin kuin toisissa, Hellas sanoo.

Asiakaspalautteiden lisäksi muun muassa vikailmoitukset sisältävät paljon rakenteetonta dataa. 

– Vikailmoituksia kategorisoimalla nähdään nopeasti, mikäli niiden tekstikentässä toistuvat tietyt syyt, kuten akun kestävyys tai hajonnut näyttö, hän jatkaa.

Luonnollisen kielen analytiikka helpottaa myös lääkäreiden työtä

Viime vuosina on toistuvasti uutisoitu lääkäripulasta, joka on johtanut erityisesti terveyskeskuslääkärien työtaakan kasvuun. Lääkärillä saattaa olla ennen vastaanottoa läpikäytävänä potilaan tiedot vuosien ajalta. Jos vaiva on vaatinut jatkuvaa hoitoa, potilastietojärjestelmään on kertynyt lukuisia merkintöjä, joiden huolellinen läpikäynti on ajankäytöllisesti haastavaa.

Luonnollisen kielen analytiikalla on potentiaalia auttaa hoitohenkilökuntaa selviytymään kiireisestä työarjesta. 

 

Jonas Olme (kuvassa) on innokas golffari ja tutustuttanut myös Markus Hellaksen lajiin.

 

Olme kertoo, että keinoäly voidaan valjastaa läpikäymään potilastietoja ja etsimään niistä toistuvuutta. Hän painottaa, että kyseessä on lääkärin työtä tukeva teknologia.

– Luonnollisen kielen analytiikka osoittaa lääkärille, mitkä riskitekijät potilastiedoissa toistuvat ja lääkäri pääsee nopeammin kiinnittämään huomionsa juuri niihin, Olme sanoo.

“Luonnollisen kielen analytiikka osoittaa lääkärille, mitkä riskitekijät potilastiedoissa toistuvat”

– Tekoäly ei korvaa lääkärin tekemää työtä, eikä vähennä esimerkiksi laboratoriokokeiden arvoa. Sen avulla potilastietojen laadullinen data voidaan yhdistää numeeriseen dataan ja molemmista päästään hakemaan riskitekijät samanaikaisesti, Hellas täydentää.

Tietosuojasta on helpompi pitää kiinni kaupallisen teknologian avulla

Potilastiedot ovat hyvä esimerkki sensitiivistä tietoa sisältävästä datasta. Myös asiakaspalautukset voivat sisältää salassa pidettäviä tietoja, kuten henkilötunnuksia tai luottokorttitietoja. Tietosuojan toteutumiseen tuleekin kiinnittää huomiota, kun aletaan analysoimaan rakenteetonta dataa. On yleistä, että vain tietyt henkilöt pääsevät näkemään koko analysoitavan aineiston. 

Tietosuojan toteuttamiseksi aineistosta voidaan esimerkiksi piilottaa sensitiiviset tiedot ennen analysointia. Valamiksella luonnollisen kielen analytiikkaa tehdään erityisesti IBM Watsonilla. Olme kertoo, että kaupallisista teknologioista löytyy valmiina hyvät työkalut käyttäjänhallintaan.

– Open source -teknologioihin verrattuna IBM Watsonin etu ovat sisäänrakennetut governance-työkalut, joiden avulla on helppo määritellä se, kuka tiimissä näkee koko aineiston. Henkilöstömuutosten jälkeen oikeuksia saadaan myös helposti muutettua. Open sourcella vastaava käyttäjänhallinta pitää rakentaa custom -ratkaisuna ja sen päivityksestä täytyy huolehtia tarkkaan.

 

Markus Hellas uskoo, että parin viikon pilotointijakso on monelle yritykselle paras tapa tutustua luonnollisen kielen analytiikkaan.

 

IBM:n lisäksi Valamiksella on hyödynnetty myös R:n, Pythonin ja Elasticsearchin kaltaisia open source -teknologioita. Usein asiakkaille tuotetut kokonaisratkaisut yhdistävät avoimen lähdekoodin teknologioiden ja kaupallisen työkalun parhaat puolet.

– Watson tehostaa ja selkeyttää tietosuojanhallintaa. Kokonaisratkaisussa voidaan hyödyntää muitakin teknologioita, jos se on tarkoituksenmukaista, Hellas sanoo.

Alussa kannattaa pilotoida

Tekoälyteknologia saattaa kuulostaa kalliilta investoinnilta. Hellas muistuttaa, ettei luonnollisen kielen analytiikasta kiinnostuneen organisaation tarvitse heti kättelyssä ostaa vuoden kehitysprojektia. Alkuun pääsee yleensä hyvin suunnitellun pilotoinnin kautta.

– Alussa käsittelyyn voidaan ottaa esimerkiksi vuoden aikana kertyneet asiakaspalautteet. Mietitään liiketoiminnallinen relevantti kysymys tai pari, johon aineiston halutaan vastaavan. Tämän jälkeen data analysoidaan joko asiakkaan omassa ympäristössä tai meidän servereillä. Samalla voidaan tehdä muutama iteraatiokierros. Pilotin tavoitteena on selvittää tekstiaineiston selityskyky, toisin sanoen, vastaako se liiketoiminnalliseen kysymykseen, Hellas sanoo.

Hänen mukaan aikaa esimerkin kaltaiseen pilotointiin kuluu kokonaisuudessa joitakin viikkoja. Niiden aikana organisaatiossa muodostuu hyvä kuva tekoälykehityksestä.

– Pilotointi on käytännönläheinen tapa ottaa ensiaskeleet uusien teknologioiden kanssa, Hellas päättää.

 

Valamis Intelligence analysoi suomenkielisen tekstiaineiston. Tutustu ratkaisuun tarkemmin tästä ja katso esittelyvideo alta.

 

https://www.youtube.com/watch?v=UiSBvV_zI_c&t=4s

 

Valamiksen Ite wiki -profiili

Valamiksen kotisivut