Tekstilouhinta auttoi analysoimaan miljoona tupakointikirjausta
Kuinka käydä läpi miljoona lausetta potilaskertomuksia ja analysoida ne? Tekstilouhinta vähensi kliinisten asiantuntijoiden työtä ja nopeutti tutkimusprosessia.
Tekoäly ja koneoppiminen ovat monella tapaa mukana päivittäisessä arjessamme ilman että edes tiedostamme sitä. Terveydenhuollossa hyödynnetään jo tiedonlouhintaa, mutta tekoälyn valjastamiseen terveydenhuollon päivittäiseen käyttöön on vielä matkaa.
Tosielämän dataa hyödyntämällä tehdään tutkimusta ja analyysia tosielämän tiedon pohjalta. Terveydenhuollossa kyse on siitä, että tarkastellaan oikeita potilastietoja ja tutkitaan, miltä potilaat näyttävät tosielämän tiedon valossa.
Potilasryhmien identifiointi on yksi iso mahdollisuus. Koneoppimismenetelmiä hyödyntämällä voidaan tunnistaa paremmin riskiryhmien potilaita ja mahdollisesti tehostaa heidän hoitoaan.
Lisäksi koneoppiminen voi edesauttaa potilaan hoitoon liittyvää päätöksentekoa. Koneoppimisen ja tekoälyn avulla voidaan helpottaa hoitomuodon valintaa ja saada jokaiselle potilaalle juuri hänelle parhaiten sopiva hoitovaihtoehto.
Potilaan näkökulmasta näillä keinoilla voidaan edesauttaa yksilöllistä terveydenhuoltoa. Jokainen potilastapaus on ainutlaatuinen, ja hyvät tekoälyn työkalut voivat auttaa päätöksenteossa.
Koneoppimista on tutkittu jo viime vuosituhannelta alkaen ja teoria on jo suhteellisen vanhaa. Nyt tietokoneiden laskentakapasiteetti on kasvanut niin paljon, että koneet kykenevät käsittelemään tarvittavia tietomääriä. Kaikki edellytykset koneoppimisen hyödyntämiseen ovat siis jo olemassa, ja myös terveysdataa on jo tallessa paljon.
Käytännössä työkalujen valmiiksi saattaminen kestää kuitenkin useita vuosia. Ratkaisuja on todennäköisesti saatavilla viiden–kymmenen vuoden kuluessa. Päivittäiseen käyttöön saattaminen siten, että työkalut näkyisivät terveydenhuollon asiakkaille, vie kuitenkin vielä pidemmän ajan.
Terveydenhuollon ulkopuolella tarkasteltuna koneoppimismenetelmät ja tekoäly ovat jo käytössä arkipäiväisessä elämässämme, vaikka sitä ei aina tule ajatelleeksi. Google-mainoksissa ja YouTuben ehdotetuissa videoissa hyödynnetään koneoppimista ja tekoälyä.
Ihanteellisimmillaan tekoälyn ja koneoppimisen avulla voidaan ennaltaehkäistä sairauksia. Seuraamalla terveiden henkilöiden dataa reaaliajassa voidaan pienten parametrien muutosten perusteella havaita ne henkilöt, jotka saattavat lähitulevaisuudessa sairastua. Nämä muutokset voidaan havaita ennen varsinaisten oireiden ilmaantumista ja tilanne korjata ennen sairauden puhkeamista.
Terveysdatan päätyminen vääriin käsiin huolettaa ymmärrettävästi monia. Tutkimusmaailmassa tietoturvasta pidetään kuitenkin hyvää huolta, ja terveysdata on tutkimusympäristössä hyvin suojattu. Toki kaikkien osapuolten pitää sitoutua noudattamaan tietoturvasääntöjä.
Suomessa on paljon hyviä osaajia, laadukasta akateemista tutkimusta ja projekteja käynnissä terveysdatan ja tekoälyn ympärillä. Suomen etuna on myös se, että esimerkiksi biopankeista, sairaaloiden tietoaltaista ja kansallisista rekistereistä on jo kertynyt paljon laadukasta terveysdataa.
Monelta osin ollaan siis hyvässä lähtöasetelmassa, mutta työ datan hyödyntämiseksi pitää aloittaa nyt. Jos startista jäädään jälkeen, muiden kiinni kiriminen on hankalaa.
Medaffconin RWE-tutkimusprojekteissa hyödynnetään jo tiedonlouhintatyökaluja. Tekoälyyn liittyviä projekteja on juuri käynnistymässä ja selvitystyötä eri mahdollisuuksista tehdään parhaillaan. Harppaus vaatii kumppanuuksia, ja kun kaikki puhaltavat yhteen hiileen, saadaan parhaita lopputuloksia.
Kuinka käydä läpi miljoona lausetta potilaskertomuksia ja analysoida ne? Tekstilouhinta vähensi kliinisten asiantuntijoiden työtä ja nopeutti tutkimusprosessia.
Suomessa on uniikkia dataa lääketutkimuksen tarpeisiin ja myös rakenteetonta tietoa pystytään hyödyntämään jo nyt tehokkaasti.
Yksihaaraiset tutkimusasetelmat ovat haastavia lääkkeen korvaus- ja myyntilupaprosessille. Virtuaaliset kontrolliryhmät auttavat arvioimaan lääkkeen kustannusvaikuttavuutta, jos vertailuryhmää ei ole.