AlphaGenome ennustaa DNA:n variaatioiden vaikutuksia ja voi auttaa ymmärtämään monimutkaisia sairauksia. Toinen Google DeepMindin malli voitti kaksi vuotta sitten kultamitalin Ruotsissa, mutta tämä uusi tekoäly kohtaa kilpailua ja rajoituksia.
Sisältö
Ihmisellä on noin 20 000 geeniä . Se voi tuntua paljolta, mutta jopa riisinjyvässä niitä on enemmän (noin 45 000), ja ne muodostavat vain 2 % genomista. Monimutkaisuus ei piile geenien määrässä, vaan siinä, miten ne on järjestetty ja aktivoitu. Niitä ohjaava järjestelmä on tallennettu jäljellä olevaan 98 %:iin, siihen osaan genomin, jota on tutkittu niin vähän, että se tunnettiin aikoinaan ”roskagenominä”. Kaiken tämän tiedon tulkinta on yksi nykyaikaisen genomiikan tärkeimmistä tehtävistä. Tehtävä on niin monimutkainen, että se vaatii tehokkaita laskentaresursseja… ja tekoäly voi olla tässä avainasemassa.
Google DeepMind on pyrkinyt kymmenen vuoden ajan nousemaan alan johtavaksi toimijaksi ja on nyt esitellyt tiedeyhteisölle AlphaGenome -tekoälytyökalun, joka on kehitetty ymmärtämään ”pimeää 98 %” ja sitä, miten pienet muutokset DNA:ssamme voivat muuttaa geenien toimintaa . Tämän tavoitteen saavuttaminen ei ole vain jännittävän arvoituksen ratkaiseminen, vaan se on myös erittäin tärkeää sairauksien diagnosoinnille ja uusien hoitomenetelmien kehittämiselle.
Kaksi vuotta sitten Googlen tutkijat saivat Nobelin kemianpalkinnon vastaavan työkalun kehittämisestä proteiinien tutkimiseen – AlphaFold. Uusi tekoälyn hanke on kuitenkin vielä teknisesti rajoittunut, eikä se näytä riittävän vallankumoukselliselta, jotta se lisäisi uuden palkinnon suurten teknologiayritysten historiaan.
Mutaatioiden jäljillä
Jos 2 % genomistamme koostuu geeneistä, loput 98 % on erilaisia toistuvia DNA-perheitä, liikkuvia elementtejä, transposoneja ja muita vähän tunnettuja termejä. Niiden joukossa on sääteleviä elementtejä. ”Nämä ovat pieniä DNA-sekvenssejä, joihin liittyy proteiineja, jotka määrittävät geenin toiminnan, milloin ja missä se aktivoituu ja milloin ja missä se deaktivoituu”, selittää Lluís Montoliu , tutkija Kansallisessa bioteknologiakeskuksessa (CNB-CSIC), El Confidencialin haastattelussa. Nämä elementit ovat erittäin tärkeitä, koska ”jos niitä muutetaan, geeni aktivoituu tai deaktivoituu siellä, missä sen ei pitäisi, ja tämä voi johtaa synnynnäisiin sairauksiin”.

Vuonna 2003 saatiin ihmisen genomin täydellinen sekvenssi, mutta tämän kirjan lukeminen ja säätelevien elementtien ymmärtäminen on aivan eri asia, joka on erittäin vaikea saavuttaa ilman teknologiaa. Tähän asti on ollut olemassa tietokoneohjelmia, joiden avulla on voitu tehdä tutkimuksia vertaamalla sekvenssejä, mutta ”tämä tehtiin suhteellisen pienillä sekvensseillä, jotka koostuivat muutamasta tuhannesta nukleotidista; AlphaGenomen avulla tämä voidaan tehdä sekvensseillä, jotka koostuvat jopa miljoonasta nukleotidista”.
Tämä voi auttaa määrittämään tarkasti, mihin mutaatioiden etsintä tulisi keskittyä, jotka aiheuttavat ”geneettisiä tappavia sairauksia”, lisää Montolieu, kansainvälinen harvinaisten sairauksien tutkimuksen asiantuntija. ”Tämä on valtava saavutus ja vaikuttava edistysaskel”, hän sanoo.
Tällaiset mallit ovat erityisen tärkeitä syöpätutkimuksen kehitykselle. ”Kun sekvensoimme potilaan genomin, jolla on tietty kasvain, tai etsimme perinnöllistä syöpää aiheuttavaa mutaatiota, löydämme usein mutaatioita, joita ei ole aiemmin kuvattu, koska se tehdään laboratorio-olosuhteissa”, sanoo Dido Carrero, tutkija Espanjan kansallisesta syöpätutkimuskeskuksesta (CNIO). Mutta AlphaGenome antaa meille mahdollisuuden tehdä johtopäätöksiä näiden mutaatioiden mahdollisista seurauksista ja seurata niitä. ”Kokeiden avulla voimme vahvistaa, tapahtuuko mutaatio sattumalta vai onko se sairauden syy”, hän lisää.
Google DeepMind on juuri julkaissut Nature-lehdessä ensimmäiset tulokset tekoälyyn perustuvan syväoppimismallinsa toiminnasta, joka esiteltiin kesäkuussa 2025. Kehittäjien mukaan se parantaa ennustustarkkuutta olemassa olevissa malleissa 25:ssä 26:sta tehdystä testistä. Tieteellinen yhteisö on yhtä mieltä siitä, että tämä on tärkeä askel, joka osoittaa erittäin hyviä tuloksia joissakin tehtävissä, mutta on vielä kaukana täydellisyydestä.
Työkalu, jolla on rajoituksia
”Tällaisia tekoälymalleja käyttävien tutkimusten vaikeus piilee siinä, että on ymmärrettävä, missä ne antavat luotettavia vastauksia ja missä eivät. AlphaGenomen tapauksessa se voi tutkia genomin säätelyprosesseja, mutta tällä hetkellä se ei ole luotettava henkilökohtaisen lääketieteen kannalta”, selitti Mafalda Diaz, tekoälyn ja genomiikan tutkimusryhmän apulaisjohtaja Genomien säätelykeskuksessa (CRG).

Genomitutkimuksilla on paitsi erityisiä rajoituksia, myös tekoälymalleille ominaisia rajoituksia: kyvyttömyys selittää mallien toimintaperiaatetta ja puolueellisuus. Ensimmäinen, kuten Diaz selittää, ”on aina ollut kaikkien matemaattisten mallien ongelma, mutta koska tekoälymallit ovat ”mustia laatikoita”, ongelma pahenee”.
AlphaGenomen tutkijat väittävät työskentelevänsä tällaisten ongelmien ehkäisemiseksi. ” Yksi tärkeimmistä tavoista, joilla teemme tätä, on alkuperän jäljittäminen: kun malli ennustaa tietyn vaihtoehdon vaikutuksen, mihin se tarkalleen ottaen keskittyy? Selvittääksemme tämän mallinnamme mutaatioita ja laskemme mallin arviot uudelleen”, selittivät Natasha Latysheva ja Žiga Avsek Google DeepMindista El Confidencialin lehdistötiedotteessa. Kyseessä on eräänlainen ”geneettinen analyysi”, jonka avulla pyritään ymmärtämään, mihin malli perustaa ennusteensa. ”Se on tehokas työkalu, joka auttaa ymmärtämään paremmin biologian perusteita”, sanoo Mafalda Diaz CRG:stä.
Jos tulokset ovat vääristyneitä, osa ongelmasta piilee itse tiedoissa. ”On monia tekijöitä, jotka voivat johtaa mallin vääristymiseen : ikä, sukupuoli, ympäristöolosuhteet… Kuvittele, että keräät tietoja 80-vuotiailta ihmisiltä, koska heillä on tietty sairaus; jättäisitte huomiotta 30-vuotiaiden tiedot, ja malli ei välttämättä toimisi”, selittää Beatrice Lopez , ”Tekoäly lääketieteessä ja terveydenhuollossa” -tutkimuslaboratorion koordinaattori eXiT-tutkimusryhmässä Gironan yliopistossa, tämän lehden haastattelussa.
Rajoituksista huolimatta ”meidän on muistettava, että kyseessä on työkalu ja että erikoistunut tutkija on tulkittava sen tuloksia eikä pidettävä niitä lopullisena ratkaisuna”, korostaa Lopez. Diaz kehottaa eettiseen lähestymistapaan ja ”vastuulliseen käyttöön”. Tämä voi epäilemättä taata, että tämä tieteellinen löytö tuo ”suurinta hyötyä ihmiskunnalle”… Ehto, jonka Alfred Nobel asetti palkintojensa jakamiselle.
Ja Nobel-palkinto menee…
On kulunut jo kymmenen vuotta siitä, kun Google DeepMind aloitti tutkimuksen tekoälyn soveltamisesta molekyylibiologiassa ja lääketieteessä. Vuonna 2016 yritys aloitti yhteistyön sairaaloiden kanssa kliinisten tietojen analysoinnissa, ja samana vuonna tapahtui merkittävä tapahtuma: AlphaGo voitti ammattilaispelaaja Lee Sedolin go-pelissä. Google DeepMindin perustaja ja toimitusjohtaja Demis Hassabis sanoi silloin: ”Minua inspiroi todella tällaisen tekoälyn käyttö tieteessä ja sen kehityksen nopeuttaminen. Haluaisin nähdä tieteen hyödyntävän tekoälyä”.

Ja niin taika alkoi. AlphaFold-tuoteperhe ilmestyi vuonna 2018, ja siitä lähtien on julkaistu neljä parannettua versiota. On myös AlphaMissense (2023), joka ennustaa, aiheuttaako yhden DNA-kirjaimen muutos sairauden, ja AlphaProteo (2024), jolla voidaan luoda proteiineja tyhjästä. Hassabis itse oli yksi AlphaFoldin Nobel-palkinnon saajista .
Nobel-palkinnon saaminen tieteellisestä löydöstä on monimutkainen prosessi. Se edellyttää kansainvälisen konsensuksen saavuttamista, mikä voi viedä vuosia ja riippuu löydön uutuudesta ja merkityksellisyydestä, mutta väistämättä herää kysymys, täyttääkö AlphaGenome odotukset .
”AlphaFold mullisti alan, koska se oli yksi ensimmäisistä syväoppimismalleista, jotka ilmestyivät tekoälyn räjähdysmäisen kehityksen aikana. Nyt uusia ennustemalleja ilmestyy jatkuvasti. Me kehitämme myös yhtä niistä”, toteaa CNIO:n Carrero . Tutkija katsoo, että kyseessä on erittäin kilpailtu ala , jolla on vaikea erottua: ”Toivon, että se menestyy, mutta uskon, että nämä uudet mallit jäävät suurelta osin huomaamatta kansainvälisessä yhteisössä ja suurella yleisöllä.”
”En sanoisi, että tämä tutkimus on mullistava, koska se on osa artikkelien ketjua ja koko yhteisön työtä, joka kehittää tällaisia malleja”, myöntää Diaz. Asiantuntija huomauttaa myös, että AlphaFold on ratkaissut proteiinin rakenteen ennustamisen ongelman, mutta AlphaGenome ei ole vielä löytänyt lopullista avainta genomin lukemiseen.
” AlphaFold oli läpimurto, koska proteiinin rakenteen ennustaminen niin luotettavasti pelkästään DNA-sekvenssin perusteella oli jotain, mitä emme yksinkertaisesti osanneet tehdä.
Aiemmin käytimme malleja, jotka olivat vähemmän luotettavia kuin messujen ampumarata”, vitsailee Montoliu. Sen sijaan AlphaGenome, vaikka se ”onkin merkittävä askel eteenpäin”, on saavuttanut tuloksia, jotka olivat jo mahdollisia, mutta vain pienemmillä fragmentteilla.
Tutkijat ovat yhtä mieltä siitä, että hyödyllisyydestään huolimatta tämä tekniikka ei ole vielä saavuttanut samaa ”yllättävää” tasoa kuin edeltäjänsä, ja sillä on edelleen rajoituksia. Saako se Nobelin palkinnon vai ei, se selviää ajan myötä; mikään Googlen kehittämä tekoälymalli ei voi sitä ennustaa.
