Dirbtinio intelekto revoliucija struktūrinėje biologijoje: kas įmanoma, o kas (dar) ne?
  • 2026 m. kovo 30 d. 13:56

Dirbtinio intelekto revoliucija struktūrinėje biologijoje: kas įmanoma, o kas (dar) ne?

Dr. Justas Dapkūnas ir Rita Banciul. Asmeninio archyvo nuotr.

Vilniaus universiteto Gyvybės mokslų centro (VU GMC) mokslininkai tiria biologinių molekulių struktūras, jų sąveikas ir kuria metodus, padedančius įvertinti kompiuteriniais metodais prognozuotų struktūrų patikimumą.

Pastaraisiais metais dirbtiniu intelektu paremti įrankiai iš esmės pakeitė baltymų struktūrų prognozavimo galimybes. Ryškiausias pavyzdys – „AlphaFold“ modelis, kurio kūrėjai 2024 m. buvo įvertinti Nobelio chemijos premija. Vis dėlto net ir pažangiausi metodai ne visada leidžia tiksliai numatyti visų biomolekulių struktūras, todėl mokslininkams vis dar tenka spręsti klausimą, kaip patikimai įvertinti kompiuteriu sukurtus modelius.

Struktūrinė biologija šiandien: ką ir kodėl mokslininkai tiria

Biologinių molekulių struktūros tyrimai leidžia suprasti, kaip veikia gyvybė. Būtent molekulių forma ir jų tarpusavio sąveikos lemia daugelį procesų ląstelėje.

„Praktiškai visi procesai ląstelėje vyksta todėl, kad sąveikauja skirtingos molekulės. Susijungusios jos sudaro įvairius biomolekulinius kompleksus – nuo nedidelių kelių molekulių darinių iki labai didelių struktūrų, tokių kaip ribosomos, kurios atsakingos už baltymų sintezę“, – pasakoja VU GMC mokslininkas dr. Justas Dapkūnas.

Pasak jo, šių struktūrų pažinimas svarbus dėl dviejų pagrindinių priežasčių. Pirma, tai leidžia geriau suprasti fundamentalius gyvybės veikimo principus. Antra, struktūrinė informacija padeda kuriant naujus vaistus ar produktus chemijos pramonėje. 

„Vaistų molekulės dažnai veikia prisijungdamos prie tam tikrų natūralių biologinių molekulių. Kaip vaistai, naudojamos tiek mažos organinės molekulės, tiek didesni baltymai, pavyzdžiui, antikūnai. Todėl žinoti jų struktūras yra itin svarbu. 

Kai kuriais atvejais fermentai naudojami kaip katalizatoriai chemijos pramonėje, tačiau natūralūs baltymai nėra optimizuoti pramoninėms sąlygoms, nes yra prisitaikę veikti tik gyvame organizme, todėl jų struktūros pažinimas leidžia juos modifikuoti“, – sako mokslininkas.

Kaip baltymų struktūros buvo tiriamos iki dirbtinio intelekto?

Baltymų struktūrų nustatymas eksperimentiškai dažnai yra sudėtingas, brangus ir daug laiko reikalaujantis procesas. Todėl mokslininkai jau seniai siekia šias struktūras prognozuoti kompiuteriniais metodais.

„Ilgą laiką bandyta baltymų struktūras prognozuoti remiantis fizikos ir chemijos principais, tačiau tai nebuvo labai sėkminga. Fundamentalūs baltymų struktūros susidarymo principai iki šiol nėra iki galo suprasti“, – pasakoja dr. J. Dapkūnas.

Daug geresnių rezultatų pasiekta taikant biologinius principus. „Pastebėta, kad evoliuciškai giminingi baltymai, net jei jie randami skirtinguose organizmuose, dažnai turi panašias struktūras. Todėl ilgą laiką vienas patikimiausių būdų prognozuoti baltymo struktūrą buvo vadinamasis homologinis modeliavimas – struktūros nusakymas pagal jau žinomo panašaus baltymo struktūrą.

Kitas svarbus principas – koevoliucija. Jei gimininguose baltymuose tam tikros aminorūgštys keičiasi kartu, tikėtina, kad trimatėje struktūroje jos yra arti viena kitos“, – aiškina mokslininkas.

Tokių sinchroniškų pokyčių analizė leidžia tyrėjams nustatyti, kurios aminorūgštys baltymo struktūroje yra arti viena kitos. Tai tapo vienu svarbiausių ankstyvųjų struktūrų prognozavimo metodų. 

Kaip vertinamas struktūrų prognozavimo tikslumas?

Jau kelis dešimtmečius mokslininkai savo metodus tikrina tarptautiniuose eksperimentuose – CASP (angl. Critical Assessment of Structure Prediction) ir CAPRI (angl. Critical Assessment of Predicted Interactions). Juose tyrėjai vertina baltymų struktūrų prognozavimą ir biomolekulinių sąveikų modeliavimą.

„Šių eksperimentų metu mokslininkams pateikiamos struktūros, kurios jau nustatytos eksperimentiškai, tačiau dar nepaviešintos. Tai leidžia objektyviai patikrinti, kaip tiksliai įvairūs metodai gali prognozuoti struktūras“, – pasakoja dr. J. Dapkūnas.

Tokiuose konkursuose nuolat dalyvauja ir VU GMC Bioinformatikos skyriaus komanda, kuri pastaraisiais metais yra tarp sėkmingiausių dalyvių.

good_and_bad_models.png

Žaliai ir geltonai parodyta tikroji, eksperimentiškai nustatyta baltymo ir RNR komplekso struktūra (PDB: 6FPQ). Kitos struktūros yra modeliai, kur mėlyna spalva atitinka teisingai sumodeliuotą struktūrą, o raudona spalva – klaidingai.

„AlphaFold“ proveržis

Didžiausią revoliuciją struktūrinėje biologijoje pastaraisiais metais sukėlė „AlphaFold“. „AlphaFold 2“ buvo pirmasis metodas, kuris gebėjo prognozuoti baltymų struktūras tokiu tikslumu, kuris daugeliu atvejų prilygsta eksperimentiniams metodams“, – sako dr. J. Dapkūnas.

Šis metodas buvo pristatytas 2020 m. ir išbandytas CASP14 eksperimente. Jo sėkmę lėmė kelių sričių – struktūrinės biologijos, bioinformatikos ir dirbtinių neuroninių tinklų – metodų sujungimas.

Pasak mokslininko, vieno konkretaus momento, kada dirbtinis intelektas įžengė į struktūrinę biologiją, nebuvo. „Mašininio mokymosi metodai čia buvo naudojami jau daug metų, tačiau galiausiai susikaupė pakankamai duomenų ir patobulėjo neuroninių tinklų metodai“, – teigia mokslininkas.

Kur baigiasi dirbtinio intelekto galimybės?

Šiandien „AlphaFold“ ir panašūs metodai labai tiksliai prognozuoja daugelio baltymų struktūras. „Dažnai mokslininkams net nereikia patiems modeliuoti baltymų – jų struktūros jau yra prognozuotos ir sudėtos į viešas duomenų bazes“, – sako dr. J. Dapkūnas.

Tačiau ne visos molekulės prognozuojamos vienodai tiksliai – sudėtingiau modeliuoti baltymų ir mažų vaistinių molekulių sąveikas bei antigenų ir antikūnų kompleksus, kurie ypač svarbūs farmacijos pramonei, taip pat DNR ir RNR struktūras bei didelius biomolekulinius kompleksus, kurių analizė dažniau siejama su fundamentinių biomokslų klausimų tyrimais. 

„Dirbtinis intelektas dažnai geriau prognozuoja struktūras, kurios yra panašios į tas, kurios buvo naudojamos modeliams apmokyti. Tačiau visiškai naujos sąveikos vis dar kelia problemų“, – paaiškina doktorantė Rita Banciul.

Be to, neuroniniai tinklai veikia vadinamuoju „juodosios dėžės“ principu. „Tokie modeliai gali turėti milijonus ar net milijardus parametrų, todėl sunku tiksliai pasakyti, kodėl jie priima vieną ar kitą sprendimą. Tad dėl neskaidraus sprendimų priėmimo proceso darosi sudėtinga visiškai pasitikėti gautais rezultatais, ypač taikymuose, reikalaujančiuose itin aukšto struktūrų tikslumo“, – sako mokslininkė.

VU GMC mokslininkų indėlis

VU GMC mokslininkai siekia spręsti kai kurias iš šių problemų kurdami naujus biomolekulinių struktūrų vertinimo metodus.

„Vienas iš iššūkių yra tas, kad skirtingi modeliavimo įrankiai gali pateikti daug alternatyvių struktūrų. Todėl labai svarbu turėti metodą, kuris padėtų įvertinti jų kokybę ir pasirinkti realistiškiausią modelį“, – sako R. Banciul.

Būtent tam pagal Lietuvos mokslo tarybos finansuojamą projektą „Giliuoju mokymu pagrįsti metodai baltymų sąveikoms anotuoti“ (S-MIP-23-44) kuriamas struktūrų kokybės vertinimo įrankis VoroMQA-aa.

„Realiose biomolekulėse atomai išsidėstę ne atsitiktinai – jų tarpusavio kontaktai paklūsta fizikos ir chemijos dėsniams. Mūsų metodas analizuoja šiuos kontaktus ir leidžia įvertinti, ar prognozuota struktūra yra realistiška“, – aiškina R. Banciul.

Metodas remiasi Voronojaus teseliacijos principu, kuris leidžia matematiškai apibrėžti erdvę aplink kiekvieną atomą ir apskaičiuoti jų kontaktus bei jų kontaktų plotus.

„Jei modelyje aptinkami tokie atomų kontaktai, kokie dažniausiai stebimi realiose struktūrose, jis įvertinamas aukštu kokybės balu. Jei kontaktai neįprasti arba beveik nesutinkami eksperimentinėse struktūrose, balas mažėja“, – sako mokslininkė.

Kodėl tokie metodai svarbūs?

Pasak R. Banciul, struktūrų kokybės vertinimo metodai tampa ypač svarbūs modeliuojant sudėtingas sistemas.

„Kartais vienai sistemai sugeneruojama šimtai ar net tūkstančiai skirtingų modelių. Tarp jų dažnai būna ir labai tikslus variantas, tačiau jį reikia atpažinti. Būtent čia padeda struktūrų kokybės vertinimo įrankiai“, – sako ji.

VoroMQA-aa gali vertinti įvairių biomolekulių modelius – baltymų, nukleorūgščių, baltymų ir ligandų kompleksų.

„Svarbu ir tai, kad mūsų metodas nėra paremtas giliuoju mokymusi. Tai leidžia nepriklausomai įvertinti dirbtinio intelekto sugeneruotus modelius ir sumažinti klaidingų interpretacijų riziką“, – pabrėžia R. Banciul.