Asendatud pürimidiinil ja uratsiilil põhinevate derivaatide andmepõhine modelleerimine ning valideerimine sünteesitud ühenditega
Uko Maran
Pürimidiini heterotsükkel mängib vähivastastes uuringutes olulist rolli. Näiteks on pürimidiini baasstruktuuril tuletatud ühendid lootustandvad emakakaelavähi ravis (loe pikemalt teadusartikli sissejuhatusest). Sellel kemikaalide rühmal puuduvad andmepõhised masinõppe kvantitatiivsed struktuur-aktiivsuse sõltuvused (QSAR), mis võimaldaksid üldistamist ja ennustamisvõimet uute aktiivsete ühendite otsimisel. Selle saavutamiseks koguti ja kureeriti ChEMBL-ist pürimidiini ja uratsiili ühendite andmestik. Andmepõhise masinõppe QSAR-i jaoks töötati välja töövoog, mis kasutab intuitiivset andmestiku disaini ja järkjärgulist molekulaarsete deskriptorite valikut. Mudelit valideeriti täiendavate olemasolevate andmete põhjal. Pime valideerimine viidi läbi ka uute, kaasautorite poolt sünteesitud, uratsiili ja pürimidiini põhistele ühenditele. Uute sünteesitud derivaatide seas oli kõige aktiivsem ühend, 2,4,5-tri-asendatud pürimidiin, mille QSAR mudeli ennustus erines 0,02 ühikut võrreldes eksperimentaalselt määratud antiproliferatiivse aktiivsusega.
Artikkel: https://doi.org/10.3390/ijms25179390
FAIR andmed ja mudel: http://dx.doi.org/10.15152/QDB.261