Strukturalna bioinformatika
PETO PREDAVANJE – STRUKTURALNA BIOINFORMATIKA
Strukturalna bioinformatika je grana bioinformatike koja je povezana sa analizom i
predviđanjem trodimenzionalne (3D) strukture bioloških makromolekula kao što su proteini,
RNA i DNA. Ona se bavi uopštavanjem molekularne 3D strukture poređenjem ukupnih navoja i
lokalnih motiva, principa molekularnog uvijanja, evolucije, interakcije vezivanja, i povezanosti
strukture i funkcije, radeći i na eksperimentalno rešenim strukturama i na kompjuterskim
modelima. Termin strukturalan ima isto značenje kao u strukturalnoj biologiji, pa strukturalna
bioinformatika može da se posmatra i kao deo kompjutacione strukturalne biologije.
Predviđanje proteinske strukture je druga važna primena bioinformatike u strukturalnoj
biologiji. Aminokiselinska sekvenca proteina, tzv. primarna struktura može lako biti određena iz
genske sekvence koji kodira određeni protein. U velikoj većini slučajeva, ova primarna struktura
jedinstveno određuje strukturu u njenoj prirodnoj sredini. Naravno, postoje izuzeci, kao što je
slučaj sa goveđim encephalitisom poznatijim kao bolest ludih krava – prionska bolest.
Poznavanje ovih struktura je od ogromnog značaja za razumevanje funkcije proteina. Strukturni
podaci su obično klasifikovani kao sekundarna, tercijerna i kvaternerna struktura. Stabilno opšte
rešenje za takva predviđanja ostaje otvoren problem. Većina napora je do sada bilo usmereno ka
heuristici koja se uglavnom i koristi.
1.1.
PREDVIĐANJE STRUKTURE PROTEINA
Predviđanje strukture proteina predstavlja sistem donošenja zaključka o 3D strukturi
proteina na osnovu aminokiselinskih sekvenci, što je u osnovi predviđanje uvijanja proteina i
njegove sekundarne i tercijerne strukture na osnovu primarne strukture. Predivđanje strukture je
u osnovi različito od inverznog problema – dizajna proteina. Predviđanje proteinske strukture je
jedno od najvažnijih ciljeva koje sprovode bioinformatika i teorijska hemija. Ovo je visoko
značajno polje i za medicinu (dizajniranje lekova) i biotehnologiju (dizajniranje novih enzima).
Svake druge godine, počev od 1994. godine, performanse trenutnih metoda se ocenjuju u CASP
eksperimentu (Kritična procena tehnika za predviđanje proteinske strukture). Kontinuiranu
evaluaciju predviđanja proteinske strukture izvode web serveri preko zajedničkog projekta
CAMEO3D.
1
Predviđanje strukture proteina je širok problem koji se grubo rečeno sastoji od:
predviđanja strukture na osnovu podataka iz sličnih proteina (homologo modelovanje ili
modelovanje na osnovu kalupa) i predviđanje strukture bez korišćenja bilo kakvog znanja o
sličnim proteinima (
ab initio
predviđanje strukture ili slobodno modelovanje). Softver za obe od
ovih metoda može biti u potpunosti automatizovan ili može zahtevati intervenciju čoveka.
Robetta iz Bejkerove laboratorije na univerzitetu u Vašingtonu je jedan od najboljih
servera za modelovanje prema homologiji prema CASP 2016 (modelovanje prema kalupu)
CASP12 i server sa najboljim performansama prema kontinuiranom automatizovanom modelu
evaluacije (CAMEO) od juna 2017. godine a tu poziciju drži od 2014. godine. Robetta je
desetostepeni model multiplog bioinformatičkog alata, sa posebnim Rosetta softverom
opremljenim algoritmima za kompjutersko modelovanje i analizu strukture proteina. Razvoj
Rosetta softvera je počeo u laboratoriji dr Bejkera kao alat za predviđanje strukture ali od tada je
adaptirana da rešava i česte kompjuterske makromolekulske probleme. Proširenje Rosetta
softvera uključuje Foldit, koji pokušava da istraži obrazac prepoznavanja i sposobnosti rešavanja
slagalice koje su svojstvene ljudskom umu u cilju kreiranja mnogo uspešnijih kompjuterskih
softvera za predviđanje strukture proteina.
I-TASSER je najbolji server za slobodno modelovanje
predviđanja strukture proteina sudeći prema CASP eksperimentima od 2006. do 2016. godine
(CASP7, CASP9, CASP10, CASP11 i CASP12).
Standardni I-TASSER paket je besplatan i
dostupan za preuzimanje.
HHPRED je bio vodeći server za predviđanje proteinske strukture na osnovu kalupa
2010. godine (CASP9 eksperiment). Imao je srednje vreme odgovora od nekoliko minuta umesto
nekoliko dana što je bio slučaj sa ostalim tada najboljim serverima. HHpred je često korišćen za
daljinsku detekciju homologije i predviđanje funkcije na osnovu homologije. Ovaj program
funkcioniše besplatno, u okviru “open-source” softverskog paketa HH-suite za brzo pretraživanje
sekvenci, proteinskih navoja i daljinsku detekciju homologije.
DNASTARova NovaFold je softver za predviđanje proteinske strukture na osnovu I-
TASSERa. NovaFold koristi I-TASSER algoritme koje kombinuje navoje i tehnologije savijanja
ab initio
da bi izradila tačne, potpune 3D atomske modele proteina sa prethodno nepoznatom
strukturom. NovaFold je dostupna lokalno kao cloud-zasnovani softver. RaptorX odlikuje
usklađivanje jakih meta u skladu sa eksperimentima iz 2010. godine CASP9. RaptorX stvara
2

Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti