Algorytmy analizy DNA
Sekwencjonowanie nowej generacji oraz użycie wielkoskalowej techniki sekwencjonowania całego genomu dostarczają ogromnych ilości danych. Informacje te poddaje się analizie z wykorzystaniem zaawansowanych algorytmów. Dzięki temu dotychczas niezorganizowane dane stają się użyteczne naukowo – można na ich podstawie utworzyć bazy danych, w których grupowane są informacje według określonych parametrów. Dzięki algorytmom analizy DNA udaje się również precyzyjnie odnajdywać określone miejsca w genomie, porównywać materiały genetyczne różnych osobników, tworzyć drzewa filogenetyczne. Do analizy DNA z całego genomu wykorzystywane są zaawansowane metody bioinformatyczne, w tym mikromacierze oligopeptydowe ekspresyjne, metylacyjne, sekwencjonowanie następnej generacji i spektrometria mas.
Analiza sekwencji w DNA obejmuje następujące etapy:
- Identyfikacja domen.
- Przyrównanie sekwencji.
- Przewidywanie struktury drugorzędowej.
- Przewidywanie fragmentów nieustrukturyzowanych.
- Przewidywanie białek membranowych.
W analizie podobieństwa sekwencji DNA i białek stosowane są algorytmy BLAST i FASTA oraz algorytmy do wielokrotnych dopasowań: algorytm średnich połączeń UPGMA, metoda najbliższego sąsiedztwa, metoda bootstrap. Algorytmy do wielokrotnych dopasowań
sekwencji DNA i białek obejmują m.in. programy Clustal, GeneDoc.
W analizie sekwencji białek wykorzystuje się bazy danych PROSITE, Pfam, PDB.
Do analizy filogenetycznej wykorzystywane są:
- metody konstruowania molekularnych drzew filogenetycznych,
- algorytm średnich połączeń UPGMA,
- metoda najbliższego sąsiedztwa,
- metoda bootstrap.
W analizie struktury drugorzędowej RNA wykorzystywane są:
- algorytm Nussinova optymalizacji ilości par zasad,
- algorytm Zukera optymalizacji energii swobodnej struktury RNA.