Zagadnienia do wykładu z bioinformatyki

  • Bioinformatyczne bazy danych:

    • sekwencyjne (nr, UniProt, PFam, InterPro) i strukturalne (PDB)
    • bazy ‘curated’ vs ‘non-curated’
    • bazy o zredukowanej nadmiarowości (ang. non redundant)
    • inne bazy i słowniki: KEGG, GeneOntology; problem (nie)jednoznaczności w bazach danych
  • Uliniowienie pary sekwencji - optymalny algorytm deterministyczny

    • algorytm dynamicznego programowania
    • ocena uliniowienia; kara za przerwę - dowolna vs afiniczna, otwarcie i kontynuacja przerwy, macierz podstawień
    • uliniowienie lokalne vs. globalne
    • macierz uliniowienia
  • Ocena istotności ulinoiwienia. Definicja i praktyczne zastosowanie parametrów:

    • p-value, e-value
    • ocena (ang. score)
    • procent identyczności sekwencyjnej, procent podobieństwa sekwencyjnego
    • z-score (zmienna z rozkłądu normalnego standaryzowanego)
  • Pojęcie homologii sekwencji. Homologi (ortologi i paralogi) vs analogi

    • wnioskowanie o strukturze i funkcji białka w oparciu o białka homologiczne
  • Heurystyczne metody ulinowienia

    • BLAST
    • FASTA
    • HHSearch
    • przeszukiwanie baz danych
  • Uliniowienia wielu sekwencji (Multiple Sequence Alignment, MSA). Profil sekwencyjny i jego postacie: MSA, ukryty model Markowa (HMM). Drzewa filogenetyczne.

  • Uliniowienie sekwencja-profil oraz profil-profil. Algorytm PsiBlast. Metody przewlekania 1D. Metaservery.

  • Predykcje na podstawie profilu: struktura drugorzędowa białek, zagrzebanie, lokalna ruchliwość fragmentów białka, podział sekwencji na domeny

  • Nałożenie struktur białek. Odległość crmsd, jej interpretacja i przypadłości.

  • Uliniowienie strukturalne

    • czym ono różni się od nałożenia
    • parametry GDT i tm-score
    • złożoność obliczeniowa i popularne algorytmy
    • programy tm-align, DALI
  • Uliniowienie sekwencji ze strukturą - przewlekanie 3D

  • Modelowanie porównawcze

    • etapy modelowania porównawczego
    • pojęcia: szablon i cel oraz uliniowienie między nimi
    • biblioteki rotamerów
    • modelowanie struktur pętli w białku
    • podejścia do optymalizacji (udokładniania) struktury
    • metody Modeller i SwissModel
  • Analiza skupień

    • metody hierarchiczne
    • metoda K-średnich
    • zastosowania w bioinformatyce
  • Oprogramowanie do modelowania struktur białek

    • podejścia pełnoatomowe: Modeller i Rosetta
    • metody oparte o reprezentację zredukowaną: CABS, UNRES