Uniwersytet Jagielloński w Krakowie - Punkt LogowaniaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Zaawansowane metody bioinformatyczne w biochemii

Informacje ogólne

Kod przedmiotu: WBT-BCH534 Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Zaawansowane metody bioinformatyczne w biochemii
Jednostka: Wydział Biochemii, Biofizyki i Biotechnologii
Grupy:
Punkty ECTS i inne: 4.00
Język prowadzenia: polski

Zajęcia w cyklu "Semestr letni 2020/2021" (jeszcze nie rozpoczęty)

Okres: 2021-02-24 - 2021-06-15
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 30 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Michał Bukowski
Prowadzący grup: Michał Bukowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Ocena wliczana do średniej:

tak

Cele kształcenia:

Zapoznanie studentów z istotnymi aspektami tworzenia dopasowań wielosekwencyjnych i drzew filogenetycznych w celu określania pokrewieństwa między sekwencjami biologicznymi oraz z zaawansowanymi metodami wyszukiwania sekwencji homologicznych w dużych zbiorach danych.


Uzyskanie przez studentów wiedzy pozwalającej na odpowiedni dobór zbioru sekwencji i krytyczną ocenę wyników analizy ich pokrewieństwa.


Uzyskanie umiejętności obsługi ogólnie dostępnych, specjalistycznych programów o szerokiej użyteczności w zakresie biochemii, projektowania i tworzenia własnych potoków analitycznych oraz wizualizacji uzyskanych wyników.

Efekty kształcenia:

Wiedza


Posiada ogólną wiedzę na temat różnic między różnymi algorytmami tworzenia dopasowań wielosekwencyjnych oraz związanych z nimi praktycznych konsekwencji. [BCH2K_W05, P2A_W06, P2A_W07]


Rozumie różnice między prostymi algorytmami konstrukcji drzew filogenetycznych (Neighbor Joining, UPGMA) a wykorzystaniem techniki Maximum Likelihood w odniesieniu do złożonych modeli ewolucji sekwencji kwasów nukleinowych i białek (GTR, WAG) i jest świadom ich praktycznych konsekwencji. [BCH2K_W04, P2A_W01, P2A_W02; BCH2K_W06, P2A_W06]


Zna technikę Bootstrap i sposób jej wykorzystania w ocenie doboru dopasowania wielosekwencyjnego oraz jakości skonstruowanego na jego podstawie drzewa filogenetycznego. [BCH2K_W06, P2A_W06]


Posiada zaawansowaną wiedzę na temat parametrów uruchomienia i działania programów z serii BLAST+, w szczególności programu PSI-BLAST, w celach poszukiwania sekwencji homologicznych białek o różnym stopniu pokrewieństwa. [BCH2K_W05, P2A_W06, P2A_W07]



Umiejętności


Potrafi wykorzystać program Jupyter Notebook w tworzeniu prostych skryptów w języku Python 3 do przetwarzania i analizy sekwencji biologicznych oraz wizualizacji i dokumentowania ich wyników. [BCH2K_U04, P2A_U05; BCH2K_U15, P2A_U11]


Wykorzystuje ogólnie dostępne programy (Clustal W, Clustal Omega, MUSCLE, T-Coffee, PhyML) do konstrukcji dopasowań wielosekwencyjnych i drzew filogenetycznych oraz program CLC Main Workbench do przeprowadzania kontrolowanej konstrukcji dopasowania wielosekwencyjnego. [BCH2K_U01, P2A_U01; BCH2K_U02, P2A_U02]


Potrafi skonstruować różnymi metodami drzewa filogenetyczne, zarówno na podstawie dopasowania wielosekwencyjnego jak i zliczania k-merów, przedstawić je w formie graficznej, ocenić ich jakość oraz wybrać najbardziej pasujący model sekwencji. [BCH2K_U04, P2A_U05]


Posiada umiejętność lokalnego wykorzystania narzędzi z serii BLAST+ w trybie tekstowym do tworzenia własnych baz danych sekwencji biologicznych i ich przeszukiwania. [BCH2K_U01, P2A_U01; BCH2K_U02, P2A_U02]


Posiada umiejętność doboru szerokiego zakresu parametrów wpływających na działanie programów z serii BLAST+ oraz pozyskiwanie wyników zawierających ściśle określone informacje w zadanym formacie. [BCH2K_U01, P2A_U01; BCH2K_U04, P2A_U05]


Wykorzystuje język Pyton 3 oraz program Snakemake do tworzenia prostych skryptów automatyzujących sekwencyjne wykorzystanie różnych narzędzi bioinformatycznych i przetwarzanie wyników ich działania (tworzenie potoków analitycznych, ang. pipelines). [BCH2K_U01, P2A_U01; BCH2K_U04, P2A_U05; BCH2K_U15, P2A_U11]



Kompetencje społeczne


Potrafi pracować w grupie oraz współtworzyć podział pracy w celach przeprowadzenia złożonej analizy danych. [BCH2K_K03, P2A_K02]


Zna stan i ograniczenia własnej wiedzy i jest świadomy konieczność jej ciągłego poszerzania. [BCH2K_K01, P2A_K01, P2A_K04, P2A_K05, P2A_K07]


Jest świadomy znaczenia praktycznego wykorzystania posiadanej wiedzy w zakresie biochemii. [BCH2K_K06, P2A_K07, P2A_K08]

Forma i warunki zaliczenia:

Na końcową ocenę z kursu składają się: ocena za zaprojektowanie i implementację potoku analitycznego odpowiedniego do zadanego przez prowadzącego lub samodzielnie wybranego problemu z zakresu biochemii, nad całością którego pracuje cała grupa ćwiczeniowa (6-8 osób) a poszczególne jego części są opracowywane przez 2-3 osobowe podgrupy (30%); ocena za krótkie zadania problemowe rozwiązywane w trakcie zajęć i poza nimi (20%); sprawdzian wiadomości w formie elektronicznej obejmujący pytania testowe i otwarte pytania problemowe dotyczące zagadnień teoretycznych omawianych w trakcie wykładów i ściśle związanych z przebiegiem zajęć praktycznych oraz krótkie praktyczne zadania z zakresu użytkowania programów i rozwiązań przedstawianych w trakcie ćwiczeń (50%).


Aby zaliczyć kurs, student musi uzyskać co najmniej 50% możliwych do uzyskania punktów.

Metody sprawdzania i kryteria oceny efektów kształcenia uzyskanych przez studentów:

Konwersacje na temat zagadnień teoretycznych i przebiegu wykonywanych ćwiczeń praktycznych. Pytania problemowe sprawdzające stopień zrozumienia omawianych zagadnień.


Analiza stopnia zrozumienia omawianych zagadnień teoretycznych i praktycznych poprzez konwersację i obserwację pracy studentów w trakcie ćwiczeń oraz ocenę wykonania zadań dodatkowych.


Sprawdzian wiadomości i umiejętności praktycznych uzyskanych w trakcie trwania kursu.

Metody dydaktyczne - słownik:

Metody podające - prezentacja multimedialna
Metody podające - wykład informacyjny
Metody praktyczne - ćwiczenia laboratoryjne
Metody problemowe - wykład konwersatoryjny

Metody dydaktyczne:

Metody podające: wykład z prezentacją multimedialną.

Metody problemowe: wykład konwersatoryjny; dyskusja dydaktyczna.

Metody praktyczne: ćwiczenia w pracowni komputerowej; opracowanie i analiza wyników zadań rozwiązywanych w trakcie ćwiczeń i poza nimi z otrzymaniem informacji zwrotnej od prowadzącego.

Bilans punktów ECTS:

Udział w zajęciach:

- 15 h, wykłady,

- 30 h, ćwiczenia.


Praca własna studenta:

- 10 h, przygotowanie do ćwiczeń,

- 15 h, rozwiązywanie zadań dodatkowych poza ćwiczeniami,

- 15 h, praca nad projektem grupowym,

- 15 h, przygotowanie do zaliczenia.


Łączny nakład pracy studenta: 100 h.

Grupa treści kształcenia:

Grupa treści kształcenia do wyboru

Skrócony opis:

Określanie ewolucyjnego pokrewieństwa sekwencji poprzez konstruowanie drzew filogenetycznych w oparciu o dopasowania wielosekwencyjne i zliczanie k-merów. Metody poszukiwania sekwencji homologicznych. Projektowanie i konstruowanie skalowalnych potoków analitycznych do przetwarzania i analizy sekwencji biologicznych.

Pełny opis:

1. Wprowadzenie do pracy w trybie tekstowym w systemie Linux. Instalacja i konfiguracja narzędzi wykorzystywanych w trakcie zajęć: pakiet Anaconda (Python 3, IPython, Jupyter Notebook), Snakemake, Clustal W, Clustal Omega, MUSCLE, T-Coffee, PhyML, CLC Main Workbench, narzędzia BLAST+. Zaprezentowanie programu IPython, interaktywnego, tekstowego interpretera języka Python 3.

2. Wybrane zagadnienia dotyczące wykorzystania programu Jupyter Notebook do tworzenia skryptów w języku Python 3, wizualizacji danych oraz przechowywania wyników analiz. Przetwarzanie danych tekstowych w języku Python 3.

3. Obsługa w trybie tekstowym narzędzi BLAST+ oraz narzędzi do tworzenia dopasowań wielosekwencyjnych, konstrukcji drzew filogenetycznych i generowania ich w formie graficznej.

4. Wykorzystanie narzędzi MUSCLE, Clustal W, Clustal Omega oraz narzędzi BLAST+ z poziomu CLC Main Workbench, graficzna prezentacja i analiza wyników.

5. Wykorzystanie narzędzi własnych programu CLC Main Workbench do tworzenia dopasowań wielosekwencyjnych i konstrukcji drzew filogenetycznych różnymi metodami oraz generowania ich w formie graficznej.

6. Uruchamianie tekstowych narzędzi zewnętrznych z poziomu skryptów w języku Python 3, przekierowywanie, przetwarzanie i wizualizacja wyników ich działania, przekierowywanie surowych lub przetworzonych wyników do kolejnych narzędzi.

7. Wykorzystanie programu Snakemake do tworzenia skalowalnych potoków analitycznych złożonych z narzędzi zewnętrznych i własnych skryptów przetwarzających dane.

Literatura:

Podstawowa: treści przekazywane przez prowadzącego i udostępnianie w formie elektronicznej.

Uzupełniająca: Bioinformatyka i ewolucja molekularna, Attword TK, Higgs PG, PWN 2008; dokumentacja do najnowszych wersji języka Python 3 i programów: Snakemake, CLC Main Workbench, BLAST+, Clustal W, Clustal Omega, MUSCLE, T-coffee, PhyML; wskazane w trakcie zajęć publikacje naukowe.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Jagielloński w Krakowie.