1 00:00:01,212 --> 00:00:03,655 Tématem této přednášky jsou 2 00:00:03,655 --> 00:00:06,498 bioinformatické nástroje pro hodnocení 3 00:00:06,498 --> 00:00:08,220 variability genomu živočišných 4 00:00:08,220 --> 00:00:11,204 genetických zdrojů. Přednáška je 5 00:00:11,204 --> 00:00:14,048 součástí modulu 2 zachování 6 00:00:14,368 --> 00:00:16,451 a udržitelné využívání živočišných 7 00:00:16,451 --> 00:00:19,294 genetických zdrojů. Vytvoření této 8 00:00:19,294 --> 00:00:21,938 prezentace bylo podpořeno grantem Erasmus 9 00:00:21,938 --> 00:00:24,541 plus KA 2 v rámci projektu 10 00:00:24,541 --> 00:00:27,384 ISAGREED inovace obsahu a struktury 11 00:00:27,384 --> 00:00:29,787 studijních programů v oblasti managementu 12 00:00:29,787 --> 00:00:32,351 živočišných, genetických a potravinových 13 00:00:32,351 --> 00:00:34,634 zdrojů s užitím digitalizace. 14 00:00:37,888 --> 00:00:40,611 Co je bioinformatika a jaký je 15 00:00:40,611 --> 00:00:41,452 její význam? 16 00:00:42,924 --> 00:00:45,127 Bioinformatika je interdisciplinární 17 00:00:45,127 --> 00:00:47,730 obor, který kombinuje biologii, 18 00:00:47,730 --> 00:00:50,293 informatiku, statistiku a matematiku 19 00:00:50,854 --> 00:00:53,017 s cílem analyzovat a interpretovat 20 00:00:53,017 --> 00:00:55,580 biologická data pomocí výpočetní 21 00:00:55,620 --> 00:00:57,462 nástrojů a algoritmů. 22 00:00:59,144 --> 00:01:01,187 V genetice zvířat hraje klíčovou roli při 23 00:01:01,187 --> 00:01:04,151 získávání a analýze rozsáhlých genomských 24 00:01:04,151 --> 00:01:06,514 dat, jako jsou sekvence DNA. 25 00:01:07,114 --> 00:01:09,598 S cílem získat poznatky o genetické 26 00:01:09,598 --> 00:01:12,201 výbavě a biologických procesech zvířat. 27 00:01:13,803 --> 00:01:15,885 Bioinformatika v genetice zvířat pomáhá 28 00:01:15,885 --> 00:01:18,489 při identifikaci a charakterizaci genů 29 00:01:18,969 --> 00:01:21,172 odpovědných za specifické znaky 30 00:01:21,653 --> 00:01:24,376 nemoci nebo odchylky u zvířat. 31 00:01:25,538 --> 00:01:27,901 Může například pomocí identifikovat geny 32 00:01:28,021 --> 00:01:30,664 spojené se zbarvením srsti, produkcí 33 00:01:30,664 --> 00:01:33,508 mléka, rychlosti růstu nebo náchylnosti k 34 00:01:33,508 --> 00:01:34,028 nemocem. 35 00:01:47,335 --> 00:01:49,298 Umožňuje výzkumníkům porovnávat a 36 00:01:49,298 --> 00:01:51,821 analyzovat genomy různých živočišných 37 00:01:51,821 --> 00:01:54,494 druhů. Pochopit jejich evoluční vztahy, 38 00:01:55,015 --> 00:01:57,177 identifikovat společné genetické prvky. 39 00:01:57,778 --> 00:02:00,221 To může přinést poznatky o rozmanitosti a 40 00:02:00,221 --> 00:02:01,663 evoluci živočišných druhů. 41 00:02:02,785 --> 00:02:04,787 Bioinformatika pomáhá při vývoji nových 42 00:02:04,787 --> 00:02:07,070 šlechtitelských strategií a zlepšování 43 00:02:07,070 --> 00:02:09,473 chovatelských postupů. Analýzu 44 00:02:09,473 --> 00:02:11,435 genetických dat pomáhá identifikovat 45 00:02:11,435 --> 00:02:13,238 zvířata s žádoucími vlastnostmi 46 00:02:13,598 --> 00:02:16,081 pro šlechtitelské programy, zlepšovat 47 00:02:16,081 --> 00:02:18,925 vlastnosti, jako je produktivita, odolnost 48 00:02:18,925 --> 00:02:20,727 vůči chorobám nebo přizpůsobivost. 49 00:02:22,089 --> 00:02:24,211 Bioinformatika podporuje ochranu a 50 00:02:24,211 --> 00:02:26,695 zachování ohrožených druhů zvířat. 51 00:02:27,135 --> 00:02:29,899 Studium jejich genomů a identifikací 52 00:02:30,099 --> 00:02:32,742 genetických markerů pro monitorování 53 00:02:32,742 --> 00:02:34,865 populací. Hodnocení genetické 54 00:02:34,865 --> 00:02:37,308 rozmanitosti a pomoc při programech v 55 00:02:37,308 --> 00:02:38,429 chovu v zajetí. 56 00:02:41,243 --> 00:02:42,845 Jaká se využívají data? 57 00:02:44,197 --> 00:02:46,600 Pro bioinformatické analýzy je potřeba 58 00:02:46,600 --> 00:02:49,323 mít internetové připojení, počítač, 59 00:02:49,483 --> 00:02:52,367 programy a vlastní data. Jako 60 00:02:52,367 --> 00:02:55,331 data jsou využívány sekvence DNA, 61 00:02:55,331 --> 00:02:58,174 RNA nebo proteinů, dále i 62 00:02:58,174 --> 00:03:00,737 data genomická, transkriptomická, 63 00:03:00,778 --> 00:03:02,820 proteomická, metabolomická, 64 00:03:03,301 --> 00:03:05,303 biologická či strukturální. 65 00:03:06,385 --> 00:03:08,627 Data pro bioinformatické analýzy se od 66 00:03:08,627 --> 00:03:10,910 počátku vkládají do online databázi. 67 00:03:11,791 --> 00:03:14,435 Na internetu jsou k dispozici na 2000 68 00:03:14,435 --> 00:03:17,238 databází k lednu 2024. 69 00:03:18,199 --> 00:03:20,202 Nejvýznamnější z větších databází jsou 70 00:03:20,202 --> 00:03:22,885 GenBank, ENA, Uniprot, 71 00:03:23,126 --> 00:03:24,928 a genomická databáze Ensemble. 72 00:03:28,042 --> 00:03:31,006 Na serverech, kde jsou databáze, jsou 73 00:03:31,006 --> 00:03:33,969 i nástroje pro hledání, přirovnání, 74 00:03:33,969 --> 00:03:36,292 neboli alignment a analýzu 75 00:03:36,292 --> 00:03:37,494 bioinformatických dat. 76 00:03:38,905 --> 00:03:41,349 Párový sekvenční eliment se používá k 77 00:03:41,349 --> 00:03:44,032 identifikaci oblastí podobnosti, které 78 00:03:44,032 --> 00:03:45,714 mohou naznačovat funkční 79 00:03:46,034 --> 00:03:48,838 strukturní anebo evoluční vztahy 80 00:03:49,158 --> 00:03:51,561 mezi dvěma sekvencemi 81 00:03:51,882 --> 00:03:54,165 proteinů nebo nukleových kyselin. 82 00:03:55,647 --> 00:03:58,410 Vícečetný sekvenční alignment MSA 83 00:03:58,851 --> 00:04:01,334 je zarovnání tří nebo více biologických 84 00:04:01,334 --> 00:04:04,257 sekvencí podobné délky. Z 85 00:04:04,257 --> 00:04:06,300 výstupu aplikací MSA lze odvodit 86 00:04:06,300 --> 00:04:08,903 homologii a studovat evoluční vztahy 87 00:04:09,063 --> 00:04:10,025 mezi sekvencemi. 88 00:04:12,908 --> 00:04:15,512 Základním nástrojem pro alignment dvou 89 00:04:15,512 --> 00:04:18,195 sekvencí je BLAST - Basic Local 90 00:04:18,195 --> 00:04:20,838 Aliment Search Tool, který se nachází na 91 00:04:20,838 --> 00:04:22,320 serveru NCBI. 92 00:04:23,682 --> 00:04:25,925 BLAST vyhledává oblasti podobností mezi 93 00:04:25,925 --> 00:04:28,328 biologickými sekvencemi. Program 94 00:04:28,328 --> 00:04:30,771 porovnává nukleidové nebo proteinové 95 00:04:30,771 --> 00:04:33,614 sekvence s databázemi sekvencí 96 00:04:33,895 --> 00:04:36,097 a vypočítává statistickou významnost. 97 00:04:37,019 --> 00:04:39,542 Lze přirovnat vlastní sekvenci s 98 00:04:39,542 --> 00:04:41,865 databázovými v databázi. 99 00:04:43,477 --> 00:04:45,239 Lze přirovnávat konkrétní dvě sekvence. 100 00:04:46,631 --> 00:04:49,514 Primárně jde však o lokální přiřazení. 101 00:04:51,367 --> 00:04:53,609 Jsou však k dispozici i programy pro 102 00:04:53,609 --> 00:04:54,811 globální přiřazení. 103 00:04:57,474 --> 00:05:00,158 Na evropském serveru Emble-EBI 104 00:05:00,598 --> 00:05:02,641 další nástroj pro párový sekvenční 105 00:05:02,641 --> 00:05:04,083 alignment EMBOS. 106 00:05:06,205 --> 00:05:08,969 Kdy použít lokální nebo globální 107 00:05:08,969 --> 00:05:11,462 alignment? Lokální 108 00:05:11,462 --> 00:05:14,225 například Smith-Watermanův algoritmus 109 00:05:14,906 --> 00:05:17,149 se používá u sekvencí odlišnějších, 110 00:05:17,590 --> 00:05:20,353 evolučně vzdálenější. Protože se 111 00:05:20,353 --> 00:05:23,077 omezí na přiřazování jednoznačných úseků 112 00:05:23,637 --> 00:05:25,760 a skončí tam, kde se sekvence rozcházejí 113 00:05:25,760 --> 00:05:26,881 nad únosnou míru. 114 00:05:28,894 --> 00:05:31,737 Globální přiřazení využívající například 115 00:05:31,737 --> 00:05:34,020 Niederman-Wunchův algoritmus 116 00:05:34,661 --> 00:05:36,864 je nejvhodnější pro sekvence, které jsou 117 00:05:36,864 --> 00:05:39,427 podobné a přibližně stejně dlouhé. 118 00:05:40,739 --> 00:05:42,661 A pokusí se sekvence přiřadit po celé 119 00:05:42,661 --> 00:05:45,585 délce i za cenu vnášení mezer do jedné z 120 00:05:45,585 --> 00:05:46,666 nich či do obou. 121 00:05:50,421 --> 00:05:52,824 Ukážeme si modelový postup alignmentu. 122 00:05:53,795 --> 00:05:56,559 Chceme zjistit, které dvě sekvence 123 00:05:56,799 --> 00:05:59,202 A a B nebo C a D si 124 00:05:59,482 --> 00:06:00,964 jsou vzájemně podobnější. 125 00:06:02,126 --> 00:06:04,248 Sekvence po celé délce přiložíme k 126 00:06:04,248 --> 00:06:06,972 sobě, to jest zapíšeme je do dvou pod 127 00:06:06,972 --> 00:06:09,815 sebou umístěných řádků tak, aby 128 00:06:09,815 --> 00:06:12,339 identické pozice baze či 129 00:06:12,339 --> 00:06:14,661 aminokyseliny ležely pod sebou. 130 00:06:15,663 --> 00:06:18,306 Každýmu páru a nepáru se přiřadí hodnota 131 00:06:18,306 --> 00:06:21,150 například 1 pro pár a 132 00:06:21,150 --> 00:06:23,993 0 pro nepár. Z 133 00:06:23,993 --> 00:06:26,637 obou elementů vyplývá, že jedna dvojice 134 00:06:26,637 --> 00:06:29,360 sekvencí A a B mají 8 135 00:06:29,360 --> 00:06:32,123 párů a dva nepáry a dvě 136 00:06:32,123 --> 00:06:34,847 dvojice sekvencí C a D mají 137 00:06:34,847 --> 00:06:36,729 17 párů a 3 nepáry. 138 00:06:37,650 --> 00:06:39,292 Které jsou však podobnější? 139 00:06:43,388 --> 00:06:45,550 Je třeba spočítat normalizované hodnoty 140 00:06:45,550 --> 00:06:48,544 podobnosti skóre. Můžeme 141 00:06:48,544 --> 00:06:50,627 porovnat míru podobností různě dlouhých 142 00:06:50,627 --> 00:06:52,229 dvojic sekvenci tím, že je 143 00:06:52,229 --> 00:06:55,032 znormalizujeme. Počet párů 144 00:06:55,032 --> 00:06:57,916 vynásobíme jejich hodnotou 1 a 145 00:06:57,916 --> 00:07:00,559 sečteme s počtem nepárů, které opět 146 00:07:00,559 --> 00:07:02,882 vynásobíme jejich hodnotou 0. 147 00:07:04,284 --> 00:07:05,726 Normalizované skóre 148 00:07:07,208 --> 00:07:09,731 určíme, když výši její spočítanou hodnotu, 149 00:07:09,731 --> 00:07:12,695 vydělíme délkou alignmentu. V našem 150 00:07:12,695 --> 00:07:15,178 případě má vyšší skóre 151 00:07:15,218 --> 00:07:18,141 element sekvencí C a D, a jsou si 152 00:07:18,141 --> 00:07:19,183 tedy podobnější. 153 00:07:23,518 --> 00:07:26,362 V dalším příkladě přirovnáváme dvě různě 154 00:07:26,362 --> 00:07:29,275 dlouhé sekvence. Kdybychom určili 155 00:07:29,275 --> 00:07:31,879 skóre u nepřiřazených sekvencí, 156 00:07:32,279 --> 00:07:35,043 pak by mělo hodnotu 6. Po 157 00:07:35,043 --> 00:07:37,966 přiřazení se skóre zvýšilo na 9. 158 00:07:39,128 --> 00:07:41,090 Skóre se zvyšuje vložením mezer. 159 00:07:41,811 --> 00:07:43,894 Mezera, tak zvyšuje počet přiřazených 160 00:07:43,894 --> 00:07:45,296 identických reziduí. 161 00:07:50,712 --> 00:07:53,276 Online nástrojů pro vícečetný 162 00:07:53,276 --> 00:07:55,999 sekvenční alliment MSA je mnohem 163 00:07:55,999 --> 00:07:58,512 více. Mezi nejstarší patří 164 00:07:58,512 --> 00:08:01,396 Clustal, ale byly postupně vyvinuty 165 00:08:01,396 --> 00:08:03,959 další algoritmy, jako je MAST 166 00:08:04,279 --> 00:08:06,883 Tea coffee, MUSCLE, 167 00:08:06,883 --> 00:08:09,806 KALIGN nebo Cobalt. Každý 168 00:08:09,806 --> 00:08:11,849 byl vyvinut pro různé typy sekvencí a 169 00:08:11,849 --> 00:08:12,690 jejich délek. 170 00:08:15,153 --> 00:08:17,676 Princip vícečetného sekvenčního 171 00:08:17,676 --> 00:08:20,640 elementu, který elementu tří a více 172 00:08:20,640 --> 00:08:23,203 sekvencí je podobný jako u BLASTu. 173 00:08:23,564 --> 00:08:25,646 Vychází se z párových alimentů. 174 00:08:26,287 --> 00:08:28,530 Výpočty jsou však více komplexnější, 175 00:08:29,331 --> 00:08:31,494 mohou tak být odhaleny mutace, jako jsou 176 00:08:31,494 --> 00:08:33,496 substituce nebo inzerce-delece. 177 00:08:34,718 --> 00:08:37,081 Tato přirovnání se používají k odvození 178 00:08:37,081 --> 00:08:39,844 evolučních vztahů pomocí fylogenetické 179 00:08:39,844 --> 00:08:42,808 analýzy a mohou zvýraznit homologické 180 00:08:42,808 --> 00:08:45,732 rysy mezi sekvencemi. Výsledkem 181 00:08:45,732 --> 00:08:48,455 může být fylogenetický strom vyjadřující 182 00:08:48,455 --> 00:08:50,377 evoluční vzdálenost mezi sekvencemi. 183 00:08:53,962 --> 00:08:55,484 Děkuji za vaši pozornost.