1 00:00:01,412 --> 00:00:04,017 Dobrý den, v této přednášce se budeme 2 00:00:04,017 --> 00:00:06,261 zabývat genomikou u hospodářských zvířat 3 00:00:06,581 --> 00:00:09,226 a především sekvenováním. Přednáška je 4 00:00:09,226 --> 00:00:11,550 součástí modulu 1 genetika zvířat. 5 00:00:12,111 --> 00:00:14,355 Vytvoření této prezentace bylo podpořeno 6 00:00:14,355 --> 00:00:16,999 garantem ERASMUS+ KA2 v rámci 7 00:00:17,039 --> 00:00:19,684 projektu ISAGREED, Inovace obsahu a 8 00:00:19,684 --> 00:00:22,208 struktury studijních programů v oblasti 9 00:00:22,208 --> 00:00:24,051 managementu živočišných, genetických a 10 00:00:24,051 --> 00:00:26,405 potravinových zdrojů s využitím 11 00:00:26,405 --> 00:00:27,006 digitalizace. 12 00:00:29,541 --> 00:00:31,985 Seklenování DNA je základní molekulárně 13 00:00:31,985 --> 00:00:34,750 genecká metoda. Metoda umožňuje přečíst 14 00:00:34,750 --> 00:00:37,194 genetickou informaci, která je uložena v 15 00:00:37,194 --> 00:00:39,678 formou sekvence neboli pořadí nukleotidů 16 00:00:39,678 --> 00:00:42,523 v molekule DNA. Na tomto obrázku 17 00:00:42,523 --> 00:00:44,246 uvádím přehled nejvýznamnějších 18 00:00:44,246 --> 00:00:46,530 sekvenčních metod od nejstarších 19 00:00:46,570 --> 00:00:49,215 po nejmodernějších. Chemická metoda 20 00:00:49,215 --> 00:00:51,899 založená na specifickém štěpení řetězce DNA 21 00:00:51,899 --> 00:00:54,063 a označovaná podle objevitelů jako 22 00:00:54,063 --> 00:00:56,858 Maxomova-Gilbertova byla 1 sekvenační 23 00:00:56,858 --> 00:00:59,012 metodou, nicméně dnes se už 24 00:00:59,052 --> 00:01:01,576 nepoužívá. Dodnes se využívá 25 00:01:01,576 --> 00:01:04,301 metoda objevená Frederickem Sangerem, po 26 00:01:04,301 --> 00:01:07,065 němž nese pojmenování. Označuje se též 27 00:01:07,065 --> 00:01:09,630 jako dideoxy metoda, protože využívá 28 00:01:09,630 --> 00:01:11,513 speciální modifikované nukleotidy 29 00:01:11,713 --> 00:01:14,398 takzvané koncové terminátory. Ty se 30 00:01:14,398 --> 00:01:16,041 přidávají do směsi k normálním 31 00:01:16,041 --> 00:01:18,365 nukleotidům a v případě jejich začlenění 32 00:01:18,365 --> 00:01:20,048 do řetězce se syntéza ukončuje. 33 00:01:20,929 --> 00:01:23,293 Pyrosekvenování a sekvenování pomocí 34 00:01:23,293 --> 00:01:25,497 hybridizace jsou alternativní metody, 35 00:01:26,349 --> 00:01:27,591 jejichž využití je v současnosti malé. 36 00:01:28,232 --> 00:01:30,315 Naopak seklenování nové generace (NGS) 37 00:01:31,107 --> 00:01:33,471 je velmi rozšířené a 38 00:01:33,471 --> 00:01:35,514 využívané z důvodu vysoké rychlosti 39 00:01:35,514 --> 00:01:38,279 a sekenační kapacity, neboť lze využít i na 40 00:01:38,279 --> 00:01:41,204 sekvenaci celých genomů a je označováno jako 41 00:01:41,204 --> 00:01:44,049 sekvenace 2. generace. Stále 42 00:01:44,049 --> 00:01:46,533 více se využívá metod založených na 43 00:01:46,533 --> 00:01:49,018 sekvenaci jednotlivé molekuly DNA 44 00:01:49,378 --> 00:01:51,943 označované jako sekvenování 3. generace. 45 00:01:52,824 --> 00:01:55,348 Velkou výhodou sekvenování je to, že 46 00:01:55,348 --> 00:01:57,071 umožňuje jednoduchou a přesnou 47 00:01:57,071 --> 00:01:58,955 identifikaci polymorfního místa, 48 00:01:59,726 --> 00:02:02,060 respektive mutace. Moderní 49 00:02:02,060 --> 00:02:04,905 automatické sekenátory jsou vhodné i pro 50 00:02:04,905 --> 00:02:06,187 přímou detekci polymorfizmů. 51 00:02:09,002 --> 00:02:10,605 Princip metody objevil v roce 52 00:02:10,605 --> 00:02:13,570 1977 anglický biochemik 53 00:02:13,570 --> 00:02:16,375 Frederick Sanger. Základem Sangerova 54 00:02:16,375 --> 00:02:18,819 sekvenování jsou dideoxynukleotidy 55 00:02:19,179 --> 00:02:22,024 označované ddNTP neboli 56 00:02:22,024 --> 00:02:24,749 koncové terminátory. Jedná se o 57 00:02:24,749 --> 00:02:27,153 modifikovaný nukleotid, který má 58 00:02:27,153 --> 00:02:30,078 odstraněnu vazebnou skupinu OH na 59 00:02:30,078 --> 00:02:32,883 3´ uhlíku deoxyribózy, která je 60 00:02:32,883 --> 00:02:35,367 nutná pro navázání dalšího nukleotidu. 61 00:02:36,229 --> 00:02:38,433 Po začlení ddNTP 62 00:02:39,184 --> 00:02:40,867 se tak syntéza řetězce zastaví, 63 00:02:41,388 --> 00:02:43,351 přičemž vznikne řetězec o velikosti a 64 00:02:43,351 --> 00:02:45,875 barvě odpovídající příslušnému 65 00:02:45,875 --> 00:02:47,238 nukleotidu na templátu. 66 00:02:50,573 --> 00:02:52,697 Proces sekvenace se skládá z několika 67 00:02:52,697 --> 00:02:55,261 kroků. Začíná přípravou vzorků, 68 00:02:55,582 --> 00:02:58,347 kterými je nejčastěji PCR produkt. Ten 69 00:02:58,347 --> 00:03:00,991 musí být přečištěn, aby obsahoval jen DNA 70 00:03:00,991 --> 00:03:03,556 templátu. Dále musíme znát 71 00:03:03,596 --> 00:03:05,279 alespoň přibližnou koncentraci. 72 00:03:06,160 --> 00:03:08,524 Vlastní sekvenační reakce je lineární 73 00:03:08,524 --> 00:03:11,369 cyklická enzymatická reakce, která musí 74 00:03:11,369 --> 00:03:14,054 obsahovat uvedené složky. Sekvenační 75 00:03:14,054 --> 00:03:16,378 primer nám vymezí začátek sekvenování, 76 00:03:17,179 --> 00:03:19,503 musí být použit vždy jen jeden, nikoliv 2 jako u PCR. 77 00:03:19,543 --> 00:03:22,458 Reakci katalizuje DNA 78 00:03:22,458 --> 00:03:24,341 polymeráza uvnitř reakčního kufru s 79 00:03:24,341 --> 00:03:27,307 přídavkem standardních dNTP (podobně 80 00:03:27,307 --> 00:03:30,151 jako u PCR) a navíc ddNTP. 81 00:03:30,151 --> 00:03:32,676 Následuje přečištění 82 00:03:32,676 --> 00:03:35,320 sekvenační reakce, kdy se musí odstranit 83 00:03:35,320 --> 00:03:37,404 volné značené ddNTP. 84 00:03:38,326 --> 00:03:40,209 Směs fragmentů je rozdělena pomocí 85 00:03:40,209 --> 00:03:42,974 kapilárníy elektroforézy v sekvenátoru a 86 00:03:42,974 --> 00:03:44,136 výsledek vyhodnocen. 87 00:03:46,309 --> 00:03:48,834 V současnosti se rutině využívá varianta 88 00:03:48,834 --> 00:03:51,358 označovaná jako čtyřbarevné terminátorové 89 00:03:51,358 --> 00:03:54,353 sekvenování. Jednotlivé terminační 90 00:03:54,353 --> 00:03:56,357 nukleotidy jsou značeny fluorescenčními 91 00:03:56,357 --> 00:03:58,881 barvami podle toho, jakou dusíkatou 92 00:03:58,881 --> 00:04:01,005 bázi nesou, resp. s jakým 93 00:04:01,005 --> 00:04:02,888 nukleotidem na templátu se párují. 94 00:04:03,649 --> 00:04:05,813 Působením polymerázy se syntetizují 95 00:04:05,813 --> 00:04:08,738 komplementární řetězce k tempátu, přičemž 96 00:04:08,738 --> 00:04:11,382 většinou jsou začleněni normální dNTP 97 00:04:11,663 --> 00:04:14,468 a řetězec se prodlouží, nahodile se, ale 98 00:04:14,468 --> 00:04:17,273 začleňují i ddNTP, které pak 99 00:04:17,273 --> 00:04:19,727 syntézu řetězce ukončí. Vzniklý 100 00:04:19,727 --> 00:04:22,251 fragment je označen fluorescenční barvou, která 101 00:04:22,251 --> 00:04:24,655 odpovídá nukleotidu na příslušné pozici 102 00:04:24,655 --> 00:04:25,136 templátu. 103 00:04:28,211 --> 00:04:30,936 Vzniká směs jednořetězcových, různě dlouhých 104 00:04:30,936 --> 00:04:33,500 a různě obarvených molekul. Abychom 105 00:04:33,500 --> 00:04:35,584 zjistili, na které pozici se vyskytuje 106 00:04:35,584 --> 00:04:37,948 která báze, musí proběhnout přesné 107 00:04:37,948 --> 00:04:40,312 elektroforetické rozdělení této směsi 108 00:04:40,312 --> 00:04:43,157 fragmentů. K tomu se využívá 109 00:04:43,157 --> 00:04:45,201 fluorescenční kapilární elektroforézy, 110 00:04:45,481 --> 00:04:47,004 která je základem genetických 111 00:04:47,004 --> 00:04:49,328 analyzátorů, neboli sekvenátorů. 112 00:04:50,009 --> 00:04:52,012 Tento přístroj dokáže fragmenty nejen 113 00:04:52,012 --> 00:04:54,617 rozdělit dle velikosti, ale přímo 114 00:04:54,617 --> 00:04:57,181 odečíst sekvenci nukleotidů na základě 115 00:04:57,181 --> 00:04:59,545 různobarevných píků. Například 116 00:04:59,545 --> 00:05:01,228 syntetizovaný řetězec dlouhý 100 117 00:05:01,228 --> 00:05:04,113 nukleotidů svítí zeleně, tj. v pozici 118 00:05:04,113 --> 00:05:06,838 100 templátu byl adenin, řetězec 119 00:05:06,838 --> 00:05:09,693 dlouhý 101 svítí červeně, tzn. 120 00:05:09,693 --> 00:05:11,896 v pozici 101 byl tymin a tak podobně. 121 00:05:14,451 --> 00:05:16,494 Sangerova metoda je nejrozšířenější 122 00:05:16,494 --> 00:05:18,858 sekvenační metodou. Mezi její 123 00:05:18,858 --> 00:05:21,623 výhody patří čtení relativně dlouhých 124 00:05:21,623 --> 00:05:24,228 řetězců DNA (cca 125 00:05:24,228 --> 00:05:26,872 800 párů bází) a zároveň vysoká 126 00:05:26,872 --> 00:05:29,116 přesnost a spolehlivost. Pokud 127 00:05:29,116 --> 00:05:31,240 potřebujeme znát sekvenci nebo detekovat 128 00:05:31,240 --> 00:05:33,804 mutaci v konkrétním úseku genomu u jednoho nebo 129 00:05:33,804 --> 00:05:36,329 několika málo jedinců, tak se jedná o 130 00:05:36,329 --> 00:05:38,733 cenově nejvýhodnější variantu. Ve 131 00:05:38,733 --> 00:05:41,658 srovnání s metodami NGS je však výkon 132 00:05:41,658 --> 00:05:43,942 a cena za 1 osekvenovanou bázi velmi vysoká, 133 00:05:44,753 --> 00:05:46,236 metoda tedy není vhodná na sekvenování 134 00:05:46,236 --> 00:05:49,000 velkých úseků genomu, nebo dokonce celých 135 00:05:49,000 --> 00:05:49,281 genomů. 136 00:05:52,727 --> 00:05:55,131 Pro sekvenování celých genomů je vhodnější 137 00:05:55,131 --> 00:05:57,415 použít další metodu, a to takzvané 138 00:05:57,415 --> 00:06:00,139 sekvenování nové generace, ve zkratce 139 00:06:00,300 --> 00:06:03,145 NGS. Z tohoto důvodu se metoda 140 00:06:03,145 --> 00:06:05,709 označuje též jako celognomové seklenování 141 00:06:06,030 --> 00:06:08,113 nebo té jako sekvenování 2. generace. 142 00:06:08,875 --> 00:06:11,399 Metoda je založena na fragmentaci DNA 143 00:06:11,399 --> 00:06:13,883 a sekvenování krátkých fragmentů, ale v 144 00:06:13,883 --> 00:06:16,488 obrovském množství současně a označuje se 145 00:06:16,488 --> 00:06:19,052 tak jako masivní paralelní sekvenování. 146 00:06:19,853 --> 00:06:21,817 Metoda umožňuje obecně velmi vysokou 147 00:06:21,817 --> 00:06:24,381 kapacitu sekvenování, nicméně lze si 148 00:06:24,381 --> 00:06:26,896 vybrat varianty sekvenátorů s 149 00:06:26,896 --> 00:06:29,300 kapacitou podle vlastních potřeb 150 00:06:29,300 --> 00:06:32,145 od 151 00:06:32,145 --> 00:06:34,709 1 gigabáze po 8 terabází, 152 00:06:34,709 --> 00:06:36,993 což znamená 8 miliard bází. 153 00:06:39,617 --> 00:06:42,502 Mezi běžně rozšířené NGS sekvenátory patří 154 00:06:42,502 --> 00:06:45,467 přístroje firmy Illumina. Základem 155 00:06:45,467 --> 00:06:48,352 metody je takzvaná můstková PCR 156 00:06:48,352 --> 00:06:50,316 a sekvenace při syntéze s využitím 157 00:06:50,316 --> 00:06:53,000 čtyřbaroevné fluorescence. Vlastní 158 00:06:53,000 --> 00:06:55,004 sekvenace probíhá v klastrech stejné 159 00:06:55,004 --> 00:06:57,608 sekvence - barevně svítí příslušný 160 00:06:57,608 --> 00:07:00,493 spot podle báze. Sekvenují se 161 00:07:00,493 --> 00:07:02,978 úseky o velikosti od 150 do 300 162 00:07:02,978 --> 00:07:05,582 nukleotidů. Podrobnější vysvětlení je 163 00:07:05,582 --> 00:07:08,086 nad časový rámec této přednášky a 164 00:07:08,086 --> 00:07:10,410 zájemcům o pochopení této poměrně složité 165 00:07:10,410 --> 00:07:12,855 metody doporučuji shlédnutí videí na 166 00:07:12,975 --> 00:07:13,456 internetu. 167 00:07:16,140 --> 00:07:18,224 Sekvenování nové generace je dnes velmi 168 00:07:18,224 --> 00:07:20,107 využívaným nástrojem v genetice pro 169 00:07:20,107 --> 00:07:22,671 výzkum i diagnostiku. Vysoká 170 00:07:22,671 --> 00:07:24,875 kapacita metody umožňuje během několika 171 00:07:24,875 --> 00:07:27,720 hodin až dnů získat sekvenci i velkých 172 00:07:27,720 --> 00:07:30,244 genomů zvířat, například savců, jejichž 173 00:07:30,244 --> 00:07:32,248 velikost se pohybuje kolem tří miliard 174 00:07:32,248 --> 00:07:34,892 nukleotidů, což by metodou Sangerova 175 00:07:34,892 --> 00:07:37,858 sekvenování byla práce na několik let. Je 176 00:07:37,858 --> 00:07:39,661 možné takto získat celou genetickou 177 00:07:39,661 --> 00:07:41,995 informaci v jedince. Umožňuje proto 178 00:07:41,995 --> 00:07:43,597 nalézt velké množství nových nebo 179 00:07:43,597 --> 00:07:45,681 detekovat všechny známé polymorfismy a 180 00:07:45,681 --> 00:07:47,995 mutace. Vzniká, ale problém se 181 00:07:47,995 --> 00:07:50,559 zpracováním a vyhodnocením velkého množství dat, 182 00:07:50,840 --> 00:07:53,004 a proto je třeba využít velmi výkonných 183 00:07:53,004 --> 00:07:54,526 bioinformatických nástrojů. 184 00:07:55,247 --> 00:07:57,131 Celogenomová data jsou uložena v 185 00:07:57,131 --> 00:07:59,254 genomových databázích jednotlivých 186 00:07:59,254 --> 00:08:01,859 organismů, lze tak provádět srovnání s 187 00:08:01,859 --> 00:08:04,503 konkrétním vzorkem. Metoda má význam i 188 00:08:04,503 --> 00:08:06,627 pro sekvenování jednotlivce, např. 189 00:08:06,627 --> 00:08:08,831 pacienta, čemuž se věnuje obor 190 00:08:08,831 --> 00:08:09,953 personálních genomika. 191 00:08:12,277 --> 00:08:14,641 Jako sekvenování 3. generace jsou 192 00:08:14,641 --> 00:08:17,125 označovány sekvenační techniky založené na 193 00:08:17,125 --> 00:08:19,970 sekvenování jednotlivé molekuly. Výhodou 194 00:08:19,970 --> 00:08:22,294 jsou dlouhá čtení, v případě de novo 195 00:08:22,294 --> 00:08:25,139 seklenování až 7 kilobází. To 196 00:08:25,139 --> 00:08:27,303 umožňuje správně identifikovat varianty na 197 00:08:27,303 --> 00:08:30,067 jednom řetězci, tzv. haplotypy, což 198 00:08:30,067 --> 00:08:32,351 čtení krátkých sekvencí u 2. generace 199 00:08:32,351 --> 00:08:34,715 neumožňuje. Metoda je postupně 200 00:08:34,715 --> 00:08:36,839 zdokonalována, protože chybovost čtení 201 00:08:36,839 --> 00:08:38,963 je zatím ve srovnání s oběma předchozími 202 00:08:38,963 --> 00:08:41,647 generacemi vyšší. Dostupná je metoda 203 00:08:41,647 --> 00:08:44,091 označovaná jako Single molecul real time 204 00:08:44,091 --> 00:08:46,776 sequencing od firmy 205 00:08:46,776 --> 00:08:49,100 Pacific Bioscience nebo nanopórové 206 00:08:49,100 --> 00:08:51,504 sekvenátory firmy Oxford 207 00:08:51,504 --> 00:08:52,105 Nanopore. 208 00:08:55,090 --> 00:08:57,655 Výsledky celogenomového sekvenování 209 00:08:57,855 --> 00:09:00,339 jsou uloženy v genomových databázích a 210 00:09:00,339 --> 00:09:02,543 často volně dostupné. Například 211 00:09:02,543 --> 00:09:05,108 internetová databáze NCBI 212 00:09:05,148 --> 00:09:07,632 umožňuje prohlížení až na úroveň sekvence 213 00:09:07,632 --> 00:09:09,275 jednotlivých nukleotidů genu. 214 00:09:11,989 --> 00:09:14,113 Dalším praktickým využitím sekvenování 215 00:09:14,113 --> 00:09:16,197 živočichů je druhová identifikace. 216 00:09:16,798 --> 00:09:19,322 Molekulární taxonomie využívá takzvaný DNA 217 00:09:19,322 --> 00:09:22,007 barcoding, který umožňuje identifikovat 218 00:09:22,007 --> 00:09:24,211 druh, kde to nelze klasickou metodou 219 00:09:24,451 --> 00:09:27,095 například u larev hmyzu. Využívá se k 220 00:09:27,095 --> 00:09:29,099 tomuto účelu především fragmentů genu 221 00:09:29,099 --> 00:09:31,784 pro cytochrom C oxidázu 1, který leží v 222 00:09:31,784 --> 00:09:34,668 mitochondriální DNA. Tento fragment je 223 00:09:34,668 --> 00:09:37,353 osekvenován obvykle Sangerovou metodou a 224 00:09:37,353 --> 00:09:39,677 druhová identifikace provedena srovnáním s 225 00:09:39,677 --> 00:09:42,512 určenými sekvencemi uloženými v databázi 226 00:09:42,512 --> 00:09:44,796 BOLD nebo BLAST. Výhodou 227 00:09:44,796 --> 00:09:47,400 mitochondriální DNA je více kopií, to 228 00:09:47,400 --> 00:09:49,604 znamená větší množství DNA na množství 229 00:09:49,604 --> 00:09:52,289 biologického materiálu a vyšší stabilita. 230 00:09:52,770 --> 00:09:54,613 Využívá se tak i pro determinaci 231 00:09:54,613 --> 00:09:56,937 starších či muzejních vzorků. 232 00:09:57,498 --> 00:09:59,381 Nevýhodou je možnost kontaminace 233 00:09:59,381 --> 00:10:02,106 bakteriálním genomem, např. Wolbachia 234 00:10:02,306 --> 00:10:05,151 a podobně. Na 235 00:10:05,151 --> 00:10:07,355 tomto obrázku je ukázka konkrétní 236 00:10:07,355 --> 00:10:09,078 sekvence získané sekvenování 237 00:10:09,078 --> 00:10:11,522 mitochondriální DNA u starého 238 00:10:11,522 --> 00:10:12,564 muzejního vzorku. 239 00:10:17,352 --> 00:10:19,596 Vložením sekvence do internetového 240 00:10:19,596 --> 00:10:22,561 srovnávacího nástroje Blast se podařilo 241 00:10:22,561 --> 00:10:24,925 druh na základě homologie identifikovat. 242 00:10:32,598 --> 00:10:35,403 A nyní je přednáška u konce. Věříme, 243 00:10:35,563 --> 00:10:37,727 že jste pochopili základní principy jedné z 244 00:10:37,727 --> 00:10:39,690 nejdůležitějších molekulárně-genetických 245 00:10:39,690 --> 00:10:42,455 metod - sekvenování. Doporučuji i 246 00:10:42,455 --> 00:10:44,338 shlédnutí navazující prezentace 247 00:10:44,338 --> 00:10:47,223 laboratorní příklady. Děkuji za pozornost.