1 00:00:00,880 --> 00:00:06,770 Dobrý deň, rada by som Vás privítala na prednáške pre doktorandský stupeň štúdia. 2 00:00:06,840 --> 00:00:11,920 Táto prednáška bude zameraná na podrobnú analýzu štruktúry populácie na základe 3 00:00:11,986 --> 00:00:17,370 genomických údajov a kvantifikáciu vplyvu selekcie na genóm hospodárskych zvierat. 4 00:00:17,440 --> 00:00:24,280 Táto prednáška je súčasťou výstupov projektu ISAGREED a môžete ju nájsť v 5 00:00:24,346 --> 00:00:29,330 module 2 "Konzervovanie a udržateľné využívanie genetických zdrojov". 6 00:00:29,400 --> 00:00:33,240 Prednášku spolu so mnou pripravoval pán profesor Kasarda. 7 00:00:33,306 --> 00:00:37,360 Obidvaja pracujeme na Slovenskej poľnohospodárskej univerzite v Nitre, na 8 00:00:37,426 --> 00:00:43,890 Fakulte agrobiológie a potravinových zdrojov a Ústave výživy a genomiky. 9 00:00:43,960 --> 00:00:47,970 Táto prednáška bude pozostávať zo štyroch častí. 10 00:00:48,040 --> 00:00:53,120 Budeme hovoriť samostatne o kontrole kvality genomických údajov, o prístupoch a 11 00:00:53,186 --> 00:00:59,400 nástrojoch, ktoré možno použiť na analýzu populačnej štruktúry a súčasne o 12 00:00:59,466 --> 00:01:03,480 prístupoch a nástrojoch, ktoré možno využiť na vyhodnotenie vplyvu selekcie 13 00:01:03,546 --> 00:01:05,730 na genóm hospodárskych zvierat. 14 00:01:05,800 --> 00:01:10,760 V poslednej časti sa budeme zaoberať funkčnou anotáciou oblastí signifikantne 15 00:01:10,826 --> 00:01:14,010 ovplyvnených selekčným tlakom. 16 00:01:14,080 --> 00:01:19,840 Kontrola kvality genomických údajov je kľúčová a treba ju realizovať pred 17 00:01:19,906 --> 00:01:25,160 akoukoľvek analýzou v súvislosti s genomickými dátami alebo aj 18 00:01:25,226 --> 00:01:28,450 s akýmkoľvek iným typom dát. 19 00:01:28,520 --> 00:01:33,680 Informácie, ktoré budú na nasledujúcich slajdoch, sa týkajú 20 00:01:33,746 --> 00:01:40,530 kontroly kvality genomických údajov, ktoré boli získané použitím SNP čipov. 21 00:01:40,600 --> 00:01:46,280 Pokiaľ máme dáta, ktoré sú nesprávne alebo nekvalitné, tieto môžu viesť k chybám v 22 00:01:46,346 --> 00:01:51,400 nasledujúcich analýzach a čo je dôležité, môžu viesť aj k chybnej 23 00:01:51,466 --> 00:01:54,450 interpretácii samotných výsledkov. 24 00:01:54,520 --> 00:02:01,240 Medzi základné ukazovatele kvality dát patrí úspešnosť genotypovania SNP markerov 25 00:02:01,306 --> 00:02:05,800 celkovo v rámci populácie a potom úspešnosť genotypovania 26 00:02:05,866 --> 00:02:08,690 týchto markerov v rámci jedincov. 27 00:02:08,760 --> 00:02:13,370 Okrem toho sa často vyhodnocuje aj frekvencia minoritnej alely, 28 00:02:13,440 --> 00:02:17,080 odchýlka od Hardy-Weinbergovej rovnováhy či miera väzbovej 29 00:02:17,146 --> 00:02:19,530 nerovnováhy medzi markermi. 30 00:02:19,600 --> 00:02:26,210 Výber ukazovateľov, ktoré budú použité v kontrole kvality dát, zvyčajne závisí od 31 00:02:26,280 --> 00:02:32,730 typu alebo cieľa analýz, ktoré plánujeme realizovať v nasledovných krokoch. 32 00:02:32,800 --> 00:02:37,920 Čo sa týka takých štandardných nastavení, v prípade analýz orientovaných na 33 00:02:37,986 --> 00:02:42,000 hodnotenie genotypovej štruktúry populácie, resp. 34 00:02:42,066 --> 00:02:48,450 štruktúry populácie ako takej, zvyčajne sa využíva kontrola kvality 35 00:02:48,520 --> 00:02:54,920 alebo úspešnosti genotypovania SNP markerov celkovo a v rámci jedincov, kde 36 00:02:54,986 --> 00:03:00,520 zvyčajne v štúdiách môžete nájsť, že sa selektuje všetky markery, ktoré boli 37 00:03:00,586 --> 00:03:05,850 úspešne genotypované u minimálne 90% jedincov. 38 00:03:05,920 --> 00:03:11,760 Okrem toho sa zvyčajne aj selektujú markery, ktorých frekvencia minoritnej 39 00:03:11,826 --> 00:03:15,370 alely v populácii je minimálne 1%. 40 00:03:15,440 --> 00:03:21,360 Toto 1% vyplýva z Mendelistickej dedičnosti a okrem toho sa z 41 00:03:21,426 --> 00:03:27,170 populácie selektujú aj markery, ktoré nie sú v Hardy-Weinbergovej 42 00:03:27,240 --> 00:03:32,440 rovnováhe, pretože na základe viacerých štúdií bolo dokázané, 43 00:03:32,506 --> 00:03:37,920 že hodnotenie genotypovej štruktúry populácie by malo prebiehať s použitím 44 00:03:37,986 --> 00:03:40,970 markerov, ktoré sú selektívne neutrálne. 45 00:03:41,040 --> 00:03:46,000 Na kontrolu kvality genotypových dát je možné využiť rôzne softvérové 46 00:03:46,066 --> 00:03:48,290 nástroje alebo programy. 47 00:03:48,360 --> 00:03:53,240 Čo sa týka SNP dát, tak zvyčajne sa používa program PLINK alebo 48 00:03:53,306 --> 00:03:56,650 iné balíky v programe R. 49 00:03:56,720 --> 00:04:03,090 Čo nám SNP dáta vlastne umožňujú z pohľadu hodnotenia populačnej štruktúry? 50 00:04:03,160 --> 00:04:08,930 Umožňujú nám analyzovať genetickú diferenciáciu v rámci a medzi populáciami. 51 00:04:09,000 --> 00:04:14,970 Umožňujú nám napríklad aj hodnotiť mieru ich genetického premiešania alebo admixie 52 00:04:15,040 --> 00:04:21,250 a rovnako tak aj zmeny, ktoré v dôsledku takéhoto genetického premiešania v genóme 53 00:04:21,320 --> 00:04:27,000 vzniknú napríklad vplyvom selekcie, migrácie alebo genetického driftu a 54 00:04:27,066 --> 00:04:32,680 súčasne nám umožňujú stanovovať aj také základné parametre diverzity, ako je 55 00:04:32,746 --> 00:04:37,880 genomická matica príbuznosti, genomický inbríding a následne nám umožňujú 56 00:04:37,946 --> 00:04:41,920 optimalizovať priparovacie plány. 57 00:04:42,120 --> 00:04:48,720 Medzi najčastejšie typy analýz, ktoré sú realizované v súvislosti s hodnotením 58 00:04:48,786 --> 00:04:54,770 populačnej štruktúry, patrí výpočet Wrightovho fixačného indexu FST, 59 00:04:54,840 --> 00:05:00,930 výpočet genetických vzdialeností a matíc príbuznosti, analýza hlavných komponentov, 60 00:05:01,000 --> 00:05:04,880 diskriminačná analýza hlavných komponentov, bayesovská 61 00:05:04,946 --> 00:05:10,280 analýza genetického premiešania, toku génov medzi populáciami či konštrukcia 62 00:05:10,346 --> 00:05:14,760 fylogenetických stromov a genetických sietí. 63 00:05:14,840 --> 00:05:19,680 Wrightov fixačný index je jedným z takých základných parametrov, ktoré sa naozaj 64 00:05:19,746 --> 00:05:25,050 používajú na vyhodnotenie populačnej štruktúry často. 65 00:05:25,120 --> 00:05:29,840 On v podstate umožňuje stanoviť, aký je stupeň genetickej podobnosti 66 00:05:29,906 --> 00:05:31,890 medzi populáciami. 67 00:05:31,960 --> 00:05:38,360 Môže nadobúdať hodnoty od 0 po 1, pričom ak by medzi dvoma populáciami bola zistená 68 00:05:38,426 --> 00:05:42,560 hodnota tohto indexu 0, mohli by sme povedať, že populácie 69 00:05:42,626 --> 00:05:44,610 sú geneticky identické. 70 00:05:44,680 --> 00:05:50,730 A naopak, ak by medzi populáciami bola zistená hodnota 1, tak populácie by sme 71 00:05:50,800 --> 00:05:56,610 označili za absolútne nepríbuzné a geneticky úplne diferencované, pretože 72 00:05:56,680 --> 00:06:00,760 vo svojom genóme vykazujú úplne odlišné frekvencie alel. 73 00:06:00,826 --> 00:06:05,690 čo sa týka výhod a nevýhod tohto prístupu, 74 00:06:05,760 --> 00:06:10,530 tak medzi hlavné výhody stanovenia Wrightovho fixačného indexu FST 75 00:06:10,600 --> 00:06:15,250 patrí hlavne jednoduchosť interpretácie získaných výsledkov. 76 00:06:15,320 --> 00:06:22,330 Táto metóda je aj rovnako pomerne rýchla, nie je náročná na softvérové vybavenie 77 00:06:22,400 --> 00:06:26,320 a umožňuje relatívne spoľahlivo identifikovať mieru 78 00:06:26,386 --> 00:06:29,010 diferenciácie medzi populáciami. 79 00:06:29,080 --> 00:06:33,280 Čo sa týka nevýhod, tak Wrigtov fixačný index nie je možné stanoviť 80 00:06:33,346 --> 00:06:35,410 na individuálnej úrovni. 81 00:06:35,480 --> 00:06:40,410 To znamená, že pomocou Wrightovho fixačného indexu nevieme kvantifikovať 82 00:06:40,480 --> 00:06:44,920 genetické vzťahy medzi jedincami, ale vieme ho využiť len na hodnotenie 83 00:06:44,986 --> 00:06:47,850 genetických vzťahov medzi populáciami. 84 00:06:47,920 --> 00:06:53,600 Niekedy vykazuje nižšiu spoľahlivosť hlavne v populáciách, ktoré majú relatívne 85 00:06:53,666 --> 00:06:58,960 nízku úroveň genetickej variability alebo diverzity. 86 00:06:59,160 --> 00:07:04,720 Medzi najčastejšie využívané balíky na stanovenie tohto indexu patria napr. 87 00:07:04,786 --> 00:07:07,530 Arlequin, Genepop alebo GenAlEx. 88 00:07:07,600 --> 00:07:12,490 Tieto sú však limitované z pohľadu počtu SNP markerov, ktoré sú 89 00:07:12,560 --> 00:07:14,890 zahrnuté do analýzy. 90 00:07:14,960 --> 00:07:21,200 V prípade, ak máme SNP dáta alebo dáta získané použitím genotypovania 91 00:07:21,266 --> 00:07:24,450 jedincov pomocou SNP čipov 92 00:07:24,520 --> 00:07:29,410 môžeme použiť napríklad balík programu R s názvom StAMPP. 93 00:07:29,480 --> 00:07:34,320 Na obrázku môžete vidieť grafickú vizualizáciu matice genetických 94 00:07:34,386 --> 00:07:38,730 vzdialeností odhadnutých na základe FST indexu 95 00:07:38,800 --> 00:07:44,170 a tento obrázok je v podstate dendrogramom, 96 00:07:44,240 --> 00:07:49,080 na ktorom je jasne viditeľné, že v danej populácii hovädzieho dobytka nám 97 00:07:49,146 --> 00:07:53,210 dochádza k vzniku dvoch genetických skupín. 98 00:07:53,280 --> 00:08:00,200 Táto analýza bola realizovaná v rámci šestnástich plemien hovädzieho dobytka. 99 00:08:00,320 --> 00:08:06,610 Čo sa týka matíc príbuznosti, tak matice príbuznosti nám už umožňujú determinovať 100 00:08:06,680 --> 00:08:10,360 vzájomnú genetickú podobnosť medzi jedincami, čiže umožňujú nám 101 00:08:10,426 --> 00:08:14,210 hodnotenie na individuálnej úrovni. 102 00:08:14,280 --> 00:08:18,920 Matice príbuznosti vyjadrujú genetické podobnosti a príbuznosť medzi jedincami v 103 00:08:18,986 --> 00:08:24,400 rámci populácie, pričom každý jeden prvok matice predstavuje mieru genetickej 104 00:08:24,466 --> 00:08:27,090 podobnosti medzi dvojicou jedincov. 105 00:08:27,160 --> 00:08:32,040 Najčastejšie sa matice príbuznosti počítajú na základe metód odvodených 106 00:08:32,106 --> 00:08:34,930 od frekvencií alel, ale samotný 107 00:08:35,000 --> 00:08:40,970 výpočet môže byť založený na rôznych prístupoch, napríklad na 108 00:08:41,040 --> 00:08:45,920 IBD, čo je identita podľa pôvodu alebo môže byť založený na Neiových 109 00:08:45,986 --> 00:08:48,050 genetických vzdialenostiach. 110 00:08:48,120 --> 00:08:53,600 Medzi také základné výhody počítania alebo stanovenia matic príbuznosti patria 111 00:08:53,666 --> 00:08:57,890 pomerne presné odhady genetickej podobnosti medzi jedincami 112 00:08:57,960 --> 00:09:02,040 a tento prístup je naozaj vhodný na štúdium vnútro-populačných vzťahov, 113 00:09:02,106 --> 00:09:04,730 nielen vzťahov medzi populáciami. 114 00:09:04,800 --> 00:09:12,720 Avšak v prípade niektorých metód na výpočet môže byť aj časovo náročný. 115 00:09:12,880 --> 00:09:19,280 Na obrázku máte znázornenú grafickú vizualizáciu matice príbuznosti 116 00:09:19,346 --> 00:09:25,090 počítanej na základe Neiových genetických vzdialeností v rámci piatich plemien psov, 117 00:09:25,160 --> 00:09:31,770 pričom jedince, ktoré sú viac geneticky podobné, sú na obrázku znázornené 118 00:09:31,840 --> 00:09:34,450 sýtejším odtieňom oranžovej. 119 00:09:34,520 --> 00:09:39,920 Vidíme, že naozaj na základe genetickej podobnosti jedincov nám dochádza v takejto 120 00:09:39,986 --> 00:09:43,090 populácii k vytvoreniu piatich klastrov, 121 00:09:43,160 --> 00:09:47,600 ktoré sú odvodené od pôvodu jednotlivých 122 00:09:47,666 --> 00:09:51,410 jedincov, respektíve od ich plemennej príslušnosti. 123 00:09:51,480 --> 00:09:57,640 Medzi základné softvérové nástroje z pohľadu výpočtu matíc príbuznosti patrí 124 00:09:57,706 --> 00:10:03,010 napríklad PLINK, pomocou ktorého vieme vypočítať práve maticu príbuznosti 125 00:10:03,080 --> 00:10:09,330 odvodenú od spoločného pôvodu 126 00:10:09,400 --> 00:10:14,120 predkov, alebo môžeme použiť zase rôzne balíky v programe R, ako 127 00:10:14,186 --> 00:10:17,960 je napríklad balík StAMPP. 128 00:10:18,200 --> 00:10:23,610 Analýza hlavných komponentov je naozaj populárnou metódou a nevyužíva sa iba 129 00:10:23,680 --> 00:10:28,960 pre stanovenie alebo pre odhad genetickej štruktúry populácie alebo stupňa 130 00:10:29,026 --> 00:10:34,320 genetickej diferenciácie v rámci populácií, ale využíva sa aj na rôzne 131 00:10:34,386 --> 00:10:37,610 iné účely v iných vedných odboroch. 132 00:10:37,680 --> 00:10:44,280 Táto metóda je v podstate založená na dekomponovaní kovariačnej matice 133 00:10:44,346 --> 00:10:49,560 genetických dát a extrahovaní hlavných komponentov, ktoré reflektujú 134 00:10:49,626 --> 00:10:53,490 variabilitu v súbore dát, ktorý hodnotíme. 135 00:10:53,560 --> 00:10:59,570 Zvyčajne platí, že najväčšiu mieru variability v danom súbore dát 136 00:10:59,640 --> 00:11:02,930 vyjadrujú prvé dva hlavné komponenty. 137 00:11:03,000 --> 00:11:08,400 Táto analýza je veľmi populárna aj preto, že pomerne dobre reflektuje základné 138 00:11:08,466 --> 00:11:13,840 informácie o genetickej štruktúre, čo je užitočné hlavne pokiaľ testujeme 139 00:11:13,906 --> 00:11:16,810 databázy s veľkým počtom jedincov. 140 00:11:16,880 --> 00:11:22,570 Medzi jej základné výhody patrí časová nenáročnosť tejto metódy 141 00:11:22,640 --> 00:11:28,000 a rovnako aj pomerne jednoducho a dobre interpretované výsledky na základe 142 00:11:28,066 --> 00:11:32,690 vizualizácie, ktorú uvidíte na nasledujúcom slajde. 143 00:11:32,760 --> 00:11:37,880 A medzi nevýhody patrí napríklad pomerne nízka citlivosť z pohľadu testovania 144 00:11:37,946 --> 00:11:41,970 genetického premiešania alebo admixie. 145 00:11:42,040 --> 00:11:48,130 Tak ako som hovorila, na tomto slajde môžete vidieť príklad 146 00:11:48,200 --> 00:11:53,490 vizualizácie výsledkov analýzy hlavných komponentov, 147 00:11:53,560 --> 00:11:59,880 pričom genetická diferenciácia v rámci tejto populácie, ktorá je tvorená 148 00:11:59,946 --> 00:12:04,920 šestnástimi rôznymi plemenami oviec, je vizualizovaná na základe 149 00:12:04,986 --> 00:12:07,210 prvého a druhého komponentu. 150 00:12:07,280 --> 00:12:12,930 Vidíme, že v danej populácii nám došlo k vytvoreniu troch 151 00:12:13,000 --> 00:12:18,600 genetických skupín alebo genetických klastrov, pričom na obrázku každá jedna 152 00:12:18,666 --> 00:12:22,890 bodka znázorňuje jedinca v danej populácii. 153 00:12:22,960 --> 00:12:29,080 Bližšia analýza týchto jedincov nám naozaj potvrdila, že jedince vytvárajú genetické 154 00:12:29,146 --> 00:12:35,920 skupiny podľa ich plemennej príslušnosti, respektíve ich historického alebo 155 00:12:35,986 --> 00:12:38,490 fylogenetického prepojenia v minulosti. 156 00:12:38,560 --> 00:12:43,120 Čo sa týka softvérových nástrojov, tak zasa na analýzu hlavných komponentov 157 00:12:43,186 --> 00:12:48,440 môžeme použiť napríklad program PLINK alebo rôzne balíky programu R, 158 00:12:48,506 --> 00:12:52,800 ako je napríklad balík Adegenet. 159 00:12:53,200 --> 00:12:57,960 Ďalšou populárnou metódou z pohľadu analýzy populačnej štruktúry je 160 00:12:58,026 --> 00:13:01,650 diskriminačná analýza hlavných komponentov. 161 00:13:01,720 --> 00:13:06,840 Diskriminačná analýza hlavných komponentov je zameraná hlavne na vizualizáciu 162 00:13:06,906 --> 00:13:12,730 genetickej štruktúry medzi preddefinovanými skupinami alebo aj klastrami. 163 00:13:12,800 --> 00:13:13,480 Využíva ako už vyplýva z názvu 164 00:13:13,546 --> 00:13:18,400 analýzu hlavných komponentov na redukciu 165 00:13:18,466 --> 00:13:23,160 dimenzie dát a následne diskriminačnú analýzu na maximalizáciu 166 00:13:23,226 --> 00:13:26,010 rozlíšenia medzi populáciami. 167 00:13:26,080 --> 00:13:30,480 Diskriminačná analýza hlavných komponentov v porovnaní s klasickou analýzou 168 00:13:30,546 --> 00:13:36,400 hlavných komponentov poskytuje častokrát presnejšie zobrazenie genetickej štruktúry 169 00:13:36,466 --> 00:13:38,680 medzi vopred definovanými skupinami. 170 00:13:38,746 --> 00:13:44,800 napríklad odlišnými genetickými subpopuláciami alebo subpopuláciami, ktoré 171 00:13:44,866 --> 00:13:48,930 môžu teoreticky alebo aj vykazujú genetické premiešanie. 172 00:13:49,000 --> 00:13:53,720 Medzi jej hlavné výhody patrí vysoká presnosť pri detekcii rozdielov medzi 173 00:13:53,786 --> 00:13:58,720 populáciami, rovnako ako aj jednoduchá a dobre interpretovateľná 174 00:13:58,786 --> 00:14:00,930 vizualizácia výsledkov. 175 00:14:01,000 --> 00:14:06,120 A medzi nevýhody patrí preddefinovanie samotných skupín, pretože toto môže 176 00:14:06,186 --> 00:14:13,000 skresliť výsledok hlavne v súvislosti s kvantifikáciou miery premiešania medzi 177 00:14:13,066 --> 00:14:18,400 populáciami a rovnako táto metóda môže byť citlivá na nízku úroveň diverzity 178 00:14:18,466 --> 00:14:21,130 alebo vysokú mieru príbuznosti. 179 00:14:21,200 --> 00:14:26,000 Na tejto snímke máme znázornené reprezentatívne výsledky diskriminačnej 180 00:14:26,066 --> 00:14:28,600 analýzy hlavných komponentov. 181 00:14:28,666 --> 00:14:31,290 Jedná sa o obrázok A, C a D. 182 00:14:31,360 --> 00:14:37,600 Táto analýza bola realizovaná v súbore dát siedmich farmových populácií 183 00:14:37,666 --> 00:14:41,530 A dvoch voľne žijúcich populácií jeleňa lesného. 184 00:14:41,600 --> 00:14:47,850 Ako je možné vidieť na obrázku, tak naozaj analýza umožnila diferencovať 185 00:14:47,920 --> 00:14:52,970 farmové populácie, ktoré vytvárajú jednu genetickú skupinu v strede 186 00:14:53,040 --> 00:14:58,320 a potom voľne žijúce populácie - slovenskú populáciu tvoria jedince, ktoré sú znázornené červenou 187 00:14:58,386 --> 00:15:00,840 farbou vľavo a fialovou farbou 188 00:15:00,906 --> 00:15:05,970 vpravo sú znázornené jedince z voľnej prírody zo Španielska. 189 00:15:06,040 --> 00:15:11,160 Na diskriminačnú analýzu hlavných komponentov možno využívať napríklad 190 00:15:11,226 --> 00:15:15,090 balík programu R, ktorý sa volá Adegenet. 191 00:15:15,160 --> 00:15:21,000 Častokrát sa v súvislosti s populačnú štruktúrou hodnotí aj miera premiešania 192 00:15:21,066 --> 00:15:25,410 jednotlivých plemien alebo populácií. 193 00:15:25,480 --> 00:15:30,640 Ono to súvisí jednak s ich geografickým pôvodom, ale hlavne s 194 00:15:30,706 --> 00:15:32,810 ich historickým pôvodom. 195 00:15:32,880 --> 00:15:38,170 Čo sa týka takejto analýzy, zvyčajne sa využíva bayesovský prístup, 196 00:15:38,240 --> 00:15:42,720 ktorý nám umožňuje jednak detekciu populačnej štruktúry, ale zároveň aj 197 00:15:42,786 --> 00:15:48,280 identifikáciu genetických skupín bez nutnosti preddefinovať skupiny, čo bola 198 00:15:48,346 --> 00:15:52,640 jedna z nevýhod práve predtým popisovanej diskriminačné analýzy 199 00:15:52,706 --> 00:15:54,610 hlavných komponentov. 200 00:15:54,680 --> 00:16:00,200 Baysovský prístup okrem toho umožňuje aj identifikáciu genetických skupín, miery 201 00:16:00,266 --> 00:16:06,490 admixie v rámci jedincov, čo je užitočné, aj pokiaľ chceme napríklad kvantifikovať 202 00:16:06,560 --> 00:16:11,170 mieru alebo intenzitu toku génov medzi populáciami. 203 00:16:11,240 --> 00:16:15,680 Čo sa týka výhod, tak hlavnou výhodou Bayesovského prístupu je presná 204 00:16:15,746 --> 00:16:21,760 identifikácia genetických skupín a je to pomerne flexibilná metóda, ktorú je možné 205 00:16:21,826 --> 00:16:26,800 aplikovať na komplexné štruktúry alebo komplexné databázy a aj rôzne typy 206 00:16:26,866 --> 00:16:30,450 genetických markerov, nie len SNP markery. 207 00:16:30,520 --> 00:16:34,930 Čo sa týka nevýhod, tento prístup je naozaj časovo náročný 208 00:16:35,000 --> 00:16:40,920 a spoľahlivosť výsledkov závisí od počtu použitých SNP markerov a rovnako aj od 209 00:16:40,986 --> 00:16:44,850 počtu testovaných jedincov v analýze. 210 00:16:44,920 --> 00:16:50,320 Na obrázku zase môžeme vidieť príklad grafickej vizualizácie výsledkov 211 00:16:50,386 --> 00:16:55,400 hodnotenia premiešania medzi farmovými a voľne 212 00:16:55,466 --> 00:16:59,090 žijúcimi populáciami jeleňa lesného. 213 00:16:59,160 --> 00:17:03,880 Tak ako som hovorila pri diskriminačnej analýze hlavných komponentov, jedince z 214 00:17:03,946 --> 00:17:08,290 voľnej prírody na Slovensku, sú znázornené červenou farbou. 215 00:17:08,360 --> 00:17:11,040 Jedince z voľnej prírody v Španielsku fialovou. 216 00:17:11,106 --> 00:17:17,080 Čiže naozaj táto analýza, ktorá vychádza nie z vopred preddefinovaných skupín, 217 00:17:17,146 --> 00:17:22,480 potvrdila, že ku genetickému premiešaniu, v dôsledku 218 00:17:22,546 --> 00:17:27,400 čoho sú aj populácie príbuznejšie, došlo hlavne v prípade farmových 219 00:17:27,466 --> 00:17:32,320 populácií a naopak populácie z voľnej prírody nevykazujú vzájomné 220 00:17:32,386 --> 00:17:34,530 genetické premiešanie. 221 00:17:34,600 --> 00:17:39,130 Na analýzu možno použiť rôznorodé nástroje. 222 00:17:39,200 --> 00:17:45,880 Jedná sa napríklad o programy ako Structure, Admixture alebo Faststructure. 223 00:17:46,600 --> 00:17:53,570 Čo sa týka toku génov medzi populáciami, ktorý vzniká hlavne v dôsledku migrácie, 224 00:17:53,640 --> 00:17:57,960 tak tento možno zase hodnotiť rôznymi nástrojmi. 225 00:17:58,026 --> 00:18:00,970 Jedným z nich je napríklad program TeeMix. 226 00:18:01,040 --> 00:18:06,520 Ten umožňuje na základe frekvencií alel vytvárať fylogeneticky stromy s možnosťou 227 00:18:06,586 --> 00:18:10,330 testovania intenzity migrácie medzi populáciami. 228 00:18:10,400 --> 00:18:15,970 Táto metóda je založená na maximálnej pravdepodobnosti a umožňuje simultánne 229 00:18:16,040 --> 00:18:20,170 odhadnúť fylogenetické vzťahy a migráciu medzi populáciami. 230 00:18:20,240 --> 00:18:25,370 Medzi jej hlavné výhody patrí detekcia intenzity migrácie a toku génov 231 00:18:25,440 --> 00:18:27,970 v minulosti, nielen v súčasnosti. 232 00:18:28,040 --> 00:18:33,280 A zase medzi nevýhody patrí spoľahlivosť výsledkov, ktorá závisí od množstva 233 00:18:33,346 --> 00:18:39,530 dostupných genotypových informácií, ako aj spoľahlivosti odhadu frekvencií alel 234 00:18:39,600 --> 00:18:42,770 v jednotlivých populáciách. 235 00:18:42,840 --> 00:18:45,840 Ďalší program, ktorý nám umožňuje 236 00:18:45,906 --> 00:18:49,960 stanoviť intenzitu výmeny génov 237 00:18:50,026 --> 00:18:53,450 medzi populáciami, je program Bayesass. 238 00:18:53,520 --> 00:18:58,080 Ten je založený podobne ako programy na stanovenie stupňa genetického 239 00:18:58,146 --> 00:19:01,250 premiešania na bayesovskom prístupe. 240 00:19:01,320 --> 00:19:07,720 Tento program sa však zvyčajne využíva na stanovenie intenzity výmeny génov medzi 241 00:19:07,786 --> 00:19:12,400 populáciami v súčasnosti, čiže až tak veľmi 242 00:19:12,466 --> 00:19:19,050 nereflektuje vzťahy medzi populáciami a jedincami v minulosti. 243 00:19:19,120 --> 00:19:23,290 Na obrázku máte zase ako príklad uvedený 244 00:19:23,360 --> 00:19:27,280 obrázok znázorňujúci intenzitu výmeny 245 00:19:27,346 --> 00:19:31,490 génov medzi populáciami jeleňa lesného. 246 00:19:31,560 --> 00:19:36,440 Ako vidieť z obrázku, tak k intenzívnej výmene génov došlo naozaj najmä v prípade 247 00:19:36,506 --> 00:19:41,680 farmových populácií, kedy si chovatelia môžu vymieňať buď zvieratá, alebo si môžu 248 00:19:41,746 --> 00:19:46,760 vymieňať inseminačné dávky od samcov. 249 00:19:47,680 --> 00:19:53,920 Ďalší veľmi často využívaný prístup na grafickú vizualizáciu genetických vzťahov 250 00:19:53,986 --> 00:19:58,000 medzi populáciami alebo na grafickú vizualizáciu populačnej štruktúry 251 00:19:58,066 --> 00:20:01,410 je konštrukcia genetických sietí. 252 00:20:01,480 --> 00:20:06,280 Podobne ako tomu bolo v predchádzajúcich prípadoch, aj tu máme pomerne veľa 253 00:20:06,346 --> 00:20:10,370 možností, ako toto realizovať aj pomerne veľa programov. 254 00:20:10,440 --> 00:20:16,970 Jedným z programov, ktoré je možné využiť na tento účel, je program Netview. 255 00:20:17,040 --> 00:20:23,490 Je to nástroj, ktorý sa využíva na zobrazovanie genetických sietí 256 00:20:23,560 --> 00:20:28,960 a vzťahov medzi jedincami alebo populáciami, ktoré sú založené hlavne na 257 00:20:29,026 --> 00:20:34,120 príbuznosti a toku génov medzi nimi a je pomerne dobrým nástrojom na 258 00:20:34,186 --> 00:20:37,400 zhodnotenie komplexných vzťahov, ako aj vplyvu napr. 259 00:20:37,466 --> 00:20:41,890 migrácie na genofond jednotlivých populácií. 260 00:20:41,960 --> 00:20:45,280 Medzi hlavné výhody programu Netview. 261 00:20:45,346 --> 00:20:50,050 čo sa týka analýzy populačnej štruktúry patrí pomerne 262 00:20:50,120 --> 00:20:52,560 dobrá vizualizácia alebo intuitívna 263 00:20:52,626 --> 00:20:57,770 vizualizácia a hlavne aj popis výsledkov. 264 00:20:57,840 --> 00:21:02,720 Tento prístup nám do určitej miery aj pomerne dobre zobrazuje mieru premiešania 265 00:21:02,786 --> 00:21:07,010 jednotlivých populácií a rovnako aj diferenciácie populácií. 266 00:21:07,080 --> 00:21:12,440 Čo sa týka nevýhod, je tento program limitovaný 267 00:21:12,506 --> 00:21:17,290 pokiaľ hodnotíme populácie s veľkým počtom jedincov. 268 00:21:17,360 --> 00:21:24,250 Na tomto slajde máme znázornenú grafickú vizualizáciu troch modelov, 269 00:21:24,320 --> 00:21:29,280 ktorými sme chceli vyhodnotiť genetické vzťahy medzi šestnástimi 270 00:21:29,346 --> 00:21:32,450 plemenami hovädzieho dobytka. 271 00:21:32,520 --> 00:21:38,090 V rámci základných nastavení, ktoré program vyžaduje, je nastavenie 272 00:21:38,160 --> 00:21:44,450 početnosti vzájomných prepojení medzi jedincami, z ktorých nám potom aj vyplýva 273 00:21:44,520 --> 00:21:47,840 množstvo genetických skupín, ktoré potenciálne v danej 274 00:21:47,906 --> 00:21:50,330 populácii mohli vznikať. 275 00:21:50,400 --> 00:21:56,160 Čím viac prepojení medzi jedincami povolíme, alebo viac výmeny 276 00:21:56,226 --> 00:22:01,970 génov medzi jedincami prostredníctvom reprodukcie jedincov povolíme v minulosti, 277 00:22:02,040 --> 00:22:06,320 tým v podstate menej genetických skupín 278 00:22:06,386 --> 00:22:09,410 nám bude vznikať, lebo lepšie odzrkadľujú 279 00:22:09,480 --> 00:22:13,570 takéto prepojenie medzi jednotlivými jedincami v populácii. 280 00:22:13,640 --> 00:22:20,850 Ale je to veľmi individuálne a pri tomto prístupe je naozaj dobré poznať 281 00:22:20,920 --> 00:22:27,160 historické pozadie plemien, ktoré sú zahrnuté v analýze, pretože toto nám potom 282 00:22:27,226 --> 00:22:32,600 umožní interpretovať dobre výsledky aj nastaviť jednotlivé scenáre, ktoré 283 00:22:32,666 --> 00:22:36,680 v danej populácii chceme testovať. 284 00:22:37,320 --> 00:22:41,520 Čo sa týka konštrukcie fylogenetických stromov, tak táto konštrukcia 285 00:22:41,586 --> 00:22:46,290 fylogenetických stromov častokrát vychádza aj z matíc príbuznosti, 286 00:22:46,360 --> 00:22:52,120 pričom najčastejšie sa používa Neiova genetická matica príbuznosti 287 00:22:52,186 --> 00:22:54,280 alebo potom aj IBD matica. 288 00:22:54,346 --> 00:22:59,200 Čiže to sú matice, ktoré matematicky vyjadrujú vzťah medzi dvoma 289 00:22:59,266 --> 00:23:01,010 jedincami v populácii, čiže 290 00:23:01,080 --> 00:23:05,650 potrebujeme tento vzťah vyhodnotiť na individuálnej úrovni. 291 00:23:05,720 --> 00:23:10,600 Takéto stromy potom vlastne predstavujú grafickú reprezentáciu evolučných vzťahov 292 00:23:10,666 --> 00:23:13,490 medzi populáciami, druhmi a jedincami 293 00:23:13,560 --> 00:23:15,850 na základe dát, ktoré hodnotíme. 294 00:23:15,920 --> 00:23:20,080 No a používajú sa napríklad nielen v prípade genetických dát, ale aj v prípade 295 00:23:20,146 --> 00:23:26,000 genealogických dát a umožňujú modelovanie evolučných procesov 296 00:23:26,066 --> 00:23:30,360 alebo aj sledovanie diferenciácie a migrácie medzi jednotlivými 297 00:23:30,426 --> 00:23:33,570 jedincami v rámci populácií. 298 00:23:33,640 --> 00:23:38,680 Na obrázku môžete vidieť príklad grafickej vizualizácie 299 00:23:38,746 --> 00:23:41,170 takéhoto fylogenetického stromu. 300 00:23:41,240 --> 00:23:45,040 Táto vizualizácia bola realizovaná pomocou 301 00:23:45,106 --> 00:23:48,960 programu SplitsTree a je založená na 302 00:23:49,026 --> 00:23:52,810 matici genetických vzdialeností podľa Neia. 303 00:23:52,880 --> 00:23:58,360 Samozrejme môžeme použiť aj rôzne iné programy, ako je SplitsTree, napríklad 304 00:23:58,426 --> 00:24:03,690 rôzne balíky programu R alebo program Mega, ak máme sekvenčné dáta. 305 00:24:03,760 --> 00:24:08,520 Čo sa týka obrázku, tak na obrázku sú znázornené genetické vzťahy 306 00:24:08,586 --> 00:24:11,770 medzi rôznymi plemenami koní. 307 00:24:11,840 --> 00:24:17,560 Táto štúdia bola hlavne orientovaná na kvantifikáciu vzťahov slovenského 308 00:24:17,626 --> 00:24:21,640 teplokrvníka s inými teplokrvnými plemenami koní, 309 00:24:21,706 --> 00:24:24,760 ktoré sú chované v Európe. 310 00:24:25,560 --> 00:24:31,320 V ďalšej časti prednášky by som sa chcela venovať prístupom a nástrojom, ktoré je 311 00:24:31,386 --> 00:24:37,410 možné využiť na vyhodnotenie vplyvu selekcie na genóm hospodárskych zvierat. 312 00:24:37,480 --> 00:24:42,760 Čo sa týka kvantifikácie vplyvu selekcie na genóm hospodárskych zvierat, jedná sa v 313 00:24:42,826 --> 00:24:48,640 podstate o identifikáciu špecifických genomických oblastí, ktoré sú pod 314 00:24:48,706 --> 00:24:54,770 selekčným tlakom a takéto oblasti sa nazývajú aj selekčné signály. 315 00:24:54,840 --> 00:24:59,680 Identifikácia alebo vyhodnotenie distribúcie selekčných signálov v genóme 316 00:24:59,746 --> 00:25:04,320 nám umožňuje lepšie pochopiť napríklad evolučné procesy a vplyv samotnej 317 00:25:04,386 --> 00:25:09,450 domestikácie hospodárskych zvierat, ale aj spoločenských zvierat, 318 00:25:09,520 --> 00:25:14,160 a súčasne nám umožňuje stanoviť vplyv prírodnej a intenzívnej 319 00:25:14,226 --> 00:25:20,080 zámernej selekcie na špecifické genomické oblasti, ktoré kontrolujú preferované 320 00:25:20,146 --> 00:25:26,010 fenotypové znaky, či už z pohľadu adaptability, odolnosti v prípade 321 00:25:26,080 --> 00:25:31,320 prírodnej selekcie alebo úžitkovosti jedincov populácií či druhov hospodárskych 322 00:25:31,386 --> 00:25:34,610 zvierat z pohľadu zámernej selekcie. 323 00:25:34,680 --> 00:25:39,920 Okrem toho nám analýza selekčných signálov umožňuje 324 00:25:39,986 --> 00:25:46,520 identifikovať oblasti v genóme, ktoré vykazujú vysokú mieru homozygotnosti, 325 00:25:46,586 --> 00:25:50,890 to znamená zníženie genetickej variability, respektíve diverzity 326 00:25:50,960 --> 00:25:55,960 a naopak identifikovať genomické oblasti, ktoré vykazujú zvýšenie 327 00:25:56,026 --> 00:25:57,930 genetickej diverzity. 328 00:25:58,000 --> 00:26:04,760 Jednou z výhod týchto prístupov je aj fakt, že pri hľadaní 329 00:26:04,826 --> 00:26:10,600 selekčných signálov v genóme nepotrebujeme fenotypové informácie, čiže táto analýza alebo 330 00:26:10,666 --> 00:26:16,890 tieto všetky metódy nevyužívajú informácie o fenotype daných jedincov. 331 00:26:16,960 --> 00:26:19,080 Pre stanovenie selekčných signálov v genóme hospodárskych zvierat sa 332 00:26:19,146 --> 00:26:23,370 v súčasnosti využívajú v podstate 333 00:26:23,440 --> 00:26:26,810 dve základné skupiny prístupov. 334 00:26:26,880 --> 00:26:32,200 Prvú skupinu tvoria prístupy, ktoré sú založené na vyhodnocovaní alebo 335 00:26:32,266 --> 00:26:37,450 identifikovaní rozdielov v štruktúre genómu medzi plemenami 336 00:26:37,520 --> 00:26:42,920 alebo medzi populáciami a druhú skupinu 337 00:26:42,986 --> 00:26:50,490 vytvárajú prístupy, ktoré sú založené na hodnotení vnútro-populačnej variability. 338 00:26:50,560 --> 00:26:56,200 Čo sa týka hodnotenia rozdielov medzi populáciami v utváraní genómu alebo v 339 00:26:56,266 --> 00:27:00,010 štruktúre genómu, tak najčastejšie sa využíva stanovenie 340 00:27:00,080 --> 00:27:04,450 Wrightovho fixačného indexu FST na celogenómovej úrovni, 341 00:27:04,520 --> 00:27:08,560 rovnako ako aj vyhodnocovanie rozdielov vo väzbovej nerovnováhe v určitých 342 00:27:08,626 --> 00:27:12,090 špecifických úsekoch v genóme. 343 00:27:12,160 --> 00:27:16,610 Ale napríklad tu môžeme využiť aj analýzu hlavných komponentov. 344 00:27:16,680 --> 00:27:23,290 Čo sa týka hodnotenia na vnútro-populačnej úrovni, využívajú sa prístupy založené na 345 00:27:23,360 --> 00:27:27,680 determinovaní homozygotných a heterozygotných úsekov. 346 00:27:27,746 --> 00:27:33,490 Rovnako je tu možné využiť aj analýzu variability vo väzbovej nerovnováhe 347 00:27:33,560 --> 00:27:38,160 alebo napríklad Tajima D štatistiku. 348 00:27:38,240 --> 00:27:43,760 Wrightov FST index je v súčasnosti jeden z najvyužívanejších 349 00:27:43,826 --> 00:27:48,840 prístupov z pohľadu identifikácie selekčných signálov, ktoré reflektujú 350 00:27:48,906 --> 00:27:53,730 mieru rozdielnosti medzi dvoma plemenami alebo medzi viacerými plemenami. 351 00:27:53,800 --> 00:27:58,640 V tomto prípade sú selekčné signály identifikované na základe rozdielov vo 352 00:27:58,706 --> 00:28:04,080 frekvenciách alel medzi populáciami, ktoré vznikli napríklad v dôsledku 353 00:28:04,146 --> 00:28:08,370 rozdielneho chovného cieľa alebo plemenného štandardu. 354 00:28:08,440 --> 00:28:15,410 Pomocou tohto prístupu alebo tejto metódy môžeme získať dva základné typy signálov, 355 00:28:15,480 --> 00:28:19,490 ktoré aj zodpovedajú rôznym typom selekcie. 356 00:28:19,560 --> 00:28:24,760 Prvým typom signálu sú úseky, ktoré vykazujú vysoké 357 00:28:24,826 --> 00:28:28,490 hodnoty Wrightovho FST indexu a tieto 358 00:28:28,560 --> 00:28:32,250 reprezentujú lokusy alebo SNP markery, 359 00:28:32,320 --> 00:28:38,000 ktoré majú rozdielne frekvencie alel medzi dvoma plemenami a naopak 360 00:28:38,066 --> 00:28:42,690 druhým typom signálov sú signály, ktoré 361 00:28:42,760 --> 00:28:45,880 sú reprezentované SNP markery alebo lokusmi s 362 00:28:45,946 --> 00:28:51,520 nízkou hodnotou FST indexu a v tomto prípade dané plemená alebo populácie 363 00:28:51,586 --> 00:28:55,320 podliehali rovnakému typu selekcie. 364 00:28:55,880 --> 00:29:03,050 Čo sa týka hraničnej hodnoty definujúcej selekčný signál, najčastejšie sa využíva 365 00:29:03,120 --> 00:29:08,720 výber najvyšších hodnôt - 1% najvyšších hodnôt Wrightovho FST indexu, 366 00:29:08,786 --> 00:29:13,810 pretože zvyčajne sa identifikujú alebo hľadajú signály, ktoré reflektujú 367 00:29:13,880 --> 00:29:17,330 rozdielnosť medzi dvoma alebo viacerými plemenami. 368 00:29:17,400 --> 00:29:22,920 Medzi výhody tejto metódy patrí hlavne relatívne jednoduchý spôsob 369 00:29:22,986 --> 00:29:29,410 výpočtu a široké využitie naprieč rôznymi populáciami, druhmi, plemenami 370 00:29:29,480 --> 00:29:34,450 a medzi nevýhodu patrí častokrát to, že 371 00:29:34,520 --> 00:29:37,040 nie je možné využiť tento prístup na 372 00:29:37,106 --> 00:29:41,320 identifikáciu selekčných signálov na vnútro-populačnej úrovni 373 00:29:41,386 --> 00:29:43,810 a súčasne častokrát je 374 00:29:43,880 --> 00:29:49,480 nevýhodou tohto prístupu aj to, že selekčné signály reflektujú určitú mieru 375 00:29:49,546 --> 00:29:56,360 rozdielnosti medzi plemenami, ktorá nie je odvodená od súčasných plemenných 376 00:29:56,426 --> 00:30:04,320 štandardov alebo cieľov, ale reprezentuje veľmi veľa generácií predkov dozadu. 377 00:30:05,040 --> 00:30:11,760 Na obrázku, ktorý vidíte na slajde, máte znázornenú grafickú vizualizáciu FST 378 00:30:11,826 --> 00:30:16,330 hodnôt naprieč genómom 379 00:30:16,400 --> 00:30:19,690 mäsových plemien dobytka. Distribúcia hodnôt 380 00:30:19,760 --> 00:30:26,770 je tam znázornená pomocou bodov, pričom hraničná hodnota 1% nejvyšších hodnot 381 00:30:26,840 --> 00:30:31,810 FST indexu je znázornená modrou čiarou. 382 00:30:31,880 --> 00:30:37,720 Okrem toho, čo je zvyčajne súčasťou týchto prístupov, je aj identifikácia génov, 383 00:30:37,786 --> 00:30:44,290 ktoré sú lokalizované v okolí alebo priamo v oblasti selekčného signálu a rovnako aj QTL 384 00:30:44,360 --> 00:30:50,720 markerov, pretože toto nám môže napovedať, prečo došlo v danej oblasti k vzniku 385 00:30:50,786 --> 00:30:55,690 selekčného signálu a čo môžu kontrolovať 386 00:30:55,760 --> 00:30:58,680 Jednonukleotidové polymorfizmy alebo SNP markery 387 00:30:58,746 --> 00:31:02,170 v oblasti selekčného signálu z pohľadu fenotypu. 388 00:31:02,240 --> 00:31:08,200 Vpravo na slajde máte znázornené vybrané selekčné signály, ktoré boli 389 00:31:08,266 --> 00:31:12,840 determinované v genóme mäsových plemien na základe FST indexu a rovnako 390 00:31:12,906 --> 00:31:14,610 aj QTL lokusy alebo lokusy 391 00:31:14,680 --> 00:31:20,760 pre kvantitatívne znaky, ktoré je možné nájsť v týchto oblastiach a ktoré 392 00:31:20,826 --> 00:31:25,730 boli v predchádzajúcich štúdiách preukazne asociované s nejakým významným 393 00:31:25,800 --> 00:31:29,610 fenotypovým znakom alebo vlastnosťou. 394 00:31:29,680 --> 00:31:35,600 Ďalším z prístupov, ktoré nám umožňujú vyhodnocovať selekčné signály, ktoré 395 00:31:35,666 --> 00:31:40,880 vznikajú v genóme v dôsledku odlišností medzi dvoma plemenami alebo viacerými 396 00:31:40,946 --> 00:31:45,850 plemenami, sú metódy založené na 397 00:31:45,920 --> 00:31:48,570 rozdieloch vo väzbovej nerovnováhe. 398 00:31:48,640 --> 00:31:53,560 Ja budem spomínať hlavne metódu výpočtu integrovaného skóre haplotypov, 399 00:31:53,626 --> 00:31:56,370 ktorého skratka je iHS. 400 00:31:56,440 --> 00:32:00,480 Jedná sa o selekčné signály, ktoré sú odvodené od zmeny vo väzbovej 401 00:32:00,546 --> 00:32:07,080 nerovnováhe v genóme hodnotených plemien a aj od vzniku špecifických haplotypov v 402 00:32:07,146 --> 00:32:11,810 dôsledku väzbovej nerovnováhy medzi nimi. 403 00:32:11,880 --> 00:32:14,720 Pod pojmom haplotyp si treba predstaviť 404 00:32:14,786 --> 00:32:20,000 skupinu génov, ktoré sú vo vzájomnej väzbe a 405 00:32:20,066 --> 00:32:24,960 kontrolujú nejaký preferovaný fenotypový znak alebo vlastnosť. 406 00:32:25,026 --> 00:32:30,840 Takáto väzba medzi určitými variantami alebo génmi vznikla napríklad v dôsledku 407 00:32:30,906 --> 00:32:36,170 dlhodobej selekcie na určitý špecifický fenotypový znak alebo vlastnosť. 408 00:32:36,240 --> 00:32:42,360 Hodnota iHS je v podstate definovaná veľmi jednoducho ako miera vyjadrujúca, ako 409 00:32:42,426 --> 00:32:49,050 neobvyklý je haplotyp pozostávajúci zo špecifických SNP markerov 410 00:32:49,120 --> 00:32:53,560 v porovnaní so zvyškom genómu. 411 00:32:54,680 --> 00:33:01,000 Metóda integrovaného skóre haplotypov je obzvlášť citlivou metódou na detekciu 412 00:33:01,066 --> 00:33:04,320 efektu selekcie, ku ktorej došlo relatívne 413 00:33:04,386 --> 00:33:08,080 nedávno a ktorá viedla v populácii k 414 00:33:08,146 --> 00:33:15,130 zvýšeniu frekvencie určitého alelického variantu, ktorý kontroluje preferovaný 415 00:33:15,200 --> 00:33:21,000 fenotypový znak alebo vlastnosť, ale ktorá ešte nestihla v populácii eliminovať 416 00:33:21,066 --> 00:33:25,680 iné varianty alebo iné alely, ktoré z pohľadu 417 00:33:25,746 --> 00:33:30,250 Fenotypového znaku alebo vlastnosti nie sú tak žiaduce. 418 00:33:30,320 --> 00:33:36,570 Táto metóda sa začína výpočtom hodnoty EHH. EHH vlastne 419 00:33:36,640 --> 00:33:43,090 vyjadruje homozygotnosť haplotypu v určitom genomickom regióne 420 00:33:43,160 --> 00:33:50,330 a v podstate kvantifikuje pokles homozygotnosti haplotypu od určitého SNP markera. 421 00:33:50,400 --> 00:33:56,760 Následne pokračuje metóda výpočtom hodnoty iHS, ktorý je založený na logaritme 422 00:33:56,826 --> 00:34:02,330 pomeru integrovaných hodnôt EHH pre dva alelické varianty. 423 00:34:02,400 --> 00:34:07,730 Integrované skóre haplotypov môže nadobúdať pozitívne hodnoty. 424 00:34:07,800 --> 00:34:13,970 To znamená, že daný haplotyp nesúci jednu alebo je dlhší a má vyššiu hodnotu EHH, 425 00:34:14,040 --> 00:34:18,730 čo súčasne indikuje signifikantný vplyv pozitívnej selekcie 426 00:34:18,800 --> 00:34:25,050 alebo môže nadobúdať negatívne hodnoty, kedy alternatívna alela má vyššiu hodnotu 427 00:34:25,120 --> 00:34:31,570 EHH, čo takisto môže odrážať vplyv selekcie, ale v opačnom smere. 428 00:34:31,640 --> 00:34:37,960 Hraničná hodnota v prípade tejto metódy definujúca signál sa stanovuje podobne ako 429 00:34:38,026 --> 00:34:43,800 pri metóde FST, to znamená napríklad na základe 1% najvyšších 430 00:34:43,866 --> 00:34:47,530 pozitívnych hodnôt integrovaného skóre haplotypov. 431 00:34:47,600 --> 00:34:53,600 Medzi základné výhody tohto prístupu patrí fakt, že sa jedná o prístup vhodný na 432 00:34:53,666 --> 00:34:59,610 detekciu efektu nedávnej selekcie a identifikáciu signálov vykazujúcich 433 00:34:59,680 --> 00:35:03,570 napríklad aj vplyv adaptácie 434 00:35:03,640 --> 00:35:09,880 A súčasne táto analýza poskytuje možnosť vyhodnotenia 435 00:35:09,946 --> 00:35:12,210 haplotypovej štruktúry populácií. 436 00:35:12,280 --> 00:35:17,320 Medzi nevýhody tejto metódy patrí určite potreba kvalitných a robustných 437 00:35:17,386 --> 00:35:23,730 genomických dát a súčasne aj analýza, ktorá predchádza 438 00:35:23,800 --> 00:35:26,320 samotnému stanoveniu iHS hodnoty 439 00:35:26,386 --> 00:35:31,600 A to je analýza, ktorej výsledkom je rekonštrukcia haplotypov alebo určenie 440 00:35:31,666 --> 00:35:38,570 frekvencie jednotlivých haplotypov daných populáciách, ktoré analyzujeme. 441 00:35:38,640 --> 00:35:45,200 Na obrázku máte znázornenú analýzu integrovaného skóre haplotypov, 442 00:35:45,266 --> 00:35:51,560 respektíve analýzu variability vo väzbovej nerovnováhe u holštajnského plemena a 443 00:35:51,626 --> 00:35:54,810 potom aj iných plemien mäsového dobytka. 444 00:35:54,880 --> 00:36:01,200 Cieľom bolo zistiť, v ktorých regiónoch sa signifikantne líši väzbová 445 00:36:01,266 --> 00:36:05,490 nerovnováha u holštajnského dobytka a iných mäsových plemien. 446 00:36:05,560 --> 00:36:09,960 Na základe výsledkov sme zistili, že takéto regióny sa nachádzajú napríklad na 447 00:36:10,026 --> 00:36:16,560 chromozómoch 7, 13, 2 a 26 v blízkosti QTL markerov zodpovedných 448 00:36:16,626 --> 00:36:19,720 napríklad za produkciu mlieka alebo obsah tuku 449 00:36:19,786 --> 00:36:22,200 a bielkovín v mlieku. 450 00:36:23,160 --> 00:36:29,450 Ďalšou z analýz, ktoré je možné využiť na stanovenie selekčných signálov v genóme 451 00:36:29,520 --> 00:36:35,690 hospodárskych zvierat, je metóda založená na analýze hlavných komponentov. 452 00:36:35,760 --> 00:36:42,010 Táto metóda, podľa toho, čo uvádzajú autori metódy aj predchádzajúce štúdie, 453 00:36:42,080 --> 00:36:47,920 je metódou, ktorá primárne identifikuje selekčné signály, ktoré v genóme vznikli 454 00:36:47,986 --> 00:36:53,520 v dôsledku lokálnej adaptácie jedincov na podmienky prostredia, čiže reflektuje 455 00:36:53,586 --> 00:36:56,730 hlavne vplyv prírodnej selekcie. 456 00:36:56,800 --> 00:37:00,800 Považuje sa za alternatívnu metódu pre identifikáciu selekčných 457 00:37:00,866 --> 00:37:04,200 signálov k FST indexu. 458 00:37:04,266 --> 00:37:09,360 Je ju možné aplikovať na identifikáciu selekčných signálov pri 459 00:37:09,426 --> 00:37:15,000 porovnávaní dvoch a viacerých plemien, ale nie je ju možné aplikovať, pokiaľ 460 00:37:15,066 --> 00:37:19,970 chceme identifikovať signály vo vnútri genómu jedného plemena alebo 461 00:37:20,040 --> 00:37:22,730 genofondu jedného plemena. 462 00:37:22,800 --> 00:37:27,360 Detekcia selekčných signálov v tomto prípade vychádza z predpokladu existencie 463 00:37:27,426 --> 00:37:33,200 korelácie medzi genetickými variantmi a hlavnými komponentmi, ktorá reflektuje 464 00:37:33,266 --> 00:37:36,840 lokálnu adaptáciu jednotlivých populácií na produkčné, respektíve 465 00:37:36,906 --> 00:37:39,720 chovateľské prostredie. 466 00:37:41,000 --> 00:37:46,480 Metóda je založená na rôznych následných analýzach. 467 00:37:46,546 --> 00:37:51,970 Jednou z týchto analýz alebo testov je Mahalanobisov štatistický test, 468 00:37:52,040 --> 00:37:57,200 ktorý hodnotí vzdialenosť bodov od priemeru a vlastne slúži na identifikáciu 469 00:37:57,266 --> 00:38:02,090 SNP markerov vykazujúcich asociáciu s pozitívnou selekciou 470 00:38:02,160 --> 00:38:07,120 na základe zostavenia Z skóre získaného regresnej analýzou vzťahu medzi SNP 471 00:38:07,186 --> 00:38:13,130 markermi a hlavnými komponentmi analýzy hlavných komponentov. 472 00:38:13,200 --> 00:38:17,840 V tomto prípade hraničnú hodnotu definujúcu selekčný 473 00:38:17,906 --> 00:38:20,320 signál možno stanoviť napr. 474 00:38:20,386 --> 00:38:22,730 na základe FDR testu. 475 00:38:22,800 --> 00:38:29,360 Čo sa týka výhod, je to pomerne efektívna metóda aj na vizualizáciu alebo analýzu 476 00:38:29,426 --> 00:38:33,810 populačnej štruktúry a na identifikáciu selekčných signálov. 477 00:38:33,880 --> 00:38:39,440 Avšak čo sa týka nevýhod, jedná sa o alternatívny prístup, ktorý 478 00:38:39,506 --> 00:38:45,170 nie je až tak často využívaný a v prípade 479 00:38:45,240 --> 00:38:49,160 toho, akú populáciu hodnotíme, môže 480 00:38:49,226 --> 00:38:55,560 byť aj komplikovaná interpretácia výsledkov v porovnaní s inými metódami. 481 00:38:56,040 --> 00:39:03,370 Na obrázku máte znázornené výsledky analýzy selekčných signálov na základe 482 00:39:03,440 --> 00:39:05,890 PCA analýzy. 483 00:39:05,960 --> 00:39:11,160 Na prvom obrázku vľavo máte znázornený prvý krok analýzy, čo je testovanie 484 00:39:11,226 --> 00:39:16,720 populačnej štruktúry alebo genotypovej štruktúry a na ďalšom obrázku už máte 485 00:39:16,786 --> 00:39:22,050 znázornený samotný výsledok analýzy selekčných signálov, 486 00:39:22,120 --> 00:39:26,960 pričom v tomto prípade sme napríklad identifikovali selekčné signály na 487 00:39:27,026 --> 00:39:31,850 chromozómoch 1, 2, 3, 6, 9, 11, 13 a 22, 488 00:39:31,920 --> 00:39:35,570 pričom tieto boli 489 00:39:35,640 --> 00:39:41,800 V oblasti QTL lokusov asociovaných napríklad s hmotnosťou pri otelení, 490 00:39:41,866 --> 00:39:44,530 keďže analýza bola realizovaná u dobytka 491 00:39:44,600 --> 00:39:49,570 alebo aj v oblastiach QTL lokusov 492 00:39:49,640 --> 00:39:55,120 asociovaných so skóre mramorovania, čiže fenotypovými vlastnosťami významnými pre chov 493 00:39:55,186 --> 00:39:59,600 mäsových plemien dobytka, ale aj iných plemien dobytka. 494 00:40:00,040 --> 00:40:03,160 Takže v tomto prípade môžeme povedať, že naozaj došlo k intenzívnemu 495 00:40:03,226 --> 00:40:05,480 vplyvu selekcie. 496 00:40:07,640 --> 00:40:12,600 Druhou skupinou metód sú metódy, ktoré nám umožňujú stanoviť 497 00:40:12,666 --> 00:40:17,800 vplyv selekcie priamo na genóm konkrétnej populácie alebo konkrétneho plemena. 498 00:40:17,866 --> 00:40:23,730 To znamená, ako selekcia ovplyvňovala genofond takejto populácie či plemena. 499 00:40:23,800 --> 00:40:28,520 Asi jednou z najčastejšie využívaných metód je metóda založená na hodnotení 500 00:40:28,586 --> 00:40:34,040 distribúcie homozygotných úsekov v genóme, ktoré sa označujú aj skratkou ROH, ktorá 501 00:40:34,106 --> 00:40:38,290 vyplýva z anglického názvu "runs of homozygosity". 502 00:40:38,360 --> 00:40:42,840 Tento prístup v podstate predpokladá, že oblasti v genóme, ktoré vykazujú silné 503 00:40:42,906 --> 00:40:46,680 selekčné signály, sú výsledkom zvýšenia lokálnej homozygotnosti 504 00:40:46,746 --> 00:40:48,130 v takomto regióne 505 00:40:48,200 --> 00:40:52,960 v dôsledku intenzívneho selektívneho tlaku alebo 506 00:40:53,026 --> 00:40:56,680 šľachtenia na znaky determinované napríklad v plemennom 507 00:40:56,746 --> 00:40:59,840 štandarde každého plemena. 508 00:41:00,080 --> 00:41:05,400 Homozygotné úseky, ktoré tvoria selekčný signál lokalizovaný niekde v 509 00:41:05,466 --> 00:41:11,200 genóme, sú tvorené zvyčajne alelami alebo 510 00:41:11,266 --> 00:41:15,690 genetickými variantami, ktoré pochádzajú od spoločných predkov 511 00:41:15,760 --> 00:41:21,080 a ktoré sa v podstate dedia z generácie na generáciu v nezmenenej forme. 512 00:41:22,360 --> 00:41:27,680 Selekčné signály sa v tomto prípade stanovujú, ak využívame SNP dáta alebo 513 00:41:27,746 --> 00:41:32,400 dáta pochádzajúce z genotypovania pomocou SNP čipov na základe frekvencie 514 00:41:32,466 --> 00:41:38,050 výskytu SNP markerov v oblasti homozygotného úseku 515 00:41:38,120 --> 00:41:43,770 naprieč všetkými jedincami v populácii, pričom hraničná hodnota determinujúca 516 00:41:43,840 --> 00:41:49,770 signál, je zvyčajne 1% najvyšších hodnôt. 517 00:41:49,840 --> 00:41:53,920 Medzi základné výhody patrí, že tento prístup 518 00:41:53,986 --> 00:41:58,560 umožňuje determinovať samotný selekčný signál a 519 00:41:58,626 --> 00:42:04,960 Súčasne umožňuje identifikovať oblasti, kde došlo k výraznému zníženiu 520 00:42:05,026 --> 00:42:07,730 diverzity a nárastu homozygotnosti. 521 00:42:07,800 --> 00:42:11,050 Je veľmi dobrým indikátorom pozitívnej selekcie. 522 00:42:11,120 --> 00:42:11,640 A naopak 523 00:42:11,706 --> 00:42:16,520 medzi nevýhody patrí, že ak chceme stanovovať selekčné signály touto 524 00:42:16,586 --> 00:42:23,240 metódou, mali by sme mať k dispozícii naozaj kvalitné a robustné genomické dáta. 525 00:42:24,200 --> 00:42:30,130 Na obrázku máte znázornené výsledky analýzy distribúcie 526 00:42:30,200 --> 00:42:33,130 homozygotných úsekov v genóme slovenského teplokrvníka, 527 00:42:33,200 --> 00:42:35,330 čo je plemeno koní. 528 00:42:35,400 --> 00:42:40,730 Ako vidíte, v niektorých úsekoch naozaj došlo k zvýšeniu podielu 529 00:42:40,800 --> 00:42:42,890 homozygotných úsekov v genóme. 530 00:42:42,960 --> 00:42:47,560 Takéto úseky, ako môžte vidieť v tabuľke vpravo, sa nachádzajú napríklad na 531 00:42:47,626 --> 00:42:54,410 chromozómoch 1, 2, 6, 9, 11, 15 a 16. V blízkosti je veľké množstvo 532 00:42:54,480 --> 00:43:00,120 proteín-kódujúci génov, ktoré samozrejme majú aj svoju úlohu pri utváraní 533 00:43:00,186 --> 00:43:04,000 fenotypových znakov a vlastností. 534 00:43:04,440 --> 00:43:09,240 Ďalšou metódou je metóda založená na hodnotení 535 00:43:09,306 --> 00:43:13,610 distribúcie heterozygotných úsekov v genóme, čiže je to 536 00:43:13,680 --> 00:43:17,520 veľmi podobná metóda ako tá predchádzajúca, ale tou predchádzajúcou 537 00:43:17,586 --> 00:43:21,520 sme stanovovali alebo identifikovali úseky, ktoré 538 00:43:21,586 --> 00:43:23,850 vykazujú vysokú homozygotnosť. 539 00:43:23,920 --> 00:43:29,520 Touto metódou sa naopak hodnotia úseky, ktoré vykazujú vysokú heterozygotnos, a 540 00:43:29,586 --> 00:43:33,330 takéto úseky môžu mať pre plemeno, populáciu alebo 541 00:43:33,400 --> 00:43:38,130 druh význam hlavne z pohľadu adaptability alebo odpovede na rôzne 542 00:43:38,200 --> 00:43:44,440 environmentálne zmeny či výskyt patogénov, pretože heterozygotné jedince vykazujú 543 00:43:44,506 --> 00:43:50,930 zvyčajne vyšší fitnes v porovnaní s jedincami, ktoré sú vysoko homozygotné. 544 00:43:51,000 --> 00:43:56,200 V tomto prípade teda možno povedať, že vysoká úroveň heterozygotnosti môže byť 545 00:43:56,266 --> 00:44:01,650 výsledkom pôsobenia stabilizačnej selekcie, ktorá je jedným 546 00:44:01,720 --> 00:44:05,640 z biologických spôsobov, ako uchovávať genetickú 547 00:44:05,706 --> 00:44:09,240 diverzitu v rámci populácie. 548 00:44:09,680 --> 00:44:14,890 Ako som už povedala, táto metóda je veľmi podobná ako tá predchádzajúca 549 00:44:14,960 --> 00:44:22,010 až na to, že pri tejto metóde sa snažíme nájsť v genóme 550 00:44:22,080 --> 00:44:28,600 nepretržité úseky heterozygotných genotypov, pričom pri tej predchádzajúcej 551 00:44:28,666 --> 00:44:35,040 sme hľadali naopak nepretržité úseky homozygotných genotypov. 552 00:44:35,280 --> 00:44:40,960 Selekčné signály sa stanovujú veľmi podobne, ale stanovujú sa na základe 553 00:44:41,026 --> 00:44:46,840 frekvencie výskytu SNP markerov v heterozygotných úsekoch konkrétnej 554 00:44:46,906 --> 00:44:50,210 oblasti naprieč jedincami v rámci populácie. 555 00:44:50,280 --> 00:44:56,370 Hraničná hodnota determinujúca selekčný signál je zase najčastejšie 556 00:44:56,440 --> 00:44:59,850 1% najvyšších hodnôt. 557 00:44:59,920 --> 00:45:05,640 Medzi výhody tejto metódy patrí, že umožňuje detekovať oblasti, v ktorých 558 00:45:05,706 --> 00:45:08,080 je zvýšený podiel heterozygotných genotypov. 559 00:45:08,146 --> 00:45:14,400 To znamená, že je veľmi dobrým indikátorom genetických oblastí dôležitých z hľadiska 560 00:45:14,466 --> 00:45:19,690 adaptácie populácie či stanovenia jej evolučného potenciálu. 561 00:45:19,760 --> 00:45:20,640 A medzi nevýhody 562 00:45:20,706 --> 00:45:25,640 podobne ako tomu bolo pri vyhľadávaní homozygotných úsekov patrí potreba 563 00:45:25,706 --> 00:45:29,080 kvalitných a robustných genomických dát. 564 00:45:29,280 --> 00:45:34,880 Na obrázku máme teraz viac konkrétne výsledky, ktoré sa vzťahovali na 565 00:45:34,946 --> 00:45:40,680 vyhľadávanie heterozygotných úsekov v oblasti hlavného histokompatibilného 566 00:45:40,746 --> 00:45:47,080 komplexu, čo je naozaj významná oblasť z pohľadu adaptability organizmu a 567 00:45:47,146 --> 00:45:53,720 schopnosti reagovať na rôzne faktory z vonkajšieho prostredia. 568 00:45:53,786 --> 00:45:58,730 Na prvom obrázku máme znázornenú frekvenciu výskytu SNP markerov 569 00:45:58,800 --> 00:46:04,840 v heterozygotných úsekoch a na druhom máme znázornenú samotnú 570 00:46:04,906 --> 00:46:08,960 distribúciu takýchto úsekov v oblasti hlavného 571 00:46:09,026 --> 00:46:15,000 histokompatibilného komplexu, pričom tu aj môžeme vidieť dĺžku jednotlivých 572 00:46:15,066 --> 00:46:16,850 Heterozygotných úsekov. 573 00:46:16,920 --> 00:46:22,720 Táto analýza bola realizovaná u piatich plemien koní. 574 00:46:23,440 --> 00:46:28,930 Ďalšou analýzou, ktorá je pomerne zaujímavá, je RDA analýza. 575 00:46:29,000 --> 00:46:33,680 Táto analýza testuje vzťahy medzi genetickou variabilitou a 576 00:46:33,746 --> 00:46:37,920 environmentálnymi faktormi, čiže zase podobne ako PCA 577 00:46:37,986 --> 00:46:42,730 analýza nám umožňuje kvantifikovať vplyv prírodnej selekcie. 578 00:46:42,800 --> 00:46:47,440 Jedná sa o metódu hodnotenia asociácií medzi genotypom a prostredím, ktorá 579 00:46:47,506 --> 00:46:50,610 súčasne hodnotí percento genetickej variability 580 00:46:50,680 --> 00:46:55,730 vysvetlenej environmentálnymi premennými a detekuje aj 581 00:46:55,800 --> 00:47:01,250 lokusy alebo genetické varianty, ktoré podliehali selekčnému tlaku. 582 00:47:01,320 --> 00:47:05,330 Jedná sa o dvojkrokovú analýzu, v ktorej sú genetické a environmentálne 583 00:47:05,400 --> 00:47:11,530 dáta hodnotené pomocou viacrozmernej lineárnej regresie. 584 00:47:11,600 --> 00:47:15,570 Medzi výhody tejto analýzy patrí to, že 585 00:47:15,640 --> 00:47:19,410 sa jedná o komplexný prístup na hodnotenie vzťahov 586 00:47:19,480 --> 00:47:24,170 medzi genetickou variabilitou v rámci populácie, ako aj faktormi prostredia. 587 00:47:24,240 --> 00:47:28,800 A medzi nevýhody zase patrí potreba kvalitných a robustných dát, už v tomto 588 00:47:28,866 --> 00:47:32,010 prípade nielen genetických, ale aj 589 00:47:32,080 --> 00:47:36,840 dát, ktoré charakterizujú práve tie environmentálne faktory, ktoré 590 00:47:36,906 --> 00:47:43,410 môžu potenciálne ovplyvňovať genóm jednotlivých jedincov alebo populácií. 591 00:47:43,480 --> 00:47:48,160 Medzi softvérové nástroje, ktoré možno v tomto prípade použiť, patrí napr. 592 00:47:48,226 --> 00:47:53,330 R balík vegan alebo program DeepGenomeScan. 593 00:47:53,400 --> 00:48:00,250 Poslednou metódou, o ktorej by som chcela hovoriť, je metóda, ktorá slúži na 594 00:48:00,320 --> 00:48:05,920 odhad vplyvu stabilizačnej selekcie na genóm populácie, plemena, 595 00:48:05,986 --> 00:48:07,730 jedincov a podobne. 596 00:48:07,800 --> 00:48:11,650 A to je Tajimova D štatistika. 597 00:48:11,720 --> 00:48:15,850 Táto metóda v podstate slúži 598 00:48:15,920 --> 00:48:19,400 ako dobrý indikátor práve stabilizačnej 599 00:48:19,466 --> 00:48:25,120 selekcie, pričom v rámci Tajimovho D môžeme dosiahnuť alebo zistiť 600 00:48:25,186 --> 00:48:27,120 negatívne a pozitívne hodnoty. 601 00:48:27,186 --> 00:48:33,480 A práve pozitívne hodnoty nám indikujú vplyv stabilizačnej selekcie, 602 00:48:33,840 --> 00:48:38,200 kedy majú frekvencie alel zvyčajne stredné hodnoty, čo má za 603 00:48:38,266 --> 00:48:41,440 následok väčšiu variabilitu, ako by sa očakávalo na základe 604 00:48:41,506 --> 00:48:43,890 teórie neutrálnej evolúcie. 605 00:48:43,960 --> 00:48:48,600 A naopak, negatívne hodnoty sú v tomto prípade asociované s efektom pozitívnej 606 00:48:48,666 --> 00:48:52,370 selekcie, ktorá vedie k zníženiu genetickej variability alebo 607 00:48:52,440 --> 00:48:57,450 diverzity genofondu v genóme danej populácie plemena. 608 00:48:57,520 --> 00:49:02,000 Hraničná hodnota sa zvyčajne determinuje podobne ako pri predchádzajúcich 609 00:49:02,066 --> 00:49:05,450 príkladoch alebo pri predchádzajúcich metódach. 610 00:49:05,520 --> 00:49:10,440 Čo sa týka výhod, tak táto metóda umožňuje detekovať oblasti, v ktorých je zvýšený 611 00:49:10,506 --> 00:49:17,170 podiel heterozygotných genotypov, čiže je to dobrý indikátor napríklad z pohľadu 612 00:49:17,240 --> 00:49:21,560 zistenia miery adaptácie alebo adaptability 613 00:49:21,626 --> 00:49:26,530 populácie na zmeny environmentálneho prostredia. 614 00:49:26,600 --> 00:49:32,000 A čo sa týka nevýhod, tak zase potrebujeme kvalitné a robustné dáta, pokiaľ chceme 615 00:49:32,066 --> 00:49:35,490 získať naozaj spoľahlivé výsledky. 616 00:49:35,560 --> 00:49:42,410 Na obrázku máte znázornené genomické regióny, v ktorých došlo k zvýšeniu 617 00:49:42,480 --> 00:49:47,330 D hodnoty a teda, ktoré nám reflektujú vplyv stabilizačnej selekcie. 618 00:49:47,400 --> 00:49:52,240 Analýza bola realizovaná u piatich plemien koní pochádzajúcich zo Slovenska 619 00:49:52,306 --> 00:49:54,170 alebo z Českej republiky. 620 00:49:54,240 --> 00:50:00,760 V podstate prostredníctvom tejto metódy sme boli schopní identifikovať regióny, v 621 00:50:00,826 --> 00:50:07,170 ktorých došlo k zvýšeniu Tajimovej D hodnoty naprieč jednotlivými plemenami. 622 00:50:07,240 --> 00:50:10,920 Súčasťou tejto analýzy, samozrejme ako pri tých predchádzajúcich, bola aj 623 00:50:10,986 --> 00:50:15,360 identifikácia génov, ktoré môžu byť asociované s takýmto 624 00:50:15,426 --> 00:50:18,440 zvýšením, pričom sme zistili, že sa naozaj 625 00:50:18,506 --> 00:50:22,800 jedná o gény, ktoré sú asociované buď 626 00:50:22,866 --> 00:50:26,770 so zdravím alebo s fitness populácie. 627 00:50:26,840 --> 00:50:30,680 Vyhľadávanie proteín-kódujúcich génov v oblastiach 628 00:50:30,746 --> 00:50:37,410 selekčných signálov alebo QTL lokusov a rovnako aj ich funkcie 629 00:50:37,480 --> 00:50:41,680 vzhľadom na zaujímavé fenotypové znaky a vlastnosti 630 00:50:41,746 --> 00:50:46,570 z pohľadu chovu hospodárskych zvierat môžeme nazvať aj pojmom funkčná anotácia 631 00:50:46,640 --> 00:50:48,890 selekčných signálov. 632 00:50:48,960 --> 00:50:55,640 Čo sa týka funkčnej anotácie, tak sa môžeme zaoberať jednak samotnou identifikáciou 633 00:50:55,706 --> 00:51:00,600 génov, ale súčasne aj analýzou ich biologických funkcií a v 634 00:51:00,666 --> 00:51:05,480 tejto súvislosti môžeme využívať rôzne nástroje, ako sú napr. 635 00:51:05,546 --> 00:51:07,570 GO alebo KEGG. 636 00:51:07,640 --> 00:51:13,480 Tieto nástroje nám zvyčajne umožňujú identifikovať nielen potenciálnu funkciu génov 637 00:51:13,546 --> 00:51:18,040 v organizme, ale aj súčasne biologické dráhy, v ktorých 638 00:51:18,106 --> 00:51:21,130 sú tieto gény zapojené. 639 00:51:21,200 --> 00:51:26,480 Medzi najčastejšie využívané databázy pre vyhľadávanie QTL lokusov 640 00:51:26,546 --> 00:51:29,970 patrí databáza Animal QTLdb. 641 00:51:30,040 --> 00:51:34,640 Táto databáza obsahuje informácie o QTL lokusoch asociovaných s významnými 642 00:51:34,706 --> 00:51:39,130 fenotypovými vlastnosťami rôznych druhov hospodárskych zvierat. 643 00:51:39,200 --> 00:51:44,120 A zase, pokiaľ by sme chceli hovoriť o databáze, kde môžeme vyhľadávať 644 00:51:44,186 --> 00:51:49,810 gény, ktoré sú lokalizované v určitých alebo konkrétnych genetických oblastiach, 645 00:51:49,880 --> 00:51:55,970 môžeme využiť napríklad databázu BioMart pre funkčnú analýzu génov. 646 00:51:56,040 --> 00:52:00,840 Existuje viacero programov alebo aj webových nástrojov. 647 00:52:00,906 --> 00:52:06,600 Jedným z takýchto nástrojov je nástroj, ktorý sa volá David a ten teda 648 00:52:06,666 --> 00:52:11,160 slúži na funkčnú anotáciu, analýzu úlohy génov, vrátane klasifikácie podľa 649 00:52:11,226 --> 00:52:16,970 biologických procesov a dráh, v ktorých sú takéto gény zapojené. 650 00:52:17,040 --> 00:52:22,960 Medzi výhody funkčnej anotácie oblastí, ktoré sú signifikantne ovplyvnené 651 00:52:23,026 --> 00:52:29,330 selekciou, patrí najmä fakt, že prostredníctvom takejto analýzy vieme 652 00:52:29,400 --> 00:52:34,370 získať informáciu o QTL lokusoch a génoch a 653 00:52:34,440 --> 00:52:38,050 môžeme získať lepšiu predstavu o tom, 654 00:52:38,120 --> 00:52:43,130 ktoré genetické varianty ovplyvnené selekciou sú zapojené, v akom 655 00:52:43,200 --> 00:52:48,850 procese kontrolujúcom významné fenotypové znaky a vlastnosti. 656 00:52:48,920 --> 00:52:52,930 Takéto varianty potom samozrejme môžu byť predmetom ďalšieho 657 00:52:53,000 --> 00:52:58,800 výskumu a následne môžu byť pomerne dobre zapojené pri selekcii v 658 00:52:58,866 --> 00:53:00,690 šľachtiteľských programoch. 659 00:53:00,760 --> 00:53:05,480 Medzi nevýhody patrí najmä fakt, že prekryv medzi oblasťami selekčných 660 00:53:05,546 --> 00:53:11,730 signálov a funkčnými oblasťami nemusí vždy znamenať aj kauzálny vzťah medzi nimi 661 00:53:11,800 --> 00:53:17,160 a aj skutočnosť, že informácie, ktoré sú momentálne dostupné v databázach, sú 662 00:53:17,226 --> 00:53:22,040 limitované na aktuálne poznatky a samozrejme tým pádom nie vždy musia 663 00:53:22,106 --> 00:53:28,610 pokrývať všetky relevantné gény, respektíve QTL lokusy. 664 00:53:28,680 --> 00:53:33,680 Na tomto slajde máte uvedený zoznam článkov, ktoré som využila 665 00:53:33,746 --> 00:53:36,010 na prípravu tejto prezentácie. 666 00:53:36,080 --> 00:53:40,690 Jedná sa o články, ktoré vznikli samozrejme u nás na pracovisku 667 00:53:40,760 --> 00:53:47,770 a súčasne sú tieto články ešte aj na zdieľanie v priečinku "Kľúčové články". 668 00:53:47,840 --> 00:53:54,000 V prípade, ak sa budete chcieť touto problematikou zaoberať aj ďalej a viac do 669 00:53:54,066 --> 00:53:59,410 hĺbky, odporúčam Vám si tieto články preštudovať. 670 00:53:59,480 --> 00:54:02,650 Týmto Vám ďakujem za Vašu pozornosť. 671 00:54:02,720 --> 00:54:09,370 V prípade, ak by ste mali nejaké otázky alebo by ste sa chceli venovať tejto téme 672 00:54:09,440 --> 00:54:13,010 ďalej viac do hĺbky a budete potrebovať 673 00:54:13,080 --> 00:54:16,600 poradiť, prosím kontaktujte ma na mailovej 674 00:54:16,666 --> 00:54:23,600 adrese, ktorú vidíte na slajde. Na slajde je súčasne uvedený aj QR kód, 675 00:54:23,666 --> 00:54:30,600 prostredníctvom ktorého sa môžete dostať aj k ďalším prezentáciám a témam, ktoré 676 00:54:30,666 --> 00:54:33,320 boli spracované v rámci projektu ISAGREED.