1
00:00:00,880 --> 00:00:06,770
Dobrý deň, rada by som Vás privítala na
prednáške pre doktorandský stupeň štúdia.
2
00:00:06,840 --> 00:00:11,920
Táto prednáška bude zameraná na podrobnú
analýzu štruktúry populácie na základe
3
00:00:11,986 --> 00:00:17,370
genomických údajov a kvantifikáciu vplyvu
selekcie na genóm hospodárskych zvierat.
4
00:00:17,440 --> 00:00:24,280
Táto prednáška je súčasťou výstupov
projektu ISAGREED a môžete ju nájsť v
5
00:00:24,346 --> 00:00:29,330
module 2 "Konzervovanie a udržateľné
využívanie genetických zdrojov".
6
00:00:29,400 --> 00:00:33,240
Prednášku spolu so mnou
pripravoval pán profesor Kasarda.
7
00:00:33,306 --> 00:00:37,360
Obidvaja pracujeme na Slovenskej
poľnohospodárskej univerzite v Nitre, na
8
00:00:37,426 --> 00:00:43,890
Fakulte agrobiológie a potravinových
zdrojov a Ústave výživy a genomiky.
9
00:00:43,960 --> 00:00:47,970
Táto prednáška bude
pozostávať zo štyroch častí.
10
00:00:48,040 --> 00:00:53,120
Budeme hovoriť samostatne o kontrole
kvality genomických údajov, o prístupoch a
11
00:00:53,186 --> 00:00:59,400
nástrojoch, ktoré možno použiť na analýzu
populačnej štruktúry a súčasne o
12
00:00:59,466 --> 00:01:03,480
prístupoch a nástrojoch, ktoré možno
využiť na vyhodnotenie vplyvu selekcie
13
00:01:03,546 --> 00:01:05,730
na genóm hospodárskych zvierat.
14
00:01:05,800 --> 00:01:10,760
V poslednej časti sa budeme zaoberať
funkčnou anotáciou oblastí signifikantne
15
00:01:10,826 --> 00:01:14,010
ovplyvnených selekčným tlakom.
16
00:01:14,080 --> 00:01:19,840
Kontrola kvality genomických údajov je
kľúčová a treba ju realizovať pred
17
00:01:19,906 --> 00:01:25,160
akoukoľvek analýzou v súvislosti s
genomickými dátami alebo aj
18
00:01:25,226 --> 00:01:28,450
s akýmkoľvek iným typom dát.
19
00:01:28,520 --> 00:01:33,680
Informácie, ktoré
budú na nasledujúcich slajdoch, sa týkajú
20
00:01:33,746 --> 00:01:40,530
kontroly kvality genomických údajov,
ktoré boli získané použitím SNP čipov.
21
00:01:40,600 --> 00:01:46,280
Pokiaľ máme dáta, ktoré sú nesprávne alebo
nekvalitné, tieto môžu viesť k chybám v
22
00:01:46,346 --> 00:01:51,400
nasledujúcich analýzach a čo je dôležité,
môžu viesť aj k chybnej
23
00:01:51,466 --> 00:01:54,450
interpretácii samotných výsledkov.
24
00:01:54,520 --> 00:02:01,240
Medzi základné ukazovatele kvality dát
patrí úspešnosť genotypovania SNP markerov
25
00:02:01,306 --> 00:02:05,800
celkovo v rámci populácie a potom
úspešnosť genotypovania
26
00:02:05,866 --> 00:02:08,690
týchto markerov v rámci jedincov.
27
00:02:08,760 --> 00:02:13,370
Okrem toho sa často vyhodnocuje aj
frekvencia minoritnej alely,
28
00:02:13,440 --> 00:02:17,080
odchýlka od Hardy-Weinbergovej rovnováhy
či miera väzbovej
29
00:02:17,146 --> 00:02:19,530
nerovnováhy medzi markermi.
30
00:02:19,600 --> 00:02:26,210
Výber ukazovateľov, ktoré budú použité v
kontrole kvality dát, zvyčajne závisí od
31
00:02:26,280 --> 00:02:32,730
typu alebo cieľa analýz, ktoré plánujeme
realizovať v nasledovných krokoch.
32
00:02:32,800 --> 00:02:37,920
Čo sa týka takých štandardných nastavení,
v prípade analýz orientovaných na
33
00:02:37,986 --> 00:02:42,000
hodnotenie genotypovej
štruktúry populácie, resp.
34
00:02:42,066 --> 00:02:48,450
štruktúry populácie ako takej,
zvyčajne sa využíva kontrola kvality
35
00:02:48,520 --> 00:02:54,920
alebo úspešnosti genotypovania SNP
markerov celkovo a v rámci jedincov, kde
36
00:02:54,986 --> 00:03:00,520
zvyčajne v štúdiách môžete nájsť, že sa
selektuje všetky markery, ktoré boli
37
00:03:00,586 --> 00:03:05,850
úspešne genotypované
u minimálne 90% jedincov.
38
00:03:05,920 --> 00:03:11,760
Okrem toho sa zvyčajne aj selektujú
markery, ktorých frekvencia minoritnej
39
00:03:11,826 --> 00:03:15,370
alely v populácii je minimálne 1%.
40
00:03:15,440 --> 00:03:21,360
Toto 1% vyplýva z Mendelistickej
dedičnosti a okrem toho sa z
41
00:03:21,426 --> 00:03:27,170
populácie selektujú aj markery, ktoré
nie sú v Hardy-Weinbergovej
42
00:03:27,240 --> 00:03:32,440
rovnováhe, pretože
na základe viacerých štúdií bolo dokázané,
43
00:03:32,506 --> 00:03:37,920
že hodnotenie genotypovej štruktúry
populácie by malo prebiehať s použitím
44
00:03:37,986 --> 00:03:40,970
markerov, ktoré sú selektívne neutrálne.
45
00:03:41,040 --> 00:03:46,000
Na kontrolu kvality genotypových dát je
možné využiť rôzne softvérové
46
00:03:46,066 --> 00:03:48,290
nástroje alebo programy.
47
00:03:48,360 --> 00:03:53,240
Čo sa týka SNP dát, tak zvyčajne sa
používa program PLINK alebo
48
00:03:53,306 --> 00:03:56,650
iné balíky v programe R.
49
00:03:56,720 --> 00:04:03,090
Čo nám SNP dáta vlastne umožňujú z
pohľadu hodnotenia populačnej štruktúry?
50
00:04:03,160 --> 00:04:08,930
Umožňujú nám analyzovať genetickú
diferenciáciu v rámci a medzi populáciami.
51
00:04:09,000 --> 00:04:14,970
Umožňujú nám napríklad aj hodnotiť mieru
ich genetického premiešania alebo admixie
52
00:04:15,040 --> 00:04:21,250
a rovnako tak aj zmeny, ktoré v dôsledku
takéhoto genetického premiešania v genóme
53
00:04:21,320 --> 00:04:27,000
vzniknú napríklad vplyvom selekcie,
migrácie alebo genetického driftu a
54
00:04:27,066 --> 00:04:32,680
súčasne nám umožňujú stanovovať aj také
základné parametre diverzity, ako je
55
00:04:32,746 --> 00:04:37,880
genomická matica príbuznosti, genomický
inbríding a následne nám umožňujú
56
00:04:37,946 --> 00:04:41,920
optimalizovať priparovacie plány.
57
00:04:42,120 --> 00:04:48,720
Medzi najčastejšie typy analýz, ktoré sú
realizované v súvislosti s hodnotením
58
00:04:48,786 --> 00:04:54,770
populačnej štruktúry, patrí výpočet
Wrightovho fixačného indexu FST,
59
00:04:54,840 --> 00:05:00,930
výpočet genetických vzdialeností a matíc
príbuznosti, analýza hlavných komponentov,
60
00:05:01,000 --> 00:05:04,880
diskriminačná analýza
hlavných komponentov, bayesovská
61
00:05:04,946 --> 00:05:10,280
analýza genetického premiešania, toku
génov medzi populáciami či konštrukcia
62
00:05:10,346 --> 00:05:14,760
fylogenetických stromov a genetických sietí.
63
00:05:14,840 --> 00:05:19,680
Wrightov fixačný index je jedným z takých
základných parametrov, ktoré sa naozaj
64
00:05:19,746 --> 00:05:25,050
používajú na vyhodnotenie
populačnej štruktúry často.
65
00:05:25,120 --> 00:05:29,840
On v podstate umožňuje stanoviť, aký je
stupeň genetickej podobnosti
66
00:05:29,906 --> 00:05:31,890
medzi populáciami.
67
00:05:31,960 --> 00:05:38,360
Môže nadobúdať hodnoty od 0 po 1, pričom
ak by medzi dvoma populáciami bola zistená
68
00:05:38,426 --> 00:05:42,560
hodnota tohto indexu 0, mohli by sme
povedať, že populácie
69
00:05:42,626 --> 00:05:44,610
sú geneticky identické.
70
00:05:44,680 --> 00:05:50,730
A naopak, ak by medzi populáciami bola
zistená hodnota 1, tak populácie by sme
71
00:05:50,800 --> 00:05:56,610
označili za absolútne nepríbuzné a
geneticky úplne diferencované, pretože
72
00:05:56,680 --> 00:06:00,760
vo svojom genóme vykazujú
úplne odlišné frekvencie alel.
73
00:06:00,826 --> 00:06:05,690
čo sa týka výhod a nevýhod tohto prístupu,
74
00:06:05,760 --> 00:06:10,530
tak medzi hlavné výhody stanovenia
Wrightovho fixačného indexu FST
75
00:06:10,600 --> 00:06:15,250
patrí hlavne jednoduchosť
interpretácie získaných výsledkov.
76
00:06:15,320 --> 00:06:22,330
Táto metóda je aj rovnako pomerne rýchla,
nie je náročná na softvérové vybavenie
77
00:06:22,400 --> 00:06:26,320
a umožňuje relatívne spoľahlivo
identifikovať mieru
78
00:06:26,386 --> 00:06:29,010
diferenciácie medzi populáciami.
79
00:06:29,080 --> 00:06:33,280
Čo sa týka nevýhod, tak Wrigtov fixačný
index nie je možné stanoviť
80
00:06:33,346 --> 00:06:35,410
na individuálnej úrovni.
81
00:06:35,480 --> 00:06:40,410
To znamená, že pomocou Wrightovho fixačného
indexu nevieme kvantifikovať
82
00:06:40,480 --> 00:06:44,920
genetické vzťahy medzi jedincami, ale
vieme ho využiť len na hodnotenie
83
00:06:44,986 --> 00:06:47,850
genetických vzťahov medzi populáciami.
84
00:06:47,920 --> 00:06:53,600
Niekedy vykazuje nižšiu spoľahlivosť
hlavne v populáciách, ktoré majú relatívne
85
00:06:53,666 --> 00:06:58,960
nízku úroveň genetickej
variability alebo diverzity.
86
00:06:59,160 --> 00:07:04,720
Medzi najčastejšie využívané balíky na
stanovenie tohto indexu patria napr.
87
00:07:04,786 --> 00:07:07,530
Arlequin, Genepop alebo GenAlEx.
88
00:07:07,600 --> 00:07:12,490
Tieto sú však limitované z pohľadu počtu
SNP markerov, ktoré sú
89
00:07:12,560 --> 00:07:14,890
zahrnuté do analýzy.
90
00:07:14,960 --> 00:07:21,200
V prípade, ak máme SNP dáta alebo dáta
získané použitím genotypovania
91
00:07:21,266 --> 00:07:24,450
jedincov pomocou SNP čipov
92
00:07:24,520 --> 00:07:29,410
môžeme použiť napríklad balík
programu R s názvom StAMPP.
93
00:07:29,480 --> 00:07:34,320
Na obrázku môžete vidieť grafickú
vizualizáciu matice genetických
94
00:07:34,386 --> 00:07:38,730
vzdialeností odhadnutých na základe FST
indexu
95
00:07:38,800 --> 00:07:44,170
a tento obrázok je v podstate dendrogramom,
96
00:07:44,240 --> 00:07:49,080
na ktorom je jasne viditeľné, že
v danej populácii hovädzieho dobytka nám
97
00:07:49,146 --> 00:07:53,210
dochádza k vzniku dvoch
genetických skupín.
98
00:07:53,280 --> 00:08:00,200
Táto analýza bola realizovaná v rámci
šestnástich plemien hovädzieho dobytka.
99
00:08:00,320 --> 00:08:06,610
Čo sa týka matíc príbuznosti, tak matice
príbuznosti nám už umožňujú determinovať
100
00:08:06,680 --> 00:08:10,360
vzájomnú genetickú podobnosť medzi
jedincami, čiže umožňujú nám
101
00:08:10,426 --> 00:08:14,210
hodnotenie na individuálnej úrovni.
102
00:08:14,280 --> 00:08:18,920
Matice príbuznosti vyjadrujú genetické
podobnosti a príbuznosť medzi jedincami v
103
00:08:18,986 --> 00:08:24,400
rámci populácie, pričom každý jeden prvok
matice predstavuje mieru genetickej
104
00:08:24,466 --> 00:08:27,090
podobnosti medzi dvojicou jedincov.
105
00:08:27,160 --> 00:08:32,040
Najčastejšie sa matice príbuznosti
počítajú na základe metód odvodených
106
00:08:32,106 --> 00:08:34,930
od frekvencií alel, ale samotný
107
00:08:35,000 --> 00:08:40,970
výpočet môže byť založený na
rôznych prístupoch, napríklad na
108
00:08:41,040 --> 00:08:45,920
IBD, čo je identita podľa pôvodu alebo
môže byť založený na Neiových
109
00:08:45,986 --> 00:08:48,050
genetických vzdialenostiach.
110
00:08:48,120 --> 00:08:53,600
Medzi také základné výhody počítania alebo
stanovenia matic príbuznosti patria
111
00:08:53,666 --> 00:08:57,890
pomerne presné odhady genetickej
podobnosti medzi jedincami
112
00:08:57,960 --> 00:09:02,040
a tento prístup je naozaj vhodný na
štúdium vnútro-populačných vzťahov,
113
00:09:02,106 --> 00:09:04,730
nielen vzťahov medzi populáciami.
114
00:09:04,800 --> 00:09:12,720
Avšak v prípade niektorých metód na
výpočet môže byť aj časovo náročný.
115
00:09:12,880 --> 00:09:19,280
Na obrázku máte znázornenú
grafickú vizualizáciu matice príbuznosti
116
00:09:19,346 --> 00:09:25,090
počítanej na základe Neiových genetických
vzdialeností v rámci piatich plemien psov,
117
00:09:25,160 --> 00:09:31,770
pričom jedince, ktoré sú viac geneticky
podobné, sú na obrázku znázornené
118
00:09:31,840 --> 00:09:34,450
sýtejším odtieňom oranžovej.
119
00:09:34,520 --> 00:09:39,920
Vidíme, že naozaj na základe genetickej
podobnosti jedincov nám dochádza v takejto
120
00:09:39,986 --> 00:09:43,090
populácii k vytvoreniu piatich klastrov,
121
00:09:43,160 --> 00:09:47,600
ktoré sú odvodené od pôvodu jednotlivých
122
00:09:47,666 --> 00:09:51,410
jedincov, respektíve od
ich plemennej príslušnosti.
123
00:09:51,480 --> 00:09:57,640
Medzi základné softvérové nástroje z
pohľadu výpočtu matíc príbuznosti patrí
124
00:09:57,706 --> 00:10:03,010
napríklad PLINK, pomocou ktorého vieme
vypočítať práve maticu príbuznosti
125
00:10:03,080 --> 00:10:09,330
odvodenú od spoločného pôvodu
126
00:10:09,400 --> 00:10:14,120
predkov, alebo môžeme použiť zase rôzne
balíky v programe R, ako
127
00:10:14,186 --> 00:10:17,960
je napríklad balík StAMPP.
128
00:10:18,200 --> 00:10:23,610
Analýza hlavných komponentov je naozaj
populárnou metódou a nevyužíva sa iba
129
00:10:23,680 --> 00:10:28,960
pre stanovenie alebo pre odhad genetickej
štruktúry populácie alebo stupňa
130
00:10:29,026 --> 00:10:34,320
genetickej diferenciácie v rámci
populácií, ale využíva sa aj na rôzne
131
00:10:34,386 --> 00:10:37,610
iné účely v iných vedných odboroch.
132
00:10:37,680 --> 00:10:44,280
Táto metóda je v podstate založená na
dekomponovaní kovariačnej matice
133
00:10:44,346 --> 00:10:49,560
genetických dát a extrahovaní hlavných
komponentov, ktoré reflektujú
134
00:10:49,626 --> 00:10:53,490
variabilitu v súbore dát, ktorý hodnotíme.
135
00:10:53,560 --> 00:10:59,570
Zvyčajne platí, že najväčšiu mieru
variability v danom súbore dát
136
00:10:59,640 --> 00:11:02,930
vyjadrujú prvé dva hlavné komponenty.
137
00:11:03,000 --> 00:11:08,400
Táto analýza je veľmi populárna aj preto,
že pomerne dobre reflektuje základné
138
00:11:08,466 --> 00:11:13,840
informácie o genetickej štruktúre, čo je
užitočné hlavne pokiaľ testujeme
139
00:11:13,906 --> 00:11:16,810
databázy s veľkým počtom jedincov.
140
00:11:16,880 --> 00:11:22,570
Medzi jej základné výhody patrí časová
nenáročnosť tejto metódy
141
00:11:22,640 --> 00:11:28,000
a rovnako aj pomerne jednoducho a dobre
interpretované výsledky na základe
142
00:11:28,066 --> 00:11:32,690
vizualizácie, ktorú uvidíte na nasledujúcom slajde.
143
00:11:32,760 --> 00:11:37,880
A medzi nevýhody patrí napríklad pomerne
nízka citlivosť z pohľadu testovania
144
00:11:37,946 --> 00:11:41,970
genetického premiešania alebo admixie.
145
00:11:42,040 --> 00:11:48,130
Tak ako som hovorila, na tomto slajde
môžete vidieť príklad
146
00:11:48,200 --> 00:11:53,490
vizualizácie výsledkov analýzy hlavných
komponentov,
147
00:11:53,560 --> 00:11:59,880
pričom genetická diferenciácia v rámci
tejto populácie, ktorá je tvorená
148
00:11:59,946 --> 00:12:04,920
šestnástimi rôznymi plemenami oviec,
je vizualizovaná na základe
149
00:12:04,986 --> 00:12:07,210
prvého a druhého komponentu.
150
00:12:07,280 --> 00:12:12,930
Vidíme, že v danej populácii nám došlo k
vytvoreniu troch
151
00:12:13,000 --> 00:12:18,600
genetických skupín alebo genetických
klastrov, pričom na obrázku každá jedna
152
00:12:18,666 --> 00:12:22,890
bodka znázorňuje jedinca
v danej populácii.
153
00:12:22,960 --> 00:12:29,080
Bližšia analýza týchto jedincov nám naozaj
potvrdila, že jedince vytvárajú genetické
154
00:12:29,146 --> 00:12:35,920
skupiny podľa ich plemennej príslušnosti,
respektíve ich historického alebo
155
00:12:35,986 --> 00:12:38,490
fylogenetického prepojenia v minulosti.
156
00:12:38,560 --> 00:12:43,120
Čo sa týka softvérových nástrojov, tak
zasa na analýzu hlavných komponentov
157
00:12:43,186 --> 00:12:48,440
môžeme použiť napríklad program PLINK
alebo rôzne balíky programu R,
158
00:12:48,506 --> 00:12:52,800
ako je napríklad balík Adegenet.
159
00:12:53,200 --> 00:12:57,960
Ďalšou populárnou metódou z pohľadu
analýzy populačnej štruktúry je
160
00:12:58,026 --> 00:13:01,650
diskriminačná analýza
hlavných komponentov.
161
00:13:01,720 --> 00:13:06,840
Diskriminačná analýza hlavných komponentov
je zameraná hlavne na vizualizáciu
162
00:13:06,906 --> 00:13:12,730
genetickej štruktúry medzi preddefinovanými
skupinami alebo aj klastrami.
163
00:13:12,800 --> 00:13:13,480
Využíva ako už vyplýva z názvu
164
00:13:13,546 --> 00:13:18,400
analýzu hlavných komponentov na redukciu
165
00:13:18,466 --> 00:13:23,160
dimenzie dát a následne diskriminačnú
analýzu na maximalizáciu
166
00:13:23,226 --> 00:13:26,010
rozlíšenia medzi populáciami.
167
00:13:26,080 --> 00:13:30,480
Diskriminačná analýza hlavných komponentov
v porovnaní s klasickou analýzou
168
00:13:30,546 --> 00:13:36,400
hlavných komponentov poskytuje častokrát
presnejšie zobrazenie genetickej štruktúry
169
00:13:36,466 --> 00:13:38,680
medzi vopred definovanými skupinami.
170
00:13:38,746 --> 00:13:44,800
napríklad odlišnými genetickými
subpopuláciami alebo subpopuláciami, ktoré
171
00:13:44,866 --> 00:13:48,930
môžu teoreticky alebo aj
vykazujú genetické premiešanie.
172
00:13:49,000 --> 00:13:53,720
Medzi jej hlavné výhody patrí vysoká
presnosť pri detekcii rozdielov medzi
173
00:13:53,786 --> 00:13:58,720
populáciami, rovnako ako aj jednoduchá a
dobre interpretovateľná
174
00:13:58,786 --> 00:14:00,930
vizualizácia výsledkov.
175
00:14:01,000 --> 00:14:06,120
A medzi nevýhody patrí preddefinovanie
samotných skupín, pretože toto môže
176
00:14:06,186 --> 00:14:13,000
skresliť výsledok hlavne v súvislosti s
kvantifikáciou miery premiešania medzi
177
00:14:13,066 --> 00:14:18,400
populáciami a rovnako táto metóda môže byť
citlivá na nízku úroveň diverzity
178
00:14:18,466 --> 00:14:21,130
alebo vysokú mieru príbuznosti.
179
00:14:21,200 --> 00:14:26,000
Na tejto snímke máme znázornené
reprezentatívne výsledky diskriminačnej
180
00:14:26,066 --> 00:14:28,600
analýzy hlavných komponentov.
181
00:14:28,666 --> 00:14:31,290
Jedná sa o obrázok A, C a D.
182
00:14:31,360 --> 00:14:37,600
Táto analýza bola realizovaná v súbore dát
siedmich farmových populácií
183
00:14:37,666 --> 00:14:41,530
A dvoch voľne žijúcich
populácií jeleňa lesného.
184
00:14:41,600 --> 00:14:47,850
Ako je možné vidieť na obrázku, tak
naozaj analýza umožnila diferencovať
185
00:14:47,920 --> 00:14:52,970
farmové populácie, ktoré vytvárajú jednu
genetickú skupinu v strede
186
00:14:53,040 --> 00:14:58,320
a potom voľne žijúce populácie - slovenskú populáciu tvoria
jedince, ktoré sú znázornené červenou
187
00:14:58,386 --> 00:15:00,840
farbou vľavo a fialovou farbou
188
00:15:00,906 --> 00:15:05,970
vpravo sú znázornené jedince z
voľnej prírody zo Španielska.
189
00:15:06,040 --> 00:15:11,160
Na diskriminačnú analýzu hlavných
komponentov možno využívať napríklad
190
00:15:11,226 --> 00:15:15,090
balík programu R, ktorý sa volá Adegenet.
191
00:15:15,160 --> 00:15:21,000
Častokrát sa v súvislosti s populačnú
štruktúrou hodnotí aj miera premiešania
192
00:15:21,066 --> 00:15:25,410
jednotlivých plemien alebo populácií.
193
00:15:25,480 --> 00:15:30,640
Ono to súvisí jednak s ich geografickým
pôvodom, ale hlavne s
194
00:15:30,706 --> 00:15:32,810
ich historickým pôvodom.
195
00:15:32,880 --> 00:15:38,170
Čo sa týka takejto analýzy, zvyčajne sa
využíva bayesovský prístup,
196
00:15:38,240 --> 00:15:42,720
ktorý nám umožňuje jednak detekciu
populačnej štruktúry, ale zároveň aj
197
00:15:42,786 --> 00:15:48,280
identifikáciu genetických skupín bez
nutnosti preddefinovať skupiny, čo bola
198
00:15:48,346 --> 00:15:52,640
jedna z nevýhod práve predtým popisovanej
diskriminačné analýzy
199
00:15:52,706 --> 00:15:54,610
hlavných komponentov.
200
00:15:54,680 --> 00:16:00,200
Baysovský prístup okrem toho umožňuje aj
identifikáciu genetických skupín, miery
201
00:16:00,266 --> 00:16:06,490
admixie v rámci jedincov, čo je užitočné,
aj pokiaľ chceme napríklad kvantifikovať
202
00:16:06,560 --> 00:16:11,170
mieru alebo intenzitu toku
génov medzi populáciami.
203
00:16:11,240 --> 00:16:15,680
Čo sa týka výhod, tak hlavnou výhodou
Bayesovského prístupu je presná
204
00:16:15,746 --> 00:16:21,760
identifikácia genetických skupín a je to
pomerne flexibilná metóda, ktorú je možné
205
00:16:21,826 --> 00:16:26,800
aplikovať na komplexné štruktúry alebo
komplexné databázy a aj rôzne typy
206
00:16:26,866 --> 00:16:30,450
genetických markerov, nie len SNP markery.
207
00:16:30,520 --> 00:16:34,930
Čo sa týka nevýhod, tento prístup je
naozaj časovo náročný
208
00:16:35,000 --> 00:16:40,920
a spoľahlivosť výsledkov závisí od počtu
použitých SNP markerov a rovnako aj od
209
00:16:40,986 --> 00:16:44,850
počtu testovaných jedincov v analýze.
210
00:16:44,920 --> 00:16:50,320
Na obrázku zase môžeme vidieť príklad
grafickej vizualizácie výsledkov
211
00:16:50,386 --> 00:16:55,400
hodnotenia premiešania
medzi farmovými a voľne
212
00:16:55,466 --> 00:16:59,090
žijúcimi populáciami jeleňa lesného.
213
00:16:59,160 --> 00:17:03,880
Tak ako som hovorila pri diskriminačnej
analýze hlavných komponentov, jedince z
214
00:17:03,946 --> 00:17:08,290
voľnej prírody na Slovensku,
sú znázornené červenou farbou.
215
00:17:08,360 --> 00:17:11,040
Jedince z voľnej prírody
v Španielsku fialovou.
216
00:17:11,106 --> 00:17:17,080
Čiže naozaj táto analýza, ktorá vychádza
nie z vopred preddefinovaných skupín,
217
00:17:17,146 --> 00:17:22,480
potvrdila, že
ku genetickému premiešaniu, v dôsledku
218
00:17:22,546 --> 00:17:27,400
čoho sú aj populácie príbuznejšie,
došlo hlavne v prípade farmových
219
00:17:27,466 --> 00:17:32,320
populácií a naopak populácie z voľnej
prírody nevykazujú vzájomné
220
00:17:32,386 --> 00:17:34,530
genetické premiešanie.
221
00:17:34,600 --> 00:17:39,130
Na analýzu možno použiť
rôznorodé nástroje.
222
00:17:39,200 --> 00:17:45,880
Jedná sa napríklad o programy ako
Structure, Admixture alebo Faststructure.
223
00:17:46,600 --> 00:17:53,570
Čo sa týka toku génov medzi populáciami,
ktorý vzniká hlavne v dôsledku migrácie,
224
00:17:53,640 --> 00:17:57,960
tak tento možno zase
hodnotiť rôznymi nástrojmi.
225
00:17:58,026 --> 00:18:00,970
Jedným z nich je
napríklad program TeeMix.
226
00:18:01,040 --> 00:18:06,520
Ten umožňuje na základe frekvencií alel
vytvárať fylogeneticky stromy s možnosťou
227
00:18:06,586 --> 00:18:10,330
testovania intenzity
migrácie medzi populáciami.
228
00:18:10,400 --> 00:18:15,970
Táto metóda je založená na maximálnej
pravdepodobnosti a umožňuje simultánne
229
00:18:16,040 --> 00:18:20,170
odhadnúť fylogenetické vzťahy
a migráciu medzi populáciami.
230
00:18:20,240 --> 00:18:25,370
Medzi jej hlavné výhody patrí detekcia
intenzity migrácie a toku génov
231
00:18:25,440 --> 00:18:27,970
v minulosti, nielen v súčasnosti.
232
00:18:28,040 --> 00:18:33,280
A zase medzi nevýhody patrí spoľahlivosť
výsledkov, ktorá závisí od množstva
233
00:18:33,346 --> 00:18:39,530
dostupných genotypových informácií, ako aj
spoľahlivosti odhadu frekvencií alel
234
00:18:39,600 --> 00:18:42,770
v jednotlivých populáciách.
235
00:18:42,840 --> 00:18:45,840
Ďalší program, ktorý nám umožňuje
236
00:18:45,906 --> 00:18:49,960
stanoviť intenzitu výmeny génov
237
00:18:50,026 --> 00:18:53,450
medzi populáciami, je program Bayesass.
238
00:18:53,520 --> 00:18:58,080
Ten je založený podobne ako programy na
stanovenie stupňa genetického
239
00:18:58,146 --> 00:19:01,250
premiešania na bayesovskom prístupe.
240
00:19:01,320 --> 00:19:07,720
Tento program sa však zvyčajne využíva na
stanovenie intenzity výmeny génov medzi
241
00:19:07,786 --> 00:19:12,400
populáciami v súčasnosti, čiže až tak veľmi
242
00:19:12,466 --> 00:19:19,050
nereflektuje vzťahy medzi populáciami a jedincami v minulosti.
243
00:19:19,120 --> 00:19:23,290
Na obrázku máte zase ako príklad uvedený
244
00:19:23,360 --> 00:19:27,280
obrázok znázorňujúci intenzitu výmeny
245
00:19:27,346 --> 00:19:31,490
génov medzi populáciami jeleňa lesného.
246
00:19:31,560 --> 00:19:36,440
Ako vidieť z obrázku, tak k intenzívnej
výmene génov došlo naozaj najmä v prípade
247
00:19:36,506 --> 00:19:41,680
farmových populácií, kedy si chovatelia
môžu vymieňať buď zvieratá, alebo si môžu
248
00:19:41,746 --> 00:19:46,760
vymieňať inseminačné dávky od samcov.
249
00:19:47,680 --> 00:19:53,920
Ďalší veľmi často využívaný prístup na
grafickú vizualizáciu genetických vzťahov
250
00:19:53,986 --> 00:19:58,000
medzi populáciami alebo na grafickú
vizualizáciu populačnej štruktúry
251
00:19:58,066 --> 00:20:01,410
je konštrukcia genetických sietí.
252
00:20:01,480 --> 00:20:06,280
Podobne ako tomu bolo v predchádzajúcich
prípadoch, aj tu máme pomerne veľa
253
00:20:06,346 --> 00:20:10,370
možností, ako toto realizovať
aj pomerne veľa programov.
254
00:20:10,440 --> 00:20:16,970
Jedným z programov, ktoré je možné využiť
na tento účel, je program Netview.
255
00:20:17,040 --> 00:20:23,490
Je to nástroj, ktorý sa využíva na
zobrazovanie genetických sietí
256
00:20:23,560 --> 00:20:28,960
a vzťahov medzi jedincami alebo
populáciami, ktoré sú založené hlavne na
257
00:20:29,026 --> 00:20:34,120
príbuznosti a toku génov medzi nimi
a je pomerne dobrým nástrojom na
258
00:20:34,186 --> 00:20:37,400
zhodnotenie komplexných
vzťahov, ako aj vplyvu napr.
259
00:20:37,466 --> 00:20:41,890
migrácie na genofond
jednotlivých populácií.
260
00:20:41,960 --> 00:20:45,280
Medzi hlavné výhody programu Netview.
261
00:20:45,346 --> 00:20:50,050
čo sa týka analýzy populačnej štruktúry
patrí pomerne
262
00:20:50,120 --> 00:20:52,560
dobrá vizualizácia alebo intuitívna
263
00:20:52,626 --> 00:20:57,770
vizualizácia a hlavne aj popis výsledkov.
264
00:20:57,840 --> 00:21:02,720
Tento prístup nám do určitej miery aj
pomerne dobre zobrazuje mieru premiešania
265
00:21:02,786 --> 00:21:07,010
jednotlivých populácií a rovnako
aj diferenciácie populácií.
266
00:21:07,080 --> 00:21:12,440
Čo sa týka nevýhod, je tento program limitovaný
267
00:21:12,506 --> 00:21:17,290
pokiaľ hodnotíme populácie
s veľkým počtom jedincov.
268
00:21:17,360 --> 00:21:24,250
Na tomto slajde máme znázornenú
grafickú vizualizáciu troch modelov,
269
00:21:24,320 --> 00:21:29,280
ktorými sme chceli vyhodnotiť
genetické vzťahy medzi šestnástimi
270
00:21:29,346 --> 00:21:32,450
plemenami hovädzieho dobytka.
271
00:21:32,520 --> 00:21:38,090
V rámci základných nastavení, ktoré
program vyžaduje, je nastavenie
272
00:21:38,160 --> 00:21:44,450
početnosti vzájomných prepojení medzi
jedincami, z ktorých nám potom aj vyplýva
273
00:21:44,520 --> 00:21:47,840
množstvo genetických skupín, ktoré
potenciálne v danej
274
00:21:47,906 --> 00:21:50,330
populácii mohli vznikať.
275
00:21:50,400 --> 00:21:56,160
Čím viac prepojení medzi jedincami
povolíme, alebo viac výmeny
276
00:21:56,226 --> 00:22:01,970
génov medzi jedincami prostredníctvom
reprodukcie jedincov povolíme v minulosti,
277
00:22:02,040 --> 00:22:06,320
tým v podstate menej genetických skupín
278
00:22:06,386 --> 00:22:09,410
nám bude vznikať, lebo lepšie odzrkadľujú
279
00:22:09,480 --> 00:22:13,570
takéto prepojenie medzi
jednotlivými jedincami v populácii.
280
00:22:13,640 --> 00:22:20,850
Ale je to veľmi individuálne a pri tomto
prístupe je naozaj dobré poznať
281
00:22:20,920 --> 00:22:27,160
historické pozadie plemien, ktoré sú
zahrnuté v analýze, pretože toto nám potom
282
00:22:27,226 --> 00:22:32,600
umožní interpretovať dobre výsledky aj
nastaviť jednotlivé scenáre, ktoré
283
00:22:32,666 --> 00:22:36,680
v danej populácii chceme testovať.
284
00:22:37,320 --> 00:22:41,520
Čo sa týka konštrukcie fylogenetických
stromov, tak táto konštrukcia
285
00:22:41,586 --> 00:22:46,290
fylogenetických stromov častokrát vychádza
aj z matíc príbuznosti,
286
00:22:46,360 --> 00:22:52,120
pričom najčastejšie sa používa Neiova
genetická matica príbuznosti
287
00:22:52,186 --> 00:22:54,280
alebo potom aj IBD matica.
288
00:22:54,346 --> 00:22:59,200
Čiže to sú matice, ktoré matematicky
vyjadrujú vzťah medzi dvoma
289
00:22:59,266 --> 00:23:01,010
jedincami v populácii, čiže
290
00:23:01,080 --> 00:23:05,650
potrebujeme tento vzťah vyhodnotiť
na individuálnej úrovni.
291
00:23:05,720 --> 00:23:10,600
Takéto stromy potom vlastne predstavujú
grafickú reprezentáciu evolučných vzťahov
292
00:23:10,666 --> 00:23:13,490
medzi populáciami, druhmi a jedincami
293
00:23:13,560 --> 00:23:15,850
na základe dát, ktoré hodnotíme.
294
00:23:15,920 --> 00:23:20,080
No a používajú sa napríklad nielen v
prípade genetických dát, ale aj v prípade
295
00:23:20,146 --> 00:23:26,000
genealogických dát
a umožňujú modelovanie evolučných procesov
296
00:23:26,066 --> 00:23:30,360
alebo aj sledovanie diferenciácie a
migrácie medzi jednotlivými
297
00:23:30,426 --> 00:23:33,570
jedincami v rámci populácií.
298
00:23:33,640 --> 00:23:38,680
Na obrázku môžete vidieť príklad
grafickej vizualizácie
299
00:23:38,746 --> 00:23:41,170
takéhoto fylogenetického stromu.
300
00:23:41,240 --> 00:23:45,040
Táto vizualizácia bola realizovaná pomocou
301
00:23:45,106 --> 00:23:48,960
programu SplitsTree a je založená na
302
00:23:49,026 --> 00:23:52,810
matici genetických
vzdialeností podľa Neia.
303
00:23:52,880 --> 00:23:58,360
Samozrejme môžeme použiť aj rôzne iné
programy, ako je SplitsTree, napríklad
304
00:23:58,426 --> 00:24:03,690
rôzne balíky programu R alebo
program Mega, ak máme sekvenčné dáta.
305
00:24:03,760 --> 00:24:08,520
Čo sa týka obrázku, tak na obrázku sú
znázornené genetické vzťahy
306
00:24:08,586 --> 00:24:11,770
medzi rôznymi plemenami koní.
307
00:24:11,840 --> 00:24:17,560
Táto štúdia bola hlavne orientovaná na
kvantifikáciu vzťahov slovenského
308
00:24:17,626 --> 00:24:21,640
teplokrvníka s inými teplokrvnými plemenami koní,
309
00:24:21,706 --> 00:24:24,760
ktoré sú chované v Európe.
310
00:24:25,560 --> 00:24:31,320
V ďalšej časti prednášky by som sa chcela
venovať prístupom a nástrojom, ktoré je
311
00:24:31,386 --> 00:24:37,410
možné využiť na vyhodnotenie vplyvu
selekcie na genóm hospodárskych zvierat.
312
00:24:37,480 --> 00:24:42,760
Čo sa týka kvantifikácie vplyvu selekcie
na genóm hospodárskych zvierat, jedná sa v
313
00:24:42,826 --> 00:24:48,640
podstate o identifikáciu špecifických
genomických oblastí, ktoré sú pod
314
00:24:48,706 --> 00:24:54,770
selekčným tlakom a takéto oblasti
sa nazývajú aj selekčné signály.
315
00:24:54,840 --> 00:24:59,680
Identifikácia alebo vyhodnotenie
distribúcie selekčných signálov v genóme
316
00:24:59,746 --> 00:25:04,320
nám umožňuje lepšie pochopiť napríklad
evolučné procesy a vplyv samotnej
317
00:25:04,386 --> 00:25:09,450
domestikácie hospodárskych zvierat,
ale aj spoločenských zvierat,
318
00:25:09,520 --> 00:25:14,160
a súčasne nám umožňuje
stanoviť vplyv prírodnej a intenzívnej
319
00:25:14,226 --> 00:25:20,080
zámernej selekcie na špecifické genomické
oblasti, ktoré kontrolujú preferované
320
00:25:20,146 --> 00:25:26,010
fenotypové znaky, či už z pohľadu
adaptability, odolnosti v prípade
321
00:25:26,080 --> 00:25:31,320
prírodnej selekcie alebo úžitkovosti
jedincov populácií či druhov hospodárskych
322
00:25:31,386 --> 00:25:34,610
zvierat z pohľadu zámernej selekcie.
323
00:25:34,680 --> 00:25:39,920
Okrem toho nám analýza
selekčných signálov umožňuje
324
00:25:39,986 --> 00:25:46,520
identifikovať oblasti v genóme, ktoré
vykazujú vysokú mieru homozygotnosti,
325
00:25:46,586 --> 00:25:50,890
to znamená zníženie genetickej
variability, respektíve diverzity
326
00:25:50,960 --> 00:25:55,960
a naopak identifikovať genomické oblasti,
ktoré vykazujú zvýšenie
327
00:25:56,026 --> 00:25:57,930
genetickej diverzity.
328
00:25:58,000 --> 00:26:04,760
Jednou z výhod týchto prístupov je aj
fakt, že pri hľadaní
329
00:26:04,826 --> 00:26:10,600
selekčných signálov v genóme nepotrebujeme
fenotypové informácie, čiže táto analýza alebo
330
00:26:10,666 --> 00:26:16,890
tieto všetky metódy nevyužívajú informácie
o fenotype daných jedincov.
331
00:26:16,960 --> 00:26:19,080
Pre stanovenie selekčných signálov
v genóme hospodárskych zvierat sa
332
00:26:19,146 --> 00:26:23,370
v súčasnosti využívajú v podstate
333
00:26:23,440 --> 00:26:26,810
dve základné skupiny prístupov.
334
00:26:26,880 --> 00:26:32,200
Prvú skupinu tvoria prístupy, ktoré sú
založené na vyhodnocovaní alebo
335
00:26:32,266 --> 00:26:37,450
identifikovaní rozdielov
v štruktúre genómu medzi plemenami
336
00:26:37,520 --> 00:26:42,920
alebo medzi populáciami a druhú skupinu
337
00:26:42,986 --> 00:26:50,490
vytvárajú prístupy, ktoré sú založené na
hodnotení vnútro-populačnej variability.
338
00:26:50,560 --> 00:26:56,200
Čo sa týka hodnotenia rozdielov medzi
populáciami v utváraní genómu alebo v
339
00:26:56,266 --> 00:27:00,010
štruktúre genómu,
tak najčastejšie sa využíva stanovenie
340
00:27:00,080 --> 00:27:04,450
Wrightovho fixačného indexu FST na celogenómovej úrovni,
341
00:27:04,520 --> 00:27:08,560
rovnako ako aj vyhodnocovanie rozdielov vo
väzbovej nerovnováhe v určitých
342
00:27:08,626 --> 00:27:12,090
špecifických úsekoch v genóme.
343
00:27:12,160 --> 00:27:16,610
Ale napríklad tu môžeme využiť
aj analýzu hlavných komponentov.
344
00:27:16,680 --> 00:27:23,290
Čo sa týka hodnotenia na vnútro-populačnej
úrovni, využívajú sa prístupy založené na
345
00:27:23,360 --> 00:27:27,680
determinovaní homozygotných a
heterozygotných úsekov.
346
00:27:27,746 --> 00:27:33,490
Rovnako je tu možné využiť aj analýzu
variability vo väzbovej nerovnováhe
347
00:27:33,560 --> 00:27:38,160
alebo napríklad Tajima D štatistiku.
348
00:27:38,240 --> 00:27:43,760
Wrightov FST index je v súčasnosti jeden z najvyužívanejších
349
00:27:43,826 --> 00:27:48,840
prístupov z pohľadu identifikácie
selekčných signálov, ktoré reflektujú
350
00:27:48,906 --> 00:27:53,730
mieru rozdielnosti medzi dvoma plemenami
alebo medzi viacerými plemenami.
351
00:27:53,800 --> 00:27:58,640
V tomto prípade sú selekčné signály
identifikované na základe rozdielov vo
352
00:27:58,706 --> 00:28:04,080
frekvenciách alel medzi populáciami,
ktoré vznikli napríklad v dôsledku
353
00:28:04,146 --> 00:28:08,370
rozdielneho chovného cieľa
alebo plemenného štandardu.
354
00:28:08,440 --> 00:28:15,410
Pomocou tohto prístupu alebo tejto metódy
môžeme získať dva základné typy signálov,
355
00:28:15,480 --> 00:28:19,490
ktoré aj zodpovedajú rôznym typom selekcie.
356
00:28:19,560 --> 00:28:24,760
Prvým typom signálu sú úseky, ktoré vykazujú vysoké
357
00:28:24,826 --> 00:28:28,490
hodnoty Wrightovho FST indexu a tieto
358
00:28:28,560 --> 00:28:32,250
reprezentujú lokusy alebo SNP markery,
359
00:28:32,320 --> 00:28:38,000
ktoré majú rozdielne frekvencie alel
medzi dvoma plemenami a naopak
360
00:28:38,066 --> 00:28:42,690
druhým typom signálov sú signály, ktoré
361
00:28:42,760 --> 00:28:45,880
sú reprezentované SNP markery alebo lokusmi s
362
00:28:45,946 --> 00:28:51,520
nízkou hodnotou FST indexu a v tomto
prípade dané plemená alebo populácie
363
00:28:51,586 --> 00:28:55,320
podliehali rovnakému typu selekcie.
364
00:28:55,880 --> 00:29:03,050
Čo sa týka hraničnej hodnoty definujúcej
selekčný signál, najčastejšie sa využíva
365
00:29:03,120 --> 00:29:08,720
výber najvyšších hodnôt - 1%
najvyšších hodnôt Wrightovho FST indexu,
366
00:29:08,786 --> 00:29:13,810
pretože zvyčajne sa identifikujú alebo
hľadajú signály, ktoré reflektujú
367
00:29:13,880 --> 00:29:17,330
rozdielnosť medzi dvoma
alebo viacerými plemenami.
368
00:29:17,400 --> 00:29:22,920
Medzi výhody tejto metódy patrí hlavne
relatívne jednoduchý spôsob
369
00:29:22,986 --> 00:29:29,410
výpočtu a široké využitie naprieč rôznymi
populáciami, druhmi, plemenami
370
00:29:29,480 --> 00:29:34,450
a medzi nevýhodu patrí častokrát to, že
371
00:29:34,520 --> 00:29:37,040
nie je možné využiť tento prístup na
372
00:29:37,106 --> 00:29:41,320
identifikáciu selekčných signálov na
vnútro-populačnej úrovni
373
00:29:41,386 --> 00:29:43,810
a súčasne častokrát je
374
00:29:43,880 --> 00:29:49,480
nevýhodou tohto prístupu aj to, že
selekčné signály reflektujú určitú mieru
375
00:29:49,546 --> 00:29:56,360
rozdielnosti medzi plemenami, ktorá nie je
odvodená od súčasných plemenných
376
00:29:56,426 --> 00:30:04,320
štandardov alebo cieľov, ale reprezentuje
veľmi veľa generácií predkov dozadu.
377
00:30:05,040 --> 00:30:11,760
Na obrázku, ktorý vidíte na slajde, máte
znázornenú grafickú vizualizáciu FST
378
00:30:11,826 --> 00:30:16,330
hodnôt naprieč genómom
379
00:30:16,400 --> 00:30:19,690
mäsových plemien dobytka. Distribúcia hodnôt
380
00:30:19,760 --> 00:30:26,770
je tam znázornená pomocou bodov, pričom
hraničná hodnota 1% nejvyšších hodnot
381
00:30:26,840 --> 00:30:31,810
FST indexu je znázornená modrou čiarou.
382
00:30:31,880 --> 00:30:37,720
Okrem toho, čo je zvyčajne súčasťou týchto
prístupov, je aj identifikácia génov,
383
00:30:37,786 --> 00:30:44,290
ktoré sú lokalizované v okolí alebo priamo v oblasti
selekčného signálu a rovnako aj QTL
384
00:30:44,360 --> 00:30:50,720
markerov, pretože toto nám môže napovedať,
prečo došlo v danej oblasti k vzniku
385
00:30:50,786 --> 00:30:55,690
selekčného signálu a čo môžu kontrolovať
386
00:30:55,760 --> 00:30:58,680
Jednonukleotidové polymorfizmy alebo SNP markery
387
00:30:58,746 --> 00:31:02,170
v oblasti selekčného signálu z pohľadu fenotypu.
388
00:31:02,240 --> 00:31:08,200
Vpravo na slajde máte znázornené
vybrané selekčné signály, ktoré boli
389
00:31:08,266 --> 00:31:12,840
determinované v genóme mäsových plemien na
základe FST indexu a rovnako
390
00:31:12,906 --> 00:31:14,610
aj QTL lokusy alebo lokusy
391
00:31:14,680 --> 00:31:20,760
pre kvantitatívne znaky, ktoré
je možné nájsť v týchto oblastiach a ktoré
392
00:31:20,826 --> 00:31:25,730
boli v predchádzajúcich štúdiách
preukazne asociované s nejakým významným
393
00:31:25,800 --> 00:31:29,610
fenotypovým znakom alebo vlastnosťou.
394
00:31:29,680 --> 00:31:35,600
Ďalším z prístupov, ktoré nám umožňujú
vyhodnocovať selekčné signály, ktoré
395
00:31:35,666 --> 00:31:40,880
vznikajú v genóme v dôsledku odlišností
medzi dvoma plemenami alebo viacerými
396
00:31:40,946 --> 00:31:45,850
plemenami, sú metódy založené na
397
00:31:45,920 --> 00:31:48,570
rozdieloch vo väzbovej nerovnováhe.
398
00:31:48,640 --> 00:31:53,560
Ja budem spomínať hlavne metódu výpočtu
integrovaného skóre haplotypov,
399
00:31:53,626 --> 00:31:56,370
ktorého skratka je iHS.
400
00:31:56,440 --> 00:32:00,480
Jedná sa o selekčné signály, ktoré sú
odvodené od zmeny vo väzbovej
401
00:32:00,546 --> 00:32:07,080
nerovnováhe v genóme hodnotených plemien
a aj od vzniku špecifických haplotypov v
402
00:32:07,146 --> 00:32:11,810
dôsledku väzbovej nerovnováhy medzi nimi.
403
00:32:11,880 --> 00:32:14,720
Pod pojmom haplotyp si treba predstaviť
404
00:32:14,786 --> 00:32:20,000
skupinu génov, ktoré sú vo vzájomnej väzbe a
405
00:32:20,066 --> 00:32:24,960
kontrolujú nejaký preferovaný
fenotypový znak alebo vlastnosť.
406
00:32:25,026 --> 00:32:30,840
Takáto väzba medzi určitými variantami alebo
génmi vznikla napríklad v dôsledku
407
00:32:30,906 --> 00:32:36,170
dlhodobej selekcie na určitý špecifický
fenotypový znak alebo vlastnosť.
408
00:32:36,240 --> 00:32:42,360
Hodnota iHS je v podstate definovaná veľmi
jednoducho ako miera vyjadrujúca, ako
409
00:32:42,426 --> 00:32:49,050
neobvyklý je haplotyp
pozostávajúci zo špecifických SNP markerov
410
00:32:49,120 --> 00:32:53,560
v porovnaní so zvyškom genómu.
411
00:32:54,680 --> 00:33:01,000
Metóda integrovaného skóre haplotypov je
obzvlášť citlivou metódou na detekciu
412
00:33:01,066 --> 00:33:04,320
efektu selekcie, ku ktorej došlo relatívne
413
00:33:04,386 --> 00:33:08,080
nedávno a ktorá viedla v populácii k
414
00:33:08,146 --> 00:33:15,130
zvýšeniu frekvencie určitého alelického
variantu, ktorý kontroluje preferovaný
415
00:33:15,200 --> 00:33:21,000
fenotypový znak alebo vlastnosť, ale
ktorá ešte nestihla v populácii eliminovať
416
00:33:21,066 --> 00:33:25,680
iné varianty alebo iné alely, ktoré z pohľadu
417
00:33:25,746 --> 00:33:30,250
Fenotypového znaku alebo vlastnosti
nie sú tak žiaduce.
418
00:33:30,320 --> 00:33:36,570
Táto metóda sa začína výpočtom hodnoty EHH. EHH vlastne
419
00:33:36,640 --> 00:33:43,090
vyjadruje homozygotnosť haplotypu v určitom genomickom regióne
420
00:33:43,160 --> 00:33:50,330
a v podstate kvantifikuje pokles homozygotnosti
haplotypu od určitého SNP markera.
421
00:33:50,400 --> 00:33:56,760
Následne pokračuje metóda výpočtom hodnoty
iHS, ktorý je založený na logaritme
422
00:33:56,826 --> 00:34:02,330
pomeru integrovaných hodnôt EHH
pre dva alelické varianty.
423
00:34:02,400 --> 00:34:07,730
Integrované skóre haplotypov
môže nadobúdať pozitívne hodnoty.
424
00:34:07,800 --> 00:34:13,970
To znamená, že daný haplotyp nesúci jednu
alebo je dlhší a má vyššiu hodnotu EHH,
425
00:34:14,040 --> 00:34:18,730
čo súčasne indikuje signifikantný vplyv pozitívnej selekcie
426
00:34:18,800 --> 00:34:25,050
alebo môže nadobúdať negatívne hodnoty,
kedy alternatívna alela má vyššiu hodnotu
427
00:34:25,120 --> 00:34:31,570
EHH, čo takisto môže odrážať
vplyv selekcie, ale v opačnom smere.
428
00:34:31,640 --> 00:34:37,960
Hraničná hodnota v prípade tejto metódy
definujúca signál sa stanovuje podobne ako
429
00:34:38,026 --> 00:34:43,800
pri metóde FST, to znamená napríklad na
základe 1% najvyšších
430
00:34:43,866 --> 00:34:47,530
pozitívnych hodnôt
integrovaného skóre haplotypov.
431
00:34:47,600 --> 00:34:53,600
Medzi základné výhody tohto prístupu patrí
fakt, že sa jedná o prístup vhodný na
432
00:34:53,666 --> 00:34:59,610
detekciu efektu nedávnej selekcie
a identifikáciu signálov vykazujúcich
433
00:34:59,680 --> 00:35:03,570
napríklad aj vplyv adaptácie
434
00:35:03,640 --> 00:35:09,880
A súčasne táto analýza poskytuje možnosť vyhodnotenia
435
00:35:09,946 --> 00:35:12,210
haplotypovej štruktúry populácií.
436
00:35:12,280 --> 00:35:17,320
Medzi nevýhody tejto metódy patrí určite
potreba kvalitných a robustných
437
00:35:17,386 --> 00:35:23,730
genomických dát a súčasne aj analýza,
ktorá predchádza
438
00:35:23,800 --> 00:35:26,320
samotnému stanoveniu iHS hodnoty
439
00:35:26,386 --> 00:35:31,600
A to je analýza, ktorej výsledkom je
rekonštrukcia haplotypov alebo určenie
440
00:35:31,666 --> 00:35:38,570
frekvencie jednotlivých haplotypov
daných populáciách, ktoré analyzujeme.
441
00:35:38,640 --> 00:35:45,200
Na obrázku máte znázornenú
analýzu integrovaného skóre haplotypov,
442
00:35:45,266 --> 00:35:51,560
respektíve analýzu variability vo väzbovej
nerovnováhe u holštajnského plemena a
443
00:35:51,626 --> 00:35:54,810
potom aj iných plemien mäsového dobytka.
444
00:35:54,880 --> 00:36:01,200
Cieľom bolo zistiť, v ktorých
regiónoch sa signifikantne líši väzbová
445
00:36:01,266 --> 00:36:05,490
nerovnováha u holštajnského
dobytka a iných mäsových plemien.
446
00:36:05,560 --> 00:36:09,960
Na základe výsledkov sme zistili, že
takéto regióny sa nachádzajú napríklad na
447
00:36:10,026 --> 00:36:16,560
chromozómoch 7, 13, 2 a 26
v blízkosti QTL markerov zodpovedných
448
00:36:16,626 --> 00:36:19,720
napríklad za produkciu mlieka alebo obsah tuku
449
00:36:19,786 --> 00:36:22,200
a bielkovín v mlieku.
450
00:36:23,160 --> 00:36:29,450
Ďalšou z analýz, ktoré je možné využiť na
stanovenie selekčných signálov v genóme
451
00:36:29,520 --> 00:36:35,690
hospodárskych zvierat, je metóda
založená na analýze hlavných komponentov.
452
00:36:35,760 --> 00:36:42,010
Táto metóda, podľa toho, čo uvádzajú
autori metódy aj predchádzajúce štúdie,
453
00:36:42,080 --> 00:36:47,920
je metódou, ktorá primárne identifikuje
selekčné signály, ktoré v genóme vznikli
454
00:36:47,986 --> 00:36:53,520
v dôsledku lokálnej adaptácie jedincov na
podmienky prostredia, čiže reflektuje
455
00:36:53,586 --> 00:36:56,730
hlavne vplyv prírodnej selekcie.
456
00:36:56,800 --> 00:37:00,800
Považuje sa za alternatívnu metódu pre
identifikáciu selekčných
457
00:37:00,866 --> 00:37:04,200
signálov k FST indexu.
458
00:37:04,266 --> 00:37:09,360
Je ju možné aplikovať na identifikáciu selekčných signálov pri
459
00:37:09,426 --> 00:37:15,000
porovnávaní dvoch a viacerých plemien,
ale nie je ju možné aplikovať, pokiaľ
460
00:37:15,066 --> 00:37:19,970
chceme identifikovať signály vo vnútri
genómu jedného plemena alebo
461
00:37:20,040 --> 00:37:22,730
genofondu jedného plemena.
462
00:37:22,800 --> 00:37:27,360
Detekcia selekčných signálov v tomto
prípade vychádza z predpokladu existencie
463
00:37:27,426 --> 00:37:33,200
korelácie medzi genetickými variantmi a
hlavnými komponentmi, ktorá reflektuje
464
00:37:33,266 --> 00:37:36,840
lokálnu adaptáciu jednotlivých populácií
na produkčné, respektíve
465
00:37:36,906 --> 00:37:39,720
chovateľské prostredie.
466
00:37:41,000 --> 00:37:46,480
Metóda je založená na rôznych následných analýzach.
467
00:37:46,546 --> 00:37:51,970
Jednou z týchto analýz alebo testov je
Mahalanobisov štatistický test,
468
00:37:52,040 --> 00:37:57,200
ktorý hodnotí vzdialenosť bodov od
priemeru a vlastne slúži na identifikáciu
469
00:37:57,266 --> 00:38:02,090
SNP markerov vykazujúcich asociáciu s
pozitívnou selekciou
470
00:38:02,160 --> 00:38:07,120
na základe zostavenia Z skóre získaného
regresnej analýzou vzťahu medzi SNP
471
00:38:07,186 --> 00:38:13,130
markermi a hlavnými komponentmi
analýzy hlavných komponentov.
472
00:38:13,200 --> 00:38:17,840
V tomto prípade hraničnú hodnotu
definujúcu selekčný
473
00:38:17,906 --> 00:38:20,320
signál možno stanoviť napr.
474
00:38:20,386 --> 00:38:22,730
na základe FDR testu.
475
00:38:22,800 --> 00:38:29,360
Čo sa týka výhod, je to pomerne efektívna
metóda aj na vizualizáciu alebo analýzu
476
00:38:29,426 --> 00:38:33,810
populačnej štruktúry a na
identifikáciu selekčných signálov.
477
00:38:33,880 --> 00:38:39,440
Avšak čo sa týka nevýhod, jedná sa o
alternatívny prístup, ktorý
478
00:38:39,506 --> 00:38:45,170
nie je až tak často využívaný a v prípade
479
00:38:45,240 --> 00:38:49,160
toho, akú populáciu hodnotíme, môže
480
00:38:49,226 --> 00:38:55,560
byť aj komplikovaná interpretácia
výsledkov v porovnaní s inými metódami.
481
00:38:56,040 --> 00:39:03,370
Na obrázku máte znázornené výsledky analýzy
selekčných signálov na základe
482
00:39:03,440 --> 00:39:05,890
PCA analýzy.
483
00:39:05,960 --> 00:39:11,160
Na prvom obrázku vľavo máte znázornený
prvý krok analýzy, čo je testovanie
484
00:39:11,226 --> 00:39:16,720
populačnej štruktúry alebo genotypovej
štruktúry a na ďalšom obrázku už máte
485
00:39:16,786 --> 00:39:22,050
znázornený samotný výsledok analýzy
selekčných signálov,
486
00:39:22,120 --> 00:39:26,960
pričom v tomto prípade sme napríklad
identifikovali selekčné signály na
487
00:39:27,026 --> 00:39:31,850
chromozómoch 1, 2, 3, 6, 9, 11, 13 a 22,
488
00:39:31,920 --> 00:39:35,570
pričom tieto boli
489
00:39:35,640 --> 00:39:41,800
V oblasti QTL lokusov asociovaných
napríklad s hmotnosťou pri otelení,
490
00:39:41,866 --> 00:39:44,530
keďže analýza bola realizovaná u dobytka
491
00:39:44,600 --> 00:39:49,570
alebo aj v oblastiach QTL lokusov
492
00:39:49,640 --> 00:39:55,120
asociovaných so skóre mramorovania, čiže
fenotypovými vlastnosťami významnými pre chov
493
00:39:55,186 --> 00:39:59,600
mäsových plemien dobytka,
ale aj iných plemien dobytka.
494
00:40:00,040 --> 00:40:03,160
Takže v tomto prípade môžeme povedať, že
naozaj došlo k intenzívnemu
495
00:40:03,226 --> 00:40:05,480
vplyvu selekcie.
496
00:40:07,640 --> 00:40:12,600
Druhou skupinou metód sú metódy, ktoré nám umožňujú stanoviť
497
00:40:12,666 --> 00:40:17,800
vplyv selekcie priamo na genóm konkrétnej
populácie alebo konkrétneho plemena.
498
00:40:17,866 --> 00:40:23,730
To znamená, ako selekcia ovplyvňovala
genofond takejto populácie či plemena.
499
00:40:23,800 --> 00:40:28,520
Asi jednou z najčastejšie využívaných
metód je metóda založená na hodnotení
500
00:40:28,586 --> 00:40:34,040
distribúcie homozygotných úsekov v genóme,
ktoré sa označujú aj skratkou ROH, ktorá
501
00:40:34,106 --> 00:40:38,290
vyplýva z anglického názvu "runs of homozygosity".
502
00:40:38,360 --> 00:40:42,840
Tento prístup v podstate predpokladá, že
oblasti v genóme, ktoré vykazujú silné
503
00:40:42,906 --> 00:40:46,680
selekčné signály, sú výsledkom zvýšenia
lokálnej homozygotnosti
504
00:40:46,746 --> 00:40:48,130
v takomto regióne
505
00:40:48,200 --> 00:40:52,960
v dôsledku intenzívneho selektívneho tlaku alebo
506
00:40:53,026 --> 00:40:56,680
šľachtenia na znaky determinované
napríklad v plemennom
507
00:40:56,746 --> 00:40:59,840
štandarde každého plemena.
508
00:41:00,080 --> 00:41:05,400
Homozygotné úseky, ktoré tvoria
selekčný signál lokalizovaný niekde v
509
00:41:05,466 --> 00:41:11,200
genóme, sú tvorené zvyčajne alelami alebo
510
00:41:11,266 --> 00:41:15,690
genetickými variantami, ktoré pochádzajú
od spoločných predkov
511
00:41:15,760 --> 00:41:21,080
a ktoré sa v podstate dedia z generácie
na generáciu v nezmenenej forme.
512
00:41:22,360 --> 00:41:27,680
Selekčné signály sa v tomto prípade
stanovujú, ak využívame SNP dáta alebo
513
00:41:27,746 --> 00:41:32,400
dáta pochádzajúce z genotypovania
pomocou SNP čipov na základe frekvencie
514
00:41:32,466 --> 00:41:38,050
výskytu SNP markerov v oblasti homozygotného úseku
515
00:41:38,120 --> 00:41:43,770
naprieč všetkými jedincami v populácii,
pričom hraničná hodnota determinujúca
516
00:41:43,840 --> 00:41:49,770
signál, je zvyčajne 1% najvyšších hodnôt.
517
00:41:49,840 --> 00:41:53,920
Medzi základné výhody patrí, že tento prístup
518
00:41:53,986 --> 00:41:58,560
umožňuje determinovať samotný selekčný signál a
519
00:41:58,626 --> 00:42:04,960
Súčasne umožňuje identifikovať oblasti,
kde došlo k výraznému zníženiu
520
00:42:05,026 --> 00:42:07,730
diverzity a nárastu homozygotnosti.
521
00:42:07,800 --> 00:42:11,050
Je veľmi dobrým indikátorom
pozitívnej selekcie.
522
00:42:11,120 --> 00:42:11,640
A naopak
523
00:42:11,706 --> 00:42:16,520
medzi nevýhody patrí, že ak chceme
stanovovať selekčné signály touto
524
00:42:16,586 --> 00:42:23,240
metódou, mali by sme mať k dispozícii
naozaj kvalitné a robustné genomické dáta.
525
00:42:24,200 --> 00:42:30,130
Na obrázku máte znázornené výsledky analýzy distribúcie
526
00:42:30,200 --> 00:42:33,130
homozygotných úsekov v genóme
slovenského teplokrvníka,
527
00:42:33,200 --> 00:42:35,330
čo je plemeno koní.
528
00:42:35,400 --> 00:42:40,730
Ako vidíte, v niektorých úsekoch naozaj
došlo k zvýšeniu podielu
529
00:42:40,800 --> 00:42:42,890
homozygotných úsekov v genóme.
530
00:42:42,960 --> 00:42:47,560
Takéto úseky, ako môžte vidieť v tabuľke
vpravo, sa nachádzajú napríklad na
531
00:42:47,626 --> 00:42:54,410
chromozómoch 1, 2, 6, 9, 11, 15 a 16.
V blízkosti je veľké množstvo
532
00:42:54,480 --> 00:43:00,120
proteín-kódujúci génov, ktoré samozrejme
majú aj svoju úlohu pri utváraní
533
00:43:00,186 --> 00:43:04,000
fenotypových znakov a vlastností.
534
00:43:04,440 --> 00:43:09,240
Ďalšou metódou je metóda založená na hodnotení
535
00:43:09,306 --> 00:43:13,610
distribúcie heterozygotných úsekov v genóme,
čiže je to
536
00:43:13,680 --> 00:43:17,520
veľmi podobná metóda ako tá
predchádzajúca, ale tou predchádzajúcou
537
00:43:17,586 --> 00:43:21,520
sme stanovovali
alebo identifikovali úseky, ktoré
538
00:43:21,586 --> 00:43:23,850
vykazujú vysokú homozygotnosť.
539
00:43:23,920 --> 00:43:29,520
Touto metódou sa naopak hodnotia úseky,
ktoré vykazujú vysokú heterozygotnos, a
540
00:43:29,586 --> 00:43:33,330
takéto úseky môžu mať
pre plemeno, populáciu alebo
541
00:43:33,400 --> 00:43:38,130
druh význam hlavne z pohľadu adaptability
alebo odpovede na rôzne
542
00:43:38,200 --> 00:43:44,440
environmentálne zmeny či výskyt patogénov,
pretože heterozygotné jedince vykazujú
543
00:43:44,506 --> 00:43:50,930
zvyčajne vyšší fitnes v porovnaní
s jedincami, ktoré sú vysoko homozygotné.
544
00:43:51,000 --> 00:43:56,200
V tomto prípade teda možno povedať, že
vysoká úroveň heterozygotnosti môže byť
545
00:43:56,266 --> 00:44:01,650
výsledkom pôsobenia stabilizačnej
selekcie, ktorá je jedným
546
00:44:01,720 --> 00:44:05,640
z biologických spôsobov, ako
uchovávať genetickú
547
00:44:05,706 --> 00:44:09,240
diverzitu v rámci populácie.
548
00:44:09,680 --> 00:44:14,890
Ako som už povedala, táto metóda je
veľmi podobná ako tá predchádzajúca
549
00:44:14,960 --> 00:44:22,010
až na to, že pri tejto metóde
sa snažíme nájsť v genóme
550
00:44:22,080 --> 00:44:28,600
nepretržité úseky heterozygotných
genotypov, pričom pri tej predchádzajúcej
551
00:44:28,666 --> 00:44:35,040
sme hľadali naopak nepretržité úseky
homozygotných genotypov.
552
00:44:35,280 --> 00:44:40,960
Selekčné signály sa stanovujú veľmi
podobne, ale stanovujú sa na základe
553
00:44:41,026 --> 00:44:46,840
frekvencie výskytu SNP markerov
v heterozygotných úsekoch konkrétnej
554
00:44:46,906 --> 00:44:50,210
oblasti naprieč jedincami
v rámci populácie.
555
00:44:50,280 --> 00:44:56,370
Hraničná hodnota determinujúca selekčný
signál je zase najčastejšie
556
00:44:56,440 --> 00:44:59,850
1% najvyšších hodnôt.
557
00:44:59,920 --> 00:45:05,640
Medzi výhody tejto metódy patrí,
že umožňuje detekovať oblasti, v ktorých
558
00:45:05,706 --> 00:45:08,080
je zvýšený podiel heterozygotných genotypov.
559
00:45:08,146 --> 00:45:14,400
To znamená, že je veľmi dobrým indikátorom
genetických oblastí dôležitých z hľadiska
560
00:45:14,466 --> 00:45:19,690
adaptácie populácie či stanovenia
jej evolučného potenciálu.
561
00:45:19,760 --> 00:45:20,640
A medzi nevýhody
562
00:45:20,706 --> 00:45:25,640
podobne ako tomu bolo pri vyhľadávaní homozygotných úsekov patrí potreba
563
00:45:25,706 --> 00:45:29,080
kvalitných a robustných genomických dát.
564
00:45:29,280 --> 00:45:34,880
Na obrázku máme teraz viac konkrétne
výsledky, ktoré sa vzťahovali na
565
00:45:34,946 --> 00:45:40,680
vyhľadávanie heterozygotných úsekov
v oblasti hlavného histokompatibilného
566
00:45:40,746 --> 00:45:47,080
komplexu, čo je naozaj významná oblasť z
pohľadu adaptability organizmu a
567
00:45:47,146 --> 00:45:53,720
schopnosti reagovať na rôzne
faktory z vonkajšieho prostredia.
568
00:45:53,786 --> 00:45:58,730
Na prvom obrázku máme znázornenú
frekvenciu výskytu SNP markerov
569
00:45:58,800 --> 00:46:04,840
v heterozygotných úsekoch a na druhom máme znázornenú samotnú
570
00:46:04,906 --> 00:46:08,960
distribúciu takýchto úsekov v oblasti hlavného
571
00:46:09,026 --> 00:46:15,000
histokompatibilného komplexu, pričom tu aj
môžeme vidieť dĺžku jednotlivých
572
00:46:15,066 --> 00:46:16,850
Heterozygotných úsekov.
573
00:46:16,920 --> 00:46:22,720
Táto analýza bola realizovaná
u piatich plemien koní.
574
00:46:23,440 --> 00:46:28,930
Ďalšou analýzou, ktorá je
pomerne zaujímavá, je RDA analýza.
575
00:46:29,000 --> 00:46:33,680
Táto analýza testuje vzťahy medzi
genetickou variabilitou a
576
00:46:33,746 --> 00:46:37,920
environmentálnymi faktormi,
čiže zase podobne ako PCA
577
00:46:37,986 --> 00:46:42,730
analýza nám umožňuje kvantifikovať
vplyv prírodnej selekcie.
578
00:46:42,800 --> 00:46:47,440
Jedná sa o metódu hodnotenia asociácií
medzi genotypom a prostredím, ktorá
579
00:46:47,506 --> 00:46:50,610
súčasne hodnotí percento genetickej variability
580
00:46:50,680 --> 00:46:55,730
vysvetlenej environmentálnymi premennými a
detekuje aj
581
00:46:55,800 --> 00:47:01,250
lokusy alebo genetické varianty,
ktoré podliehali selekčnému tlaku.
582
00:47:01,320 --> 00:47:05,330
Jedná sa o dvojkrokovú analýzu, v ktorej
sú genetické a environmentálne
583
00:47:05,400 --> 00:47:11,530
dáta hodnotené pomocou viacrozmernej lineárnej regresie.
584
00:47:11,600 --> 00:47:15,570
Medzi výhody tejto analýzy patrí to, že
585
00:47:15,640 --> 00:47:19,410
sa jedná o komplexný prístup na hodnotenie vzťahov
586
00:47:19,480 --> 00:47:24,170
medzi genetickou variabilitou v rámci
populácie, ako aj faktormi prostredia.
587
00:47:24,240 --> 00:47:28,800
A medzi nevýhody zase patrí potreba
kvalitných a robustných dát, už v tomto
588
00:47:28,866 --> 00:47:32,010
prípade nielen genetických, ale aj
589
00:47:32,080 --> 00:47:36,840
dát, ktoré charakterizujú
práve tie environmentálne faktory, ktoré
590
00:47:36,906 --> 00:47:43,410
môžu potenciálne ovplyvňovať genóm
jednotlivých jedincov alebo populácií.
591
00:47:43,480 --> 00:47:48,160
Medzi softvérové nástroje, ktoré možno
v tomto prípade použiť, patrí napr.
592
00:47:48,226 --> 00:47:53,330
R balík vegan alebo program DeepGenomeScan.
593
00:47:53,400 --> 00:48:00,250
Poslednou metódou, o ktorej by som chcela
hovoriť, je metóda, ktorá slúži na
594
00:48:00,320 --> 00:48:05,920
odhad vplyvu stabilizačnej selekcie na
genóm populácie, plemena,
595
00:48:05,986 --> 00:48:07,730
jedincov a podobne.
596
00:48:07,800 --> 00:48:11,650
A to je Tajimova D štatistika.
597
00:48:11,720 --> 00:48:15,850
Táto metóda v podstate slúži
598
00:48:15,920 --> 00:48:19,400
ako dobrý indikátor práve stabilizačnej
599
00:48:19,466 --> 00:48:25,120
selekcie, pričom v rámci Tajimovho D môžeme
dosiahnuť alebo zistiť
600
00:48:25,186 --> 00:48:27,120
negatívne a pozitívne hodnoty.
601
00:48:27,186 --> 00:48:33,480
A práve pozitívne hodnoty nám indikujú
vplyv stabilizačnej selekcie,
602
00:48:33,840 --> 00:48:38,200
kedy majú frekvencie alel
zvyčajne stredné hodnoty, čo má za
603
00:48:38,266 --> 00:48:41,440
následok väčšiu variabilitu, ako by sa
očakávalo na základe
604
00:48:41,506 --> 00:48:43,890
teórie neutrálnej evolúcie.
605
00:48:43,960 --> 00:48:48,600
A naopak, negatívne hodnoty sú v tomto
prípade asociované s efektom pozitívnej
606
00:48:48,666 --> 00:48:52,370
selekcie, ktorá vedie k zníženiu
genetickej variability alebo
607
00:48:52,440 --> 00:48:57,450
diverzity genofondu v genóme
danej populácie plemena.
608
00:48:57,520 --> 00:49:02,000
Hraničná hodnota sa zvyčajne determinuje
podobne ako pri predchádzajúcich
609
00:49:02,066 --> 00:49:05,450
príkladoch alebo pri
predchádzajúcich metódach.
610
00:49:05,520 --> 00:49:10,440
Čo sa týka výhod, tak táto metóda umožňuje
detekovať oblasti, v ktorých je zvýšený
611
00:49:10,506 --> 00:49:17,170
podiel heterozygotných genotypov, čiže
je to dobrý indikátor napríklad z pohľadu
612
00:49:17,240 --> 00:49:21,560
zistenia miery adaptácie alebo adaptability
613
00:49:21,626 --> 00:49:26,530
populácie na zmeny environmentálneho prostredia.
614
00:49:26,600 --> 00:49:32,000
A čo sa týka nevýhod, tak zase potrebujeme
kvalitné a robustné dáta, pokiaľ chceme
615
00:49:32,066 --> 00:49:35,490
získať naozaj spoľahlivé výsledky.
616
00:49:35,560 --> 00:49:42,410
Na obrázku máte znázornené genomické
regióny, v ktorých došlo k zvýšeniu
617
00:49:42,480 --> 00:49:47,330
D hodnoty a teda, ktoré nám reflektujú vplyv
stabilizačnej selekcie.
618
00:49:47,400 --> 00:49:52,240
Analýza bola realizovaná u piatich plemien
koní pochádzajúcich zo Slovenska
619
00:49:52,306 --> 00:49:54,170
alebo z Českej republiky.
620
00:49:54,240 --> 00:50:00,760
V podstate prostredníctvom tejto metódy
sme boli schopní identifikovať regióny, v
621
00:50:00,826 --> 00:50:07,170
ktorých došlo k zvýšeniu Tajimovej D hodnoty
naprieč jednotlivými plemenami.
622
00:50:07,240 --> 00:50:10,920
Súčasťou tejto analýzy, samozrejme ako pri
tých predchádzajúcich, bola aj
623
00:50:10,986 --> 00:50:15,360
identifikácia génov, ktoré môžu byť asociované s takýmto
624
00:50:15,426 --> 00:50:18,440
zvýšením, pričom sme zistili, že sa naozaj
625
00:50:18,506 --> 00:50:22,800
jedná o gény, ktoré sú asociované buď
626
00:50:22,866 --> 00:50:26,770
so zdravím alebo s fitness populácie.
627
00:50:26,840 --> 00:50:30,680
Vyhľadávanie proteín-kódujúcich génov v oblastiach
628
00:50:30,746 --> 00:50:37,410
selekčných signálov alebo QTL lokusov a rovnako aj ich funkcie
629
00:50:37,480 --> 00:50:41,680
vzhľadom na zaujímavé fenotypové znaky a vlastnosti
630
00:50:41,746 --> 00:50:46,570
z pohľadu chovu hospodárskych zvierat
môžeme nazvať aj pojmom funkčná anotácia
631
00:50:46,640 --> 00:50:48,890
selekčných signálov.
632
00:50:48,960 --> 00:50:55,640
Čo sa týka funkčnej anotácie, tak sa môžeme
zaoberať jednak samotnou identifikáciou
633
00:50:55,706 --> 00:51:00,600
génov, ale súčasne aj
analýzou ich biologických funkcií a v
634
00:51:00,666 --> 00:51:05,480
tejto súvislosti môžeme využívať
rôzne nástroje, ako sú napr.
635
00:51:05,546 --> 00:51:07,570
GO alebo KEGG.
636
00:51:07,640 --> 00:51:13,480
Tieto nástroje nám zvyčajne umožňujú
identifikovať nielen potenciálnu funkciu génov
637
00:51:13,546 --> 00:51:18,040
v organizme, ale aj súčasne
biologické dráhy, v ktorých
638
00:51:18,106 --> 00:51:21,130
sú tieto gény zapojené.
639
00:51:21,200 --> 00:51:26,480
Medzi najčastejšie využívané databázy pre
vyhľadávanie QTL lokusov
640
00:51:26,546 --> 00:51:29,970
patrí databáza Animal QTLdb.
641
00:51:30,040 --> 00:51:34,640
Táto databáza obsahuje informácie o
QTL lokusoch asociovaných s významnými
642
00:51:34,706 --> 00:51:39,130
fenotypovými vlastnosťami rôznych
druhov hospodárskych zvierat.
643
00:51:39,200 --> 00:51:44,120
A zase, pokiaľ by sme chceli
hovoriť o databáze, kde môžeme vyhľadávať
644
00:51:44,186 --> 00:51:49,810
gény, ktoré sú lokalizované v určitých
alebo konkrétnych genetických oblastiach,
645
00:51:49,880 --> 00:51:55,970
môžeme využiť napríklad databázu
BioMart pre funkčnú analýzu génov.
646
00:51:56,040 --> 00:52:00,840
Existuje viacero programov
alebo aj webových nástrojov.
647
00:52:00,906 --> 00:52:06,600
Jedným z takýchto nástrojov je
nástroj, ktorý sa volá David a ten teda
648
00:52:06,666 --> 00:52:11,160
slúži na funkčnú anotáciu, analýzu úlohy
génov, vrátane klasifikácie podľa
649
00:52:11,226 --> 00:52:16,970
biologických procesov a dráh, v
ktorých sú takéto gény zapojené.
650
00:52:17,040 --> 00:52:22,960
Medzi výhody funkčnej anotácie oblastí,
ktoré sú signifikantne ovplyvnené
651
00:52:23,026 --> 00:52:29,330
selekciou, patrí najmä fakt, že
prostredníctvom takejto analýzy vieme
652
00:52:29,400 --> 00:52:34,370
získať informáciu o QTL lokusoch a génoch a
653
00:52:34,440 --> 00:52:38,050
môžeme získať lepšiu predstavu o tom,
654
00:52:38,120 --> 00:52:43,130
ktoré genetické varianty ovplyvnené
selekciou sú zapojené, v akom
655
00:52:43,200 --> 00:52:48,850
procese kontrolujúcom významné fenotypové znaky a vlastnosti.
656
00:52:48,920 --> 00:52:52,930
Takéto varianty potom samozrejme môžu byť
predmetom ďalšieho
657
00:52:53,000 --> 00:52:58,800
výskumu a následne môžu byť pomerne dobre
zapojené pri selekcii v
658
00:52:58,866 --> 00:53:00,690
šľachtiteľských programoch.
659
00:53:00,760 --> 00:53:05,480
Medzi nevýhody patrí najmä fakt,
že prekryv medzi oblasťami selekčných
660
00:53:05,546 --> 00:53:11,730
signálov a funkčnými oblasťami nemusí vždy
znamenať aj kauzálny vzťah medzi nimi
661
00:53:11,800 --> 00:53:17,160
a aj skutočnosť, že informácie, ktoré sú
momentálne dostupné v databázach, sú
662
00:53:17,226 --> 00:53:22,040
limitované na aktuálne poznatky
a samozrejme tým pádom nie vždy musia
663
00:53:22,106 --> 00:53:28,610
pokrývať všetky relevantné
gény, respektíve QTL lokusy.
664
00:53:28,680 --> 00:53:33,680
Na tomto slajde máte uvedený zoznam
článkov, ktoré som využila
665
00:53:33,746 --> 00:53:36,010
na prípravu tejto prezentácie.
666
00:53:36,080 --> 00:53:40,690
Jedná sa o články, ktoré vznikli
samozrejme u nás na pracovisku
667
00:53:40,760 --> 00:53:47,770
a súčasne sú tieto články ešte aj na
zdieľanie v priečinku "Kľúčové články".
668
00:53:47,840 --> 00:53:54,000
V prípade, ak sa budete chcieť touto
problematikou zaoberať aj ďalej a viac do
669
00:53:54,066 --> 00:53:59,410
hĺbky, odporúčam Vám si
tieto články preštudovať.
670
00:53:59,480 --> 00:54:02,650
Týmto Vám ďakujem za Vašu pozornosť.
671
00:54:02,720 --> 00:54:09,370
V prípade, ak by ste mali nejaké otázky
alebo by ste sa chceli venovať tejto téme
672
00:54:09,440 --> 00:54:13,010
ďalej viac do hĺbky a budete potrebovať
673
00:54:13,080 --> 00:54:16,600
poradiť, prosím kontaktujte ma na mailovej
674
00:54:16,666 --> 00:54:23,600
adrese, ktorú vidíte na slajde.
Na slajde je súčasne uvedený aj QR kód,
675
00:54:23,666 --> 00:54:30,600
prostredníctvom ktorého sa môžete dostať
aj k ďalším prezentáciám a témam, ktoré
676
00:54:30,666 --> 00:54:33,320
boli spracované v rámci projektu ISAGREED.