Řadu lidí zaujmou mezi výsledky genetickogenealogických testů právě odhady etnického původu. Zde najdete stručný pokus o vysvětlení toho, jak moc a kdy těmto odhadům můžeme věřit.

Pokud se člověk poprvé setká s komerčními genetickogenealogickými testy, pak jednou z prvních věcí, které ho v nich zaujmou jsou tzv. "odhady etnického původu", "Ancestry composition", apod. Je to ono rozdělení vaší DNA na příspěvky z "Východní Evropy", "Skandinávie", "Balkánu", "Jižní Evropy", atd. Výsledky podobných analýz jsou také silně využívány v reklamách na zmíněné testy. Leckterý zákazník se ovšem poté, co se dozví, že je např. z 28 % "Balkánec", z 20 % Skandinávec a ze 4 % "Fin" začne ptát, co to vlastně znamená a který z jeho pradědečků ze které takové oblasti vlastně přišel. Proto bude dobré uvést tyto "etnické" analýzy na pravou míru a to zvlášť s ohledem na genealogii lidí ze střední Evropy.

První a nejdůležitější zprávou pro každého genealoga by mělo být, že tyto "odhady etnického původu" nejsou zdaleka nejdůležitějšími výsledky komerčních genetickogenealogických testů! V současné době dominují těmto testům čtyři společnosti: Ancestry, 23andMe, MyHeritage a FTDNA. Každá z těchto společností má databázi několika milionů uživatelů a zobrazí vám ty z nich, s nimiž sdílíte významnější množství společných segmentů DNA. Tedy úseků na chromozomech, které jsou shodné a které ukazují na možnou příbuznost s vámi na základě společného předka či více společných předků. To je hlavní a nejcennější výstup těchto testů a pro každého genetického genealoga je takový seznam lidí ("shod") a poloh těchto segmentů na chromozomech pravým pokladem, se kterým lze dále nesmírně zajímavě pracovat.

Výše zmíněné "odhady etnického původu" jsou v současné době pouze více či méně zajímavým doplněním těchto údajů o shodách a sdílených DNA segmentech. Ve skutečnosti se na základě dlouhodobé zkušenosti ukazuje, že zmiňované etnické odhady lze v současné době vážně a bez rozpaků brát pouze na úrovni jednotlivých kontinentů. Protože teprve pak dokážou genetickogenealogické společnosti od sebe dobře oddělit příspěvky jednotlivých populací. Pokud je takto ale analyzován člověk, jehož naprostá většina předků žila v posledních několika stech letech na území střední Evropy, bývá výsledek velice matoucí. Rozhodně ho nelze typicky interpretovat v tom smyslu, že např. 28 % předků daného člověka "přišlo z Balkánu", či "4 % předků přišla z Finska". Ukazuje to pouze na vzájemnou podobnost a provázanost jednotlivých evropských populací. Celá analýza se totiž provádí tak, že se využívají referenční modely vytvořené z dat mnoha desítek či stovek jedinců žijících v určité geografické oblasti a data jednotlivce se poté vyjádří jako podíl příspěvků těchto modelů. Referenční skupiny si navíc každá společnost vytváří sama. Neexistuje žádný standard. A tak může být někde Maďarsko součástí Balkánu a jinde je středovropské nebo Litva součástí Skandinávie ač jinde je to východni Evropa. Vzhledem k tomu, že ČR leží ve středu Evropy a vzhledem k tomu, že dané společnosti nepoužívají "středoevropský" referenční model, není divu, že typický obyvatel ČR vyjde jako určitá kombinace severo-, východo-, jiho- a západoevropských příspěvků. Příklad je na obrázcích 1 a 2 níže, kde je výsledek stejného Čecha s předky v matričním období pouze z Čech. Jak je vidno, každá společnost má výsledek trochu jiný, například Švédsko+Dánsko, kterým Ancestry přisoudilo plných 11 %, u MyHeritage vůbec nejsou. MyHeritage ukazuje ale třeba 15 % z Britských ostrovů, kde zase Ancestry nemá nic. Lidé v rámci Evropy se po staletí míchali a sdílejí podobnou DNA, stávající odhady etnicit pak neumí dobře rozlišit části Evropy. To neznamená, že jsou testy špatné, jen je třeba zaměřit se na shody s ostatními, ne etnicity, které jsou pro středoveropany využitelné minimálně.

Jednotlivé genetickogenealogické společnosti začaly ovšem postupně používat i další rovinu analýzy dat. Je to ta, kterou MyHeritage nazývá "genetické skupiny" a Ancestry "communities". Přestože to může v obou případech vypadat jako pouze podrobnější dělení etnického odhadu, ve skutečnosti se jedná o zcela odlišný způsob analýzy, která je mnohem přesnější a zpravidla z genealogického hlediska i mnohem užitečnější. Tyto skupiny totiž nejsou vytvářeny na základě nahrubo mapovaných referenčních populací, ale jsou definovány jako skupiny, které navzájem sdílí segmenty DNA a jejichž původ dle dostupných rodokmenů směřuje do konkrétních oblastí. Jejich vlastností je mimochodem i to, že jejich podíl nebývá kvantitativně uveden. Náš Čech je na následujících obrázcích u obou společností zařazen do genetické skupiny střední Evropy, u Ancestry dokonce správně přímo do Čech.

etnicity na MyHeritage
Zdroj: MyHeritage - Odhad etnického původu
Obr. 1 - příklad etnicit Čecha na MyHeritage. Genetická skupina je tmavý kroužek uprostřed.

 

etnicity na Ancestry
Zdroj: Ancestry - DNA Origins
Obr. 2 - příklad etnicit Čecha z obr. 1 na Ancestry. Community čárkovaně uprostřed.


Základní pravidla pro vyhodnocování výsledků etnických odhadů:

  1. Vždy mějte na paměti, že nejdůležitějšími výsledky vašeho testu jsou DNA shody a nikoliv odhad etnického původu.
  2. Pokud jsou ve vašem odhadu etnického původu přítomny různé populace z různých koutů Evropy, neznamená to nic zvláštního. Takto to prostě Středoevropanům typicky vychází.
  3. Jste-li zařazeni do některých genetických skupin (MH) či communities (Ancestry), berte to jako důvěryhodnější informaci. U MyHeritage zvlášť tehdy, když je zároveň uvedena "vysoká míra jistoty".
  4. Teprve když se v odhadu objeví více než 2-3 % nějaká mimoevropská populace (třeba aškenázští Židé, Indie, nějaká část Asie apod.), může to znamenat stopu předka z dané populace. Cokoliv pod 2 % může být ovšem snadno způsobeno přirozeným šumem v datech a není třeba to brát v potaz.

Chcete-li se o regionálním původu svých předků dozvědět více, budoucnost jistě přinese detailnější zpracování referenčních modelů a odhad příměsí z jednotlivých regionů a subregionů. Něco už nyní můžete relativně přesně zahlédnout ve svých shodách - například významnější shoda (>40 cM) s člověkem, jehož předkové podle jeho rodokmenu neopustili během posledních 200 let nějaký omezený region, může znamenat, že odtamtud s vysokou pravděpodobností pochází i někdo z vašich předků. To mimochodem také ukazuje význam testování takových lidí s vysoce specifickým regionálním původem.

U odhadu etnického původu i genetických skupin dochází k pravidelným aktualizacím, doplňování referenčních dat a větší granularitě. To neznamená, že by se nějak měnila vaše DNA nebo etnicita, to se jen aktualizované nástroje pomocí vaší DNA pokusily o poskytnutí zase o něco přesnější odpovědi. Ta může být někdy zpřesněním, někdy však může vést i ke zhoršení odhadu.