Historia demograficzna i zmienność genetyczna populacji ormiańskiej / Anahit Hovhannisyan, Pierpaolo Maisano Delser, Anna Hakobyan, Eppie R. Jones, Joshua G. Schraiber, Mariya Antonosyan, Ashot Margaryan, Zhe Xue, Sungwon Jeon, Jong Bhak, Peter Hrechdakian, Hovhannes Sahakyan, Lehti Saag, Zaruhi Khachatryan, Levon Yepiskoposyan i in.

0
64
Dwoje ormiańskich dzieci, 1893. Autorstwa This file is from the Mechanical Curator collection, a set of over 1 million images scanned from out-of-copyright books and released to Flickr Commons by the British Library.View image on FlickrView all images from bookView catalogue entry for book., Domena publiczna, https://commons.wikimedia.org/w/index.php?curid=33147795

Streszczenie

Przedstawiamy pokaźny ( n  = 34) zbiór danych całego genomu na temat Ormian, populacji zamieszkującej region w Azji Zachodniej znany jako Wyżyny Ormiańskie. Wyposażeni w te dane genetyczne przeprowadziliśmy badanie całego genomu Ormian i rozszyfrowaliśmy ich szczegółową strukturę populacji oraz złożoną historię demograficzną. Wykazaliśmy, że populacje Ormian z zachodnich, centralnych i wschodnich części wyżyn są stosunkowo jednorodne. Sasun, populacja na południu, o której twierdzono, że otrzymała główny wkład genetyczny od Asyryjczyków, zamiast tego wyprowadziła swój nieznacznie rozbieżny profil genetyczny z wąskiego gardła, które wystąpiło w niedawnej przeszłości. Zbadaliśmy również dyskutowaną kwestię pochodzenia genetycznego Ormian i nie znaleźliśmy żadnego znaczącego poparcia dla historycznych sugestii Herodota dotyczących ich przodków związanych z Bałkanami. Sprawdziliśmy stopień ciągłości współczesnych Ormian ze starożytnymi mieszkańcami wschodnich wyżyn Ormiańskich i wykryliśmy wkład genetyczny do regionu ze źródła powiązanego z neolitycznymi rolnikami lewantyńskimi w pewnym momencie po wczesnej epoce brązu. Ponadto skatalogowaliśmy mnóstwo nowych mutacji unikalnych dla populacji, w tym mutację missense, która prawdopodobnie powoduje rodzinną gorączkę śródziemnomorską, chorobę autozapalną bardzo rozpowszechnioną u Ormian. W ten sposób podkreślamy znaczenie dalszych badań genetycznych i medycznych tej populacji.

Słowa kluczowe: ciągłość genetyczna, Wyżyny Ormiańskie, Ormianie, Teoria bałkańska, Epoka brązu, badanie całego genomu.

1-s2.0-S0002929724003914-main

Wstęp

Ormianie są uznawani za jedną ze starożytnych populacji w Azji Zachodniej i historycznie zamieszkiwali obszar wyżyn ormiańskich 1 ( Rysunek 1 ). Leżące między Europą a Azją terytorium wyżyn było lądowym pomostem dla głównych migracji ludzi od czasu ich wczesnego osadnictwa w górnym paleolicie. 2 Ze względu na bliskość Żyznego Półksiężyca region ten wyłonił się jako jeden z najwcześniejszych ośrodków, które przyjęły rolnictwo w neolicie, odgrywając jednocześnie kluczową rolę w rozpowszechnianiu technologii, takich jak narzędzia obsydianowe, 3 obuwie skórzane, 4 i uprawa winorośli. 5 Okres ten charakteryzował się rozległymi interakcjami genetycznymi między Kaukazem, północnym Lewantem, Iranem i Anatolią przez długi okres czasu, 6 , 7 ze znaczącym przepływem genów ze źródła podobnego do południowego Kaukazu do Anatolii, rozpoczynającym się po zakończeniu neolitu. 7 Innym dobrze udokumentowanym wydarzeniem postneolitycznym był początek migracji ludności z Kaukazu na stepy, co ostatecznie przyczyniło się genetycznie do powstania przodków Jamnych. 7 , 8 , 9 Epoka brązu na wyżynach Armenii jest naznaczona wzrostem i upadkiem wielu kultur archeologicznych, w tym wczesnej kultury brązu Kura-Araxes, środkowego brązu wczesnego Kurhanu, tradycji ceramicznych Trialeti-Wanadzor, Sewan-Artsach, Karmir-berd i Karmir-vank oraz późnej epoki brązu i wczesnej epoki żelaza kultury Lchashen-Metsamor. 10 Około po okresie wczesnej epoki brązu migracja ze stepu w kierunku południowo-wschodnim wprowadziła do regionu przodków związanych z Jamną (choć przeważnie nie dotarła do zachodnich i centralnych części wyżyn Armenii). 7 Wspomniane wcześniej przepływy genów, poparte dowodami językowymi wskazującymi na ukształtowanie się języka proto-ormiańskiego w drugiej połowie epoki brązu (ok. 4000 lat temu), 11 plasują Wyżynę Armeńską jako potencjalny kandydat lub bliski ojczyznę języków proto-indoeuropejskich, skąd następnie rozprzestrzeniły się one na Europę Zachodnią, Azję Środkową i Indie.

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (564 KB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze
Rysunek 1. Mapy przedstawiające Armenię z lokalizacją starożytnych i współczesnych osobników z pełnym genomem, wraz z proponowaną trasą migracji Ormian według teorii bałkańskiej
Kolory pomarańczowy, niebieski i czerwony przedstawiają naszą kategoryzację wygenerowanych próbek całego genomu współczesnych odpowiednio do zachodnich, centralnych i wschodnich grup Ormian (populacje są oznaczone jako W, C i E na mniejszej mapie). Obszary pobierania próbek starożytnych populacji są pokazane w prostokątach, a kolory odpowiadają kolorom odpowiadającym im geograficznie współczesnym Ormianom. Oprócz rozważań geograficznych podział współczesnych grup Ormian opiera się na ich osobliwościach językowych, historycznych i kulturowych. Podczas gdy zachodnie i centralne regiony wyżyn ormiańskich doświadczyły długich okresów rządów osmańskich i późniejszego rozproszenia populacji, wschodnie części były w posiadaniu Imperium Perskiego, a później Rosyjskiego. Po wysiedleniu na początku XX wieku z zachodnich i centralnych regionów wyżyn, Ormianie obecnie zamieszkują głównie terytorium Republiki Armenii, skąd pobrano większość próbek w tym badaniu. Jak widać na mapie, populacja Sasun (oznaczona jako S na mniejszej mapie) znajduje się w centralnej grupie Ormian. Jednakże w niektórych analizach traktowaliśmy ją jako odrębną grupę, gdy chcieliśmy zbadać kwestię jej pochodzenia.
Najwcześniejsze odniesienie do Armenii jako państwa znajduje się w babilońskiej wersji inskrypcji z Behistun, datowanej na 522 r. p.n.e., na początku panowania Dariusza I Wielkiego. 12 , 13 W staroperskiej wersji tej samej inskrypcji region ten został nazwany Urartu, królestwem epoki żelaza, które rozkwitało na wyżynach ormiańskich przez około trzy stulecia i charakteryzowało się znaczną heterogenicznością genetyczną. 7 Następne okresy w regionie zostały naznaczone serią najazdów i masowych migracji miejscowej ludności, które w różny sposób wpłynęły na różne części wyżyn. Obejmowały one najazdy imperiów asyryjskiego, perskiego i bizantyjskiego, Arabów, Turków seldżuckich, Mongołów i Imperium Osmańskiego. Chociaż w przeszłości Ormianie zamieszkiwali regiony sięgające aż do wybrzeża Morza Śródziemnego, obecnie zamieszkują głównie wschodnią część wyżyn ormiańskich, położoną na południowym Kaukazie, gdzie znajduje się dzisiejsza Armenia ( Rysunek 1 ).
To złożone tło historyczne wyżyn sprawia, że ​​badanie historii demograficznej Ormian jest kwestią ważną, aby rzucić światło na zaludnianie i migracje regionalne. Jednocześnie górski krajobraz, odrębny i bardzo stary język ormiański oraz silna tożsamość narodowa i kulturowa, wzmocniona później przez przyjęcie chrześcijaństwa, mogły sprzyjać długotrwałej izolacji genetycznej Ormian od sąsiednich populacji. 14 , 15 , 16 Rzeczywiście, porównanie starożytnych i współczesnych genomów mitochondrialnych (mtDNA) na przestrzeni 8000 lat ujawniło niezwykle wysoki poziom ciągłości genetycznej matrylinearnej w regionie. 14 Obraz izolacji genetycznej jest dodatkowo poparty badaniami autosomalnymi całego genomu współczesnych Ormian, które sugerują brak zewnętrznego napływu genetycznego co najmniej od epoki brązu. 15 , 16 Niemniej jednak współczesne genomy mają ograniczoną możliwość wyciągania wniosków na temat ciągłości genetycznej w czasie, a szczegółowe badanie historii demograficznej i populacyjnej Ormian obejmujące zarówno starożytne, jak i współczesne genomy nie zostało jeszcze przeprowadzone.
Innym niedostatecznie zbadanym i bardzo dyskutowanym pytaniem jest pochodzenie Ormian. Istnieje kilka teorii i legend dotyczących formowania się populacji, choć dwie z nich przeważają. Według długoletniej „teorii bałkańskiej” opartej na pismach starożytnego greckiego historyka Herodota przodkami Ormian byli frygijscy koloniści, którzy przybyli na wyżyny ormiańskie z Bałkanów. 17 Wniosek ten wyprowadzono głównie z faktu, że Ormianie byli uzbrojeni na sposób frygijski, gdy byli częścią armii perskiej. Wspólne pochodzenie Ormian i Frygów sugerują ponadto niektórzy językoznawcy, którzy spekulują, że język protoormiański należał do podgrupy trako-frygijskiej w obrębie rodziny języków indoeuropejskich. 18 Niedawne badanie językoznawcze pogrupowało języki ormiański i grecki w jedną głęboką gałąź, co sugeruje, że oddzieliły się one od głównego europejskiego kladu na wczesnym etapie indoeuropejskiego drzewa językowego. 11 Jednak alternatywny pogląd oparty na popularnej legendzie o pochodzeniu Ormian sugeruje lokalne ukształtowanie się populacji. 19 Pomimo rozległych wykopalisk w tym rejonie, do tej pory nie znaleziono przekonujących dowodów archeologicznych, które potwierdzałyby którąkolwiek z tych hipotez. 20 W kwestii pochodzenia, etnogeneza Sasun, ludności ormiańskiej zamieszkującej południową część wyżyn ormiańskich (współczesna południowo-wschodnia Turcja) i mówiącej odrębnym dialektem w języku ormiańskim, 21 wyróżnia się jako szczególna kontrowersja. Według starożytnego ormiańskiego historyka Movsesa Khorenatsiego (V w. n.e.), książęce klany Sasun były potomkami synów Sennacheryba, króla asyryjskiego. 22 Sprawozdanie historyka opierało się na Biblii, 23 źródłach klinowych i lokalnych tradycyjnych opowieściach. Co intrygujące, skład haplogrupy chromosomu Y Sasun różni się od składu innych populacji ormiańskich uderzająco wysoką częstością występowania haplogrupy T, 24 co sugeruje prawdopodobne procesy demograficzne specyficzne dla danej populacji. Dlatego też konieczne jest dokładne badanie genetyczne dotyczące relacji między współczesnymi Ormianami a starożytnymi i współczesnymi próbkami z Bałkanów, a także wewnętrznej podstruktury w obrębie populacji ormiańskich.
Wreszcie, istnieje dobrze znana potrzeba rozszerzenia badań genetycznych na populacje zróżnicowane etnicznie, ponieważ zrozumienie specyficznych dla populacji wariantów genetycznych odgrywa kluczową rolę w badaniach medycznych i biomedycznych. Ormianie pozostają niedostatecznie reprezentowani w obecnych bazach danych genomicznych, w tym w 1000 Genomes Project (1000 GP). Struktura genetyczna populacji została w większości zbadana przy użyciu technologii mikromacierzy lub markerów genetycznych uniparentalnych, 15 , 24 , 25 , 26 i do tej pory zgłoszono tylko osiem pełnych genomów Ormian (dwa zsekwencjonowane za pomocą platformy Illumina, a pozostałe sześć za pomocą Complete Genomics).27 , 28 Tak więc kompletny obraz zmienności genetycznej u Ormian pozostaje w dużej mierze niezbadany.
Tutaj przedstawiamy zbiór danych obejmujący 34 sekwencje całego genomu osób ormiańskich, których wszyscy czterej dziadkowie (4GP) pochodzili z tego samego regionu w obrębie wyżyn ormiańskich. Podzieliliśmy próbki na trzy grupy reprezentujące regiony zachodnie (WA; n  = 11), centralne (CA; n  = 17, co obejmuje populację Sasun; n  = 5) i wschodnie (EA; n  = 6) w obrębie wyżyn ormiańskich ( Rysunek 1 i Tabela S1 ). Wygenerowaliśmy również dane z chipa Illumina obejmujące cały genom 23 osób ormiańskich zebranych przy użyciu podobnych kryteriów pochodzenia (WA = 2, CA = 7 i EA = 14). W całym tekście odnosimy się do tych populacji jako do współczesnych Ormian zachodnich, centralnych i wschodnich. Uzbrojeni w nasz nowoczesny zestaw danych, a także gęsto pobrane starożytne genomy z regionu 7 , 29 , 30 , 31 ( ryc. 1 i tabela S2 ), przeprowadziliśmy szczegółową analizę podstruktury genetycznej wśród Ormian, zbadaliśmy ich pochodzenie genetyczne i demografię oraz sprawdziliśmy, czy populację można rzeczywiście uznać za izolat chroniony przed głównymi migracjami, które ukształtowały resztę zachodniej Eurazji. 15 , 16 Ponadto scharakteryzowaliśmy spektrum wariantów genetycznych w kohorcie ormiańskiej. Jako część naszych analiz zajęliśmy się również kwestią dokładności procesu imputacji, gdy uwzględniono panel referencyjny specyficzny dla populacji i najbardziej aktualny panel referencyjny haplotypów 1000 GP dla zespołu GRCh38.

Materiał i metody

Pobieranie próbek, sekwencjonowanie i etyka

Wszyscy darczyńcy, którzy przekazali próbki do tego projektu, zostali przepytani na temat swojego pochodzenia i wypełnili kwestionariusz dotyczący miasta pochodzenia ich rodziców i dziadków. Próbki pobrano od osób zarówno z diaspory, jak i z Republiki Armenii. Wybraliśmy niespokrewnione osoby, których czwórka dziadków pochodziła z tego samego regionu w obrębie Wyżyny Armeńskiej i podzieliliśmy ich geograficznie na zachodnią ( n  = 13), centralną ( n  = 24) i wschodnią ( n  = 20) grupę Ormian. Dlatego w tym badaniu używamy terminu „Ormianie” w odniesieniu do osób, które etnicznie i kulturowo identyfikują się jako część tej populacji i których przodkowie sięgają co najmniej czterech pokoleń wstecz w obrębie określonego regionu Wyżyny Armeńskiej. Nie mieliśmy żadnych wcześniejszych informacji na temat praktyk małżeńskich w tych społecznościach. Badanie to zostało zatwierdzone przez Komisję Etyki Instytutu Biologii Molekularnej Narodowej Akademii Nauk Republiki Armenii (NAS RA) (IRB #00004079). Wszyscy uczestnicy zostali poinformowani o celu badania i wyrazili zgodę na udział.
Pobrano próbki krwi od naszych dawców. Próbki DNA wyekstrahowano w Instytucie Biologii Molekularnej NAS RA, stosując modyfikację procedury wysolania. 32 próbki DNA znormalizowano (∼50 ng/μL), a 34 próbki wysłano do sekwencjonowania całego genomu metodą parzystych końców (WGS) o wysokim pokryciu (∼30×) na platformie Illumina HiSeq X Ten (Macrogen, Seul, Korea Południowa). Pozostałe próbki genotypowano za pomocą chipa Illumina 713K w estońskim biocentrum w Tartu w Estonii. Wszystkie szczegóły dotyczące pobierania próbek i sekwencjonowania podano w Tabeli S1 .

Przetwarzanie danych do analiz genomiki populacyjnej z próbkami WGS

Sekwencje adapterów przycięto z końców odczytów za pomocą trimadap. 33 Wyrównanie próbek przeprowadzono zgodnie z procedurą opisaną w Mallick i in. 27 W szczególności sekwencje wyrównano do kompilacji hs37d5 ludzkiego genomu referencyjnego za pomocą Burrows-Wheeler Aligner (BWA) w wersji 0.7.16, 34 a odczyty klonalne usunięto za pomocą samblastera. 35 Duplikaty odczytów oznaczono za pomocą Picarda w wersji 2.12.1. 36 Kalibrację baz przeprowadzono za pomocą Genome Analysis Toolkit (GATK) w wersji 4.1.9.0, 37 a filtrowanie jakości mapowania ustawiono na 20 za pomocą samtools 1.16. 38 Wywołanie wariantu przeprowadzono przy użyciu HaplotypeCaller w GATK w celu wygenerowania pośrednich plików gVCF, które następnie połączono z GenomicsDBImport i wykorzystano w GenotypeGVCF do wspólnego genotypowania wielu próbek. Ponowna kalibracja wyniku jakości wariantu została przeprowadzona przez VariantRecalibrator dla obu SNP i indelów (insercji i delecji) oddzielnie, a odfiltrowane miejsca zostały wykluczone za pomocą SelectVariants.
Przed przeprowadzeniem kolejnych analiz sprawdzono pokrewieństwo z KING na nowo wygenerowanych danych WGS i chipie Illumina. Jako próg odcięcia przy filtrowaniu krewnych drugiego stopnia lub bliższych zastosowano współczynnik pokrewieństwa wynoszący 0,0884 .

Łączenie ze starożytnymi i nowoczesnymi zbiorami danych referencyjnych

Połączyliśmy nasze 34 pełne genomy z dwoma ormiańskimi (4GP) całymi genomami z projektu Simons. 27 danych Fastq zostało wyrównanych i genotypowanych przy użyciu tej samej procedury, co opisano powyżej. Tidypopgen 40 został użyty do połączenia współczesnych próbek ormiańskich z połączeniami z współczesnych populacji w zestawie danych Human Origins (HO) 41 i danymi obejmującymi cały genom ze starożytnych próbek w Lazaridis et al. 7 Wykluczyliśmy pozycje z wieloma allelami; bez żadnego dodatkowego filtrowania specyficznego dla analizy doprowadziło to do następujących zestawów SNP: 1 053 115 SNP, gdy analiza opierała się wyłącznie na współczesnych próbkach ormiańskich i starożytnych, i 591 014 SNP, gdy użyto połączonego zestawu danych starożytnych i innych współczesnych próbek, odpowiednio z początkowych 1 054 671 i 591 642 SNP w panelu HO. Aby złagodzić potencjalny wpływ stronniczości technologicznej, ograniczyliśmy nasz zbiór danych do jednego typu technologii, shotgun lub capture, kiedykolwiek było to wykonalne. 42 W związku z tym nasza analiza Dstat i analiza głównych składowych (PCA) zostały przeprowadzone wyłącznie na genomach wygenerowanych przez capture, podczas gdy analizy DATES wykorzystywały wyłącznie genomy wygenerowane przez shotgun. Jednak w przypadku niektórych analiz, takich jak ADMIXTURE, qpAdmix i qpGraph, w których połączyliśmy współczesne i starożytne zbiory danych, genomy reprezentujące przodków wymaganych do modelowania nie były konsekwentnie generowane przy użyciu tej samej technologii. Wyeliminowaliśmy zarówno próbki wykazujące bliskie pokrewieństwo, jak i te, które nie spełniały kryteriów analizy zanieczyszczeń. Szczegółowe informacje przedstawiono szczegółowo w Tabeli S2 .

Analizy genomiczne populacji

PCA wykonano z szerokim panelem nowoczesnych i starożytnych próbek przy użyciu oprogramowania smartpca firmy Eigensoft 7.2.0 43 z wyłączoną opcją usuwania wartości odstających. Wszystkie starożytne próbki zostały rzutowane na główne komponenty przy użyciu opcji lsqproject: YES. Do analiz ustawiliśmy próg 100 000 SNP.
Statystyki D dla danych z tablicy SNP obliczono przy użyciu programu qpDstat w pakiecie ADMIXTOOLS 7.0.1. 44 Statystyki uznawano za istotne, jeśli wynik Z był większy niż 3, co odpowiadało wartości p <0,001. Aby uwzględnić potencjalny wpływ uszkodzeń starożytnego DNA, użyliśmy wyłącznie transwersji. 45 Tak więc statystyki D dla próbek porównawczych zarówno starożytnych, jak i współczesnych wykonano na podstawie 109 869 SNP, podczas gdy w przypadku próbek starożytnych oparto się na 197 022 SNP. Do analiz zastosowano próg 35 000 SNP.
Współdzielenie alleli między współczesnymi populacjami ormiańskimi oraz między każdą populacją ormiańską a sąsiednimi grupami etnicznymi zostało oszacowane dla każdego miejsca jako prawdopodobieństwo, że dwóch losowo wybranych nosicieli w połączonej populacji pochodzi z różnych populacji, znormalizowane przez panmiktyczne oczekiwanie, jak opisano w Chiang et al. 46 Biorąc pod uwagę osobliwości genetyczne populacji Sasun, nie uwzględniliśmy jej w centralnej grupie ormiańskiej w analizie. Jednak ze względu na niewielką liczebność populacji ( n  = 5) nie przeprowadziliśmy również osobno analizy współdzielenia alleli dla tej populacji. Aby zwiększyć liczbę próbek, do zestawu danych dodano również nowo genotypowane dane Illumina 23 Ormian za pomocą Genotype Harmonizer ( Tabela S1 ). Usunięto 47 pojedynczych, miejsc niezmiennych i miejsc brakujących. Tak więc nasze filtrowanie dało w rezultacie 677 047 SNP. W przypadku analiz między populacją ormiańską i porównawczą połączoną populację ormiańską połączono z zestawem danych HO. Po usunięciu dwóch irańskich próbek, w których brakowało znacznej liczby miejsc, w analizie współdzielenia alleli uwzględniono łącznie 514 134 SNP.
Proporcje przodków oszacowano przy użyciu programu ADMIXTURE w wersji 1.3. 48 Przed analizami przycięliśmy SNP w nierównowadze sprzężeń (LD) poleceniem „-indep-pairwise 200 25 0.4” w programie PLINK 1.9. 49 W przypadku nienadzorowanego programu ADMIXTURE z populacjami ormiańskimi uzyskano 199 955 SNP, w przypadku populacji ormiańskich i porównywalnych współczesnych 203 863 SNP, a w przypadku połączonych danych starożytnych i współczesnych 289 247 SNP. Przeprowadziliśmy analizy pięć razy, a macierze współczynników przynależności do klastra z wielu przebiegów przeanalizowaliśmy przy użyciu CLUMPP. 50
Aby zwiększyć naszą zdolność do identyfikacji relacji między osobami, zastosowaliśmy technikę „malowania chromosomów” zastosowaną do danych haplotypów całego genomu, jak zaimplementowano w wersji 2 programu CHROMOPAINTER. 51 Zestaw danych obejmował 926 próbek i 482 117 SNP po przeprowadzeniu filtrowania wariantów za pomocą –geno 0,01, –hwe 0,000001 i –maf 0,001 w programie PLINK. Przeprowadziliśmy fazowanie naszych danych za pomocą narzędzia shapeit5 (narzędzie phase_common_static) 52 , korzystając z danych haplotypów z 1000 GP fazy 3 dostarczonych jako panel odniesienia. 53 Najpierw oszacowano parametry e (efektywna wielkość populacji) i μ (globalny współczynnik mutacji) dla czterech chromosomów oddzielnie (chromosomy 1, 4, 15, 22) przez 10 iteracji EM. Zbieżność wyników została później potwierdzona, a średnie wartości dla wszystkich chromosomów zostały obliczone. Te stałe wartości zostały użyte w kolejnym przebiegu ze wszystkimi chromosomami i wszystkimi osobnikami w porównaniu ze wszystkimi innymi z opcją „-a 0 0”. ChromoCombine został zastosowany do binowania różnych wyników chromosomowych. Przeprowadziliśmy PCA podobieństwa haplotypowego w oparciu o macierz współprzodków CHROMOPAINTER.
Następnie użyliśmy wersji 4.1.1 51 fineSTRUCTURE do klasyfikowania osobników do klastrów na podstawie relacji genetycznych. Przeprowadziliśmy 2 000 000 iteracji próbek łańcucha Markowa Monte Carlo (MCMC) ze 100 000 krokami wypalania, zachowując każdą 10 000 próbkę.
Wdrożono podejście wielokrotnej sekwencyjnej koalescencji Markowa (MSMC) (wersja 2.1.2) 54 w celu wywnioskowania historycznych zmian w efektywnej wielkości populacji i współczynnikach koalescencji krzyżowej (CCR). Genomy zostały fazowane za pomocą shapeit5 przy użyciu 1000 GP fazy 3 wariantu wydania. 53 Skrypty niestandardowe z repozytorium github zostały użyte do przygotowania plików wejściowych do analizy. 54 Brakujące miejsca zostały odfiltrowane, a warianty wieloalleliczne znormalizowane przed analizą. Do oszacowania efektywnej wielkości populacji uwzględniliśmy cztery osobniki (8 haplotypów) z każdej populacji, podczas gdy do separacji populacji użyliśmy dwóch haplotypów na populację. Przyjęliśmy współczynnik mutacji 1,25 × 10 −8 na parę zasad na pokolenie i czas pokolenia 25 lat. Do oszacowania CCR użyto jednego osobnika (2 haplotypy) z każdej populacji. Porównawcze zestawy danych uzyskano z panelu CEPH Human Genome Diversity Project (HGDP) 55 i wcześniejszych publikacji. 56 , 57 Tylko w przypadku próbek syryjskich przeprowadziliśmy dopasowanie przy użyciu Long Ranger 58 (wersja 2.2.2, przy użyciu GATK v.3.7), oprogramowania przeznaczonego do przetwarzania wyników sekwencjonowania chromu. Pozostałe próbki wyrównano przy użyciu opisanego powyżej potoku.
Modelowanie wykresu domieszek przeprowadzono za pomocą qpGraph w ADMIXTOOLS2 59 , używając Mbuti jako grupy zewnętrznej. Naszym celem było uzyskanie wykresów, w których współcześni Ormianie otrzymują domieszki z Armenia_LBA i Lebanon_IA. Do wstępnej analizy wykresów użyliśmy find_graph() z 250 powtórzeniami. Zauważyliśmy jednak, że większość wykresów wydawała się niepoprawna pod względem kolejności chronologicznej uwzględnionych populacji i/lub wykazywała nieprawidłowe relacje między próbkami, pomimo istniejącej wiedzy na temat tych relacji. Następnie najpierw uzyskaliśmy wykres rusztowania ( rysunek S24 ) z Lebanon_IA, Armenia_LBA wraz z populacjami, które okazały się źródłem starożytnych osobników z wyżyn Armenii. 7 Są to łowcy-zbieracze z Kaukazu (CHG), łowcy-zbieracze ze Wschodu (EHG), Anatolia_N i Levant_N. Do analiz wykorzystaliśmy tylko transwersję i nie uwzględniliśmy brakujących miejsc, co po filtrowaniu dało 65 370 SNP. Przyznajemy, że kilka innych wykresów również pasuje do zestawu danych. Jednak naszym głównym podejściem było dopasowanie naszego wykresu do wiedzy o relacjach z poprzednich analiz i przestrzeganie kolejności chronologicznej próbek. Aby modelować pochodzenie próbek ormiańskich, użyliśmy qpAdm z tego samego pakietu. Przetestowaliśmy dwukierunkową domieszkę z populacji z epoki żelaza w Libanie i późnej epoki brązu na wyżynach ormiańskich. Użyliśmy Mbuti, EHG, Kostenki14, Anatolia_N, Italy_North i Villabruna_HG jako populacji odniesienia. Przed przeprowadzeniem analizy oceniliśmy, czy populacje odniesienia mogą dobrze różnicować populacje źródłowe, obliczając qpWave. Po odfiltrowaniu transwersji mieliśmy 109 797 SNP. Zarówno w przypadku qpGraph, jak i qpAdm przyjęliśmy wartość graniczną 35 000 SNP dla analiz.
Oszacowanie współczynników par F ST przeprowadzono w smartpca z domyślnymi parametrami i fstonly: TAK.
Przebiegi homozygotyczności (ROH) obliczono za pomocą PLINK na połączonych danych genotypowych dla wszystkich populacji, z filtrem częstości występowania alleli mniejszościowych (MAF) ustawionym na 0,05. Regiony homozygotyczne zdefiniowano jako te z ponad 50 homozygotycznymi SNP w 500 kb okna przesuwnego. Użyliśmy również współczynnika trafień okna skanowania wynoszącego 0,05 i opcji –homozyg-window-het 1 –homozyg-window-missing 5, aby umożliwić jedno heterozygotyczne i pięć brakujących wywołań na okno. Dało to 399 509 SNP.
Segmenty tożsamości według pochodzenia (IBD) wykryto przy użyciu HapIBD 60 , a segmenty krótsze niż 3 cm odfiltrowano. Następnie użyliśmy HapNe-IBD, aby wywnioskować rozmiary demograficzne populacji na podstawie pozostałych segmentów współdzielących IBD. 61
Rozpad LD obliczono przy użyciu PLINK z opcją –r2, oknem przesuwnym o wielkości 70 kb i brakiem limitu dla r2. Pary SNP posortowano w przedziałach 70 kb na podstawie odległości między parami, a dla każdego przedziału obliczono wartości średnie.
Haplogrupy chromosomu Y zostały przypisane za pomocą yHaplo 62 , a następnie ręcznie sprawdzone i udoskonalone pod kątem SNP o wyższej rozdzielczości wymienionych w International Society of Genetic Genealogy w wersji 15.73. Przypisanie haplogrupy mitochondrialnej zostało wykonane za pomocą HaploGrep2. 63
Wykonano formalny test ciągłości przy użyciu metody opisanej w Schraiber, 64 oddzielnie dla współczesnych populacji ormiańskich. Przeprowadziliśmy ten test tylko dla przechwyconych starożytnych genomów. Biblioteka pysam w pythonie została użyta do wykonania pileupu plików bam. 65 Przed analizą dopasowaliśmy a priori alfa i beta do dyskretnych częstości alleli referencyjnych. Pliki alleli przodków pobrano z 1000 GP fazy 1. 53 Ograniczyliśmy analizy do miejsc z wywołaniami o wysokiej pewności, w których stan przodków jest potwierdzony przez wszystkie porównania sekwencji. Nie uwzględniliśmy również alleli o częstości 0 lub 1 we współczesnej populacji. Tak więc do testów ciągłości populacji z danymi przechwytywania użyliśmy ∼700 000 SNP. Do daty czasu domieszki użyliśmy ALDER 66 (wersja 1.03) z mindis 0,005. Przetworzyliśmy dane Fastq na 24 próbkach sardyńskich z panelu HGDP-CEPH 55 za pomocą potoku podobnego do tego dla współczesnych genomów ormiańskich. Połączyliśmy je z danymi z całego genomu na temat 99 Ormian z Haber et al. 15 za pomocą Genotype Harmonizer, co dało 645 992 SNP. Użyto rozmiaru bin 0,0001 i mindis 0,005.
Do ustalenia dat zmieszania się osób pochodzenia ormiańskiego z Libanu z epoki żelaza i ludności zamieszkującej wyżyny ormiańskie z późnej epoki brązu u współczesnych Ormian posłużyliśmy się wersją DATES 4010 67 .

Przetwarzanie danych do analiz genomiki medycznej z próbkami WGS

Do celów medycznych zastosowaliśmy procedurę dopasowania i genotypowania podobną do opisanej powyżej, wykorzystując referencyjny genom GRCh38.

Adnotacja wariantowa

Statystyki wariantów dotyczące liczby SNP i indelów obliczono za pomocą bcftools 38 dla pozycji wariantów w pliku vcf z 36 próbkami ormiańskimi. Loci wariantów zdefiniowano jako te z allelami niereferencyjnymi. Określiliśmy stan patogenny mutacji MEFV , korzystając z informacji o allelach pomocniczych z raportu dbSNP ( https://www.ncbi.nlm.nih.gov/snp/ ).
Vcftomaf 68 został użyty do uruchomienia adnotacji przez VEP 69 i konwersji plików vcf do MAF. Warianty z adnotacjami „Frame_Shift_Del,” „Frame_Shift_Ins,” „In_Frame_Del,” „In_Frame_Ins,” „Nonsense_Mutation,” „Nonstop_Mutations,” lub „Splice_Site” zostały zgrupowane jako mutacje utraty funkcji (LoF). Do wizualizacji wariantów genu użyto Maftools. 70 Obliczenia obejmujące AF odnoszą się do znormalizowanych miejsc adnotowanych przez MAF, gdzie wszystkie 36 próbek ormiańskich nie ma brakujących miejsc.

Przypisanie

Zamaskowaliśmy SNP z chipu Illumina 1M w jednym z genomów ormiańskich. Rozważano tylko dwualleliczne, niebrakujące miejsca wariantów. Aby ocenić dokładność imputacji zamaskowanego genotypu, użyliśmy dwóch paneli referencyjnych: (1) zintegrowane dane fazowe shapeit5 z fazy 3 1000 GP, 71 wywołane przeciwko montażowi GRCh38; i (2) panel referencyjny 1000 GP połączony z danymi fazowymi dla pozostałych genomów ormiańskich ( n  = 35). Użyliśmy phasing_common w shapeit5 do fazowania zestawu danych ormiańskich i IMPUTE5 do imputacji. Obliczono 72 kwadratowe współczynniki korelacji Pearsona ( 2 ), aby ocenić dokładność imputacji między genotypami CG (0, 1, 2) a imputowanymi dawkami (0, 2).

Wyniki

Warianty statystyk dla współczesnego ormiańskiego zestawu danych

Łącznie w naszym zestawie danych obejmującym 36 współczesnych próbek ormiańskich (z których dwie zostały wcześniej opublikowane) zidentyfikowaliśmy 13 523 774 wariantów autosomalnych obejmujących 11 134 554 SNP; i 2 510 513 indeli, z których 1 180 458 pozycji było wieloallelowych. Następnie sklasyfikowaliśmy warianty według częstości alleli w połączonym zestawie danych ormiańskich. Większość wariantów była bardzo powszechna (częstotliwość alleli >0,05) ( n  = 8 503 355), a tylko około jedna piąta z nich była singletonami ( n  = 3 388 182) ( Rysunek 2 A). Łącznie 13 283 198 wariantów było już obecnych w dbSNP, podczas gdy 567 320 było nowych i reprezentowanych głównie przez singletony ( n  = 512 915). Zgodnie z oczekiwaniami większość wariantów zidentyfikowano w intronach lub regionach międzygenowych (∼12 milionów), podczas gdy warianty LoF były rzadsze i ze znacznie większym udziałem pojedynczych lub podwójnych w porównaniu do innych wariantów ( Rysunek 2 B). Genomy zostały wzbogacone o krótkie indele i w większości powodowały zmianę bez przesunięcia ramki ( Rysunek S1 ). Podobnie, mniejsze indele były liczniejsze w regionach kodujących białka. Łącznie 12 172 i 10 442 warianty zostały rozpoznane jako uszkadzające lub potencjalnie uszkadzające z różnym poziomem pewności przez SIFT i PolyPhen (z 7472 nakładającymi się wariantami między dwiema adnotacjami).

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (267 KB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze

Rysunek 2. Warianty autosomalne w nowoczesnym zestawie danych ormiańskich

Warianty pogrupowano według (A) częstości występowania alleli i (B) lokalizacji oraz odpowiadających jej proporcji.
Wiadomo, że populacja ormiańska jest narażona na wysokie ryzyko rodzinnej gorączki śródziemnomorskiej (FMF [MIM: 134610 ]), 73 zaburzenia autozapalnego spowodowanego szerokim spektrum mutacji w genie MEFV [MIM: 608107 ] i występującego głównie u osób pochodzenia śródziemnomorskiego. Gen koduje 781-aminokwasowe białko zwane piryną, które jest ważnym modulatorem wrodzonej odporności. 74 Co uderzające, w naszym zestawie danych stwierdzono, że prawie połowa osób (16 z 36) jest nosicielami patogennych lub prawdopodobnie patogennych wariantów genu MEFV , co stanowi znacznie wyższą częstość występowania niż 20% zgłaszane w poprzednich badaniach. 73 Podkreśla to ograniczenia konwencjonalnych metod diagnostycznych, takich jak testy paskowe, które nie wydają się być czułą metodą identyfikacji patogennych lub prawdopodobnie patogennych mutacji w populacji ormiańskiej ( Rysunek S2 i Tabela S3 ). Co więcej, w jednej z naszych próbek znaleźliśmy nową mutację typu missense w genie MEFV , która według przewidywań PolyPhen (0,998) będzie szkodliwa.

Struktura populacji współczesnych Ormian

Oceniliśmy różnorodność genetyczną i podstrukturę w obrębie populacji ormiańskich. Chociaż Sasun geograficznie należy do centralnej części wyżyn ormiańskich, w większości naszych analiz traktujemy go jako odrębną grupę ( n  = 5), mając na celu zbadanie jego domniemanych różnic genetycznych w stosunku do innych populacji ormiańskich. Pozostałe osobniki ormiańskie zostały zgrupowane jako populacje zachodnie ( n  = 11), centralne ( n  = 12) i wschodnie ( n  = 6) wyżyn ormiańskich, biorąc pod uwagę ich historyczne, geopolityczne, kulturowe i językowe tło ( rysunek 1 ). Ogólnie rzecz biorąc, nie znaleźliśmy wyraźnego podziału między grupami ormiańskimi ( rysunki S3 i S4 A–S4C). Analiza współdzielenia alleli wykazała wysoki poziom podobieństwa genetycznego między wszystkimi grupami, ze szczególnie silnymi powiązaniami genetycznymi między wschodnimi i centralnymi populacjami ormiańskimi dla binów MAF (Sasun nie jest uwzględniony w analizie ze względu na małą liczebność próby). Co godne uwagi, połączona kohorta ormiańska wykazała znaczny stopień pokrewieństwa genetycznego z sąsiednimi populacjami ( rysunki S4 D–S4F). Podczas gdy wzór w PCA ( rysunek S3 A) można w większości wyjaśnić położeniem geograficznym populacji, z wyjątkiem kilku zachodnich osobników ormiańskich, ADMIXTURE dla próbek ormiańskich wskazał na subtelną odrębność w komponentach przodków Sasun ( rysunek S3 B), co może wynikać z domieszki lub podwyższonego tempa dryfu w populacji. Analiza ADMIXTURE z innymi współczesnymi populacjami wykazała bliskie pokrewieństwo między wszystkimi grupami ormiańskimi a Asyryjczykami ( rysunek S5 ). Gdy przeprowadziliśmy ponownie ADMIXTURE tylko dla kilku populacji Bliskiego Wschodu, wywnioskowaliśmy, że Sasun mają odrębny komponent przodków w porównaniu z większością osobników z innych populacji ormiańskich i Asyryjczyków przy K ≥ 3 ( rysunek S6 ). Mając na uwadze, że wyniki projektu ADMIXTURE należy interpretować ostrożnie w przypadku populacji, w których niedawno wystąpiło wąskie gardło, 75 zastosowaliśmy dodatkowe metody, umożliwiając tym samym solidniejszą analizę historii populacji i demografii regionu.
Porównanie par F ST między populacjami ujawniło bliskie podobieństwa genetyczne między Ormianami a ich sąsiadującymi populacjami ( rysunki 3 B S7 i S8 ), w tym Asyryjczykami, chociaż te zależności były stosunkowo mniej wyraźne w przypadku populacji Sasun. Wyniki te zostały dodatkowo potwierdzone podczas badania wzorców dzielenia się haplotypami grup ormiańskich za pomocą CHROMOPAINTER ( rysunek S9 ) i dalszej wizualizacji w formie hierarchicznego drzewa klastrowania za pomocą fineSTRUCTURE ( rysunek S10 ). Chociaż Sasunowie znajdowali się w siostrzanej gałęzi, wszystkie grupy ormiańskie grupowały się blisko siebie, co sugeruje, że nie ma między nimi istotnych różnic genetycznych. Jednocześnie zaobserwowaliśmy garstkę osób Asyryjskich, Tureckich i Syryjskich w klastrze ormiańskim, co raczej sugeruje pewną podstrukturę genetyczną w obrębie tych populacji i/lub poziom domieszki z Ormianami. Nasza analiza PCA oparta na dzieleniu się haplotypami ( Rysunek 3 A) konsekwentnie wykazywała grupowanie się Ormian z sąsiednimi populacjami z Kaukazu, Anatolii, Iranu i Asyrii. Ponadto wyniki grupowania populacji Ormian potwierdzają nasz podział na grupy regionalne.

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (895 KB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze
Rysunek 3. Analizy struktury populacji, relacji genetycznych i historii wielkości populacji współczesnych Ormian
(A) Analiza głównych składowych (PCA) oparta na dzieleniu się haplotypem. Do wykonania PCA wykorzystano macierz coancestry chunkcount z CHROMOPAINTER.
(B) Macierz parami odległości genetycznych F ST pomiędzy populacjami.
(C) Szacunki efektywnej wielkości populacji wywnioskowane z ośmiu haplotypów dla każdej populacji, przy użyciu modelu MSMC. Z wyjątkiem Sasun, grupy ormiańskie podążają za wzorem podobnym do wzoru próbek tureckich (typowy europejski kształt) w porównaniu do innych populacji w analizach. WA, CA i EA to skróty współczesnych próbek ormiańskich z zachodniej, środkowej i wschodniej części wyżyn ormiańskich.
(D) Tempo rozpadu LD w populacjach (ARM, Armenia; MES, Bliski Wschód; CAU, północny Kaukaz; wEUR, eEUR, cEUR i sEUR, odpowiednio zachodnia, wschodnia, środkowa i południowa Europa; AFR, Afryka; NA, SAs, CAs i EAs, odpowiednio Azja Północna, Południowa, Środkowa i Wschodnia). Przedstawiono średnie wartości dla przedziału 1000 pb powyżej 70 000 pb. Porównując LD w populacji Armenii z resztą grup, różnica jest istotna w przypadku populacji Afryki i Bliskiego Wschodu (test Kołmogorowa-Smirnowa, p  < 0,05).
Aby formalnie sprawdzić, czy Sasunowie otrzymali dodatkowy przepływ genów z Asyrii w porównaniu z innymi grupami ormiańskimi, przeprowadziliśmy D-statystykę w formie D(Sasun, other_modern_Armenian; Assyrian, Mbuti). Nasze wyniki wykazały, że Sasunowie utworzyli klad z innymi populacjami ormiańskimi, który nie został zerwany przez Asyryjczyków ( Tabela S4 ). Na podstawie tych analiz wnioskujemy, że wszyscy współcześni Ormianie są stosunkowo jednorodni, jednocześnie wykazując duże podobieństwo do sąsiednich populacji, i nie ma dowodów na to, że Sasunowie mają niezwykle wysoki wkład ze strony Asyryjczyków.

Historia demograficzna i skala czasowa rozbieżności

Analizy MSMC wykazały dowody na zmniejszenie liczebności populacji po 10 000 lat temu w przypadku Sasun. Odkrycie to może leżeć u podstaw ich odrębnych cech genetycznych zaobserwowanych w poprzednich analizach i sugeruje zdarzenie wąskiego gardła i/lub brak zewnętrznego przepływu genów (co wyolbrzymiałoby liczebność populacji) w Sasun w porównaniu z resztą populacji ormiańskich. Co znamienne, liczebność populacji była nawet mniejsza niż u Sardyńczyków (jak przedstawiono na rysunku 3 C), u których wcześniej wykazano znaczny spadek liczebności populacji w podobnym okresie. 35 Pozostałe grupy ormiańskie wykazywały efektywne liczebności populacji typowe dla większości Europejczyków z kontynentu, tj. z silnym wąskim gardłem między 50 000 a 60 000 lat temu, związanym z ekspansją poza Afrykę i późniejszym okresem szybkiego wzrostu populacji. Niemniej jednak zauważyliśmy, że większość krzywych szybkości koalescencji krzyżowej była dość niestabilna, co mogło wynikać z bardzo niedawnego momentu rozbieżności i, co za tym idzie, niewystarczającej rozdzielczości analizy MSMC ( rysunek S11 ).Przeanalizowaliśmy dalej średni wskaźnik zaniku LD u Ormian, co wskazuje na dryf genetyczny i historię populacji. Odkryliśmy, że Ormianie wykazują większe LD niż populacje afrykańskie, bliskowschodnie, południowoazjatyckie, kaukaskie i zachodnio-południowoeuropejskie oraz niższe LD niż populacje wschodnioazjatyckie i wschodnio-środkowoeuropejskie ( Rysunek 3 D). Sprawdziliśmy również status inbredu populacji, mierząc średnią całkowitą liczbę ROH ( Rysunek S12 ). Ormianie wykazali stosunkowo niską liczbę ROH w kategoriach krótkiej długości ROH w porównaniu z innymi populacjami. Wykazali jednak stosunkowo wysoką liczbę długich ROH, co odzwierciedla pewien poziom małżeństw pokrewieństwa w ogólnej populacji Ormian. Kiedy przeprowadziliśmy osobną analizę dla grup Ormian ( Rysunek S13 ), odkryliśmy, że najwyższe wskazanie pokrewieństwa zaobserwowano w zachodniej populacji Ormian. Przeanalizowaliśmy również dzielenie się IBD w obrębie populacji i nie znaleźliśmy dowodów na długie dzielenie się IBD między osobnikami, co sugeruje brak zarówno bliskich, jak i dalekich krewnych w populacjach ( Rysunek S14 ). Na podstawie wzorców dzielenia się IBD, przetestowaliśmy następnie scenariusze demograficzne w ciągu ostatnich 100 pokoleń, co jest uważane za bardziej wrażliwą metodę dla ostatnich okresów czasu niż MSMC. Chociaż istnieje niewiele sygnałów dla zmian populacji w ostatniej skali czasu, na podstawie wnioskowanego przedziału ufności możemy wnioskować, że populacja Sasun miała najniższą efektywną wielkość populacji w porównaniu z innymi grupami, co jest zgodne z naszymi poprzednimi wynikami ( Rysunek S15 ).

Dystrybucja haplogrup mitochondrialnych i chromosomu Y

Analiza spektrum haplogrup chromosomu Y i mtDNA u Ormian wykazała przewagę linii specyficznych dla regionu ( rysunki S16 i S17 ; tabela S1 ). W szczególności najczęstszymi haplogrupami chromosomu Y były R1b ​​(23%), J2a (26%) i J1a (16%). W naszym zestawie danych wszyscy Ormianie z haplogrupą R1b należą do linii R-Z2103 związanej z Jamną. 7 Co ciekawe, największą różnorodność genetyczną zaobserwowano na wyżynach ormiańskich. 24 Haplogrupy J2a i J1a są uważane za bliskowschodnie ze względu na swoje pochodzenie, ale mają również głębokie korzenie na Kaukazie, ponieważ znaleziono je w próbkach paleolitycznych z Gruzji. ​​76 Pula genów matrylinearnych Ormian jest reprezentowana głównie przez haplogrupy H (28%), J (17%), U (14%) i N (11%). Współczesny skład haplogrupy mtDNA był typowy dla starożytnych osobników z wyżyn Armenii, z wyjątkiem tej ostatniej linii, która nie występowała w próbkach od czasów neolitu do średniowiecza. 14 Ogólnie rzecz biorąc, nasze obserwacje patrylinearnych i matrylinearnych puli genetycznych Ormian były zgodne z poprzednimi wynikami. 14 , 24 , 25 , 26

Ormianie w relacji do innych współczesnych i starożytnych populacji: testowanie teorii bałkańskiej

W naszym badaniu ograniczyliśmy nasz zbiór danych starożytnych próbek z zachodniej i centralnej części wyżyn ormiańskich do stanowisk zlokalizowanych w granicach gór ( Rysunek 1 i Tabela S2 ), które naturalnie stanowiły barierę geograficzną dla starożytnej migracji ludności. 77 Aby ocenić powinowactwa genetyczne współczesnych Ormian do współczesnych i starożytnych osób z Bałkanów, najpierw przeprowadziliśmy analizę PCA, projektując starożytne próbki z regionu na pierwsze dwa główne komponenty wywnioskowane ze współczesnych populacji Europy, Bliskiego Wschodu i Kaukazu ( Rysunek 4 ). Zaobserwowaliśmy, że klaster współczesnych Ormian mieści się pomiędzy zmiennością genetyczną współczesnego Kaukazu i Bliskiego Wschodu, co jest zgodne z ich położeniem geograficznym. Porównując ze starożytnymi próbkami z wyżyn ormiańskich, zauważyliśmy, że wszystkie współczesne grupy Ormian częściowo pokrywają się ze starożytnymi mieszkańcami wschodniej części wyżyn, co sugeruje pewien stopień regionalnej ciągłości genetycznej od neolitu (najwcześniejsze dostępne próbki dla tego regionu). Podczas gdy starożytne próbki z centralnego regionu wyżyn ormiańskich (obecnie opublikowanych jest ich tylko kilka) znajdują się na skraju klastra ormiańskiego, większość starożytnych próbek z jego zachodnich części znajduje się dalej od jego rdzenia. Biorąc pod uwagę, że najnowsze starożytne okazy z zachodnich wyżyn ormiańskich należą do wczesnej epoki brązu (zestaw danych obejmujący ∼3950–2300 p.n.e.), wynik ten uzupełnia zapisy historyczne dotyczące późniejszego zasiedlenia tego regionu przez Ormian. 78 Co godne uwagi, grupowanie współczesnych zachodnich Ormian bliżej zarówno współczesnych, jak i starożytnych grup z wyżyn ormiańskich w środkowej części kraju pokrywa się z dowodami historycznymi dotyczącymi ruchów ludności i przesiedleń Ormian z przeważnie centralnych na zachodnie terytoria wyżyn w okresie Cesarstwa Bizantyjskiego. 79 W ostrym kontraście, zarówno współczesne, jak i starożytne próbki z Bałkanów wydają się znacznie oddalone od klastra ormiańskiego i są przyciągane głównie w stronę innych populacji europejskich. Następnie przeprowadziliśmy analizę ADMIXTURE z porównawczym zestawem danych współczesnych i starożytnych populacji ( Rysunek S18 ). Zgodnie z poprzednimi analizami, 7zarówno współczesne, jak i starożytne próbki z gór ormiańskich wykazują znaczną proporcję przodków CHG. Jednakże, podczas gdy współcześni Ormianie wykazują stosunkowo jednolity wzór przodków w obrębie grup, starożytne próbki z gór wykazują większy stopień regionalnej heterogeniczności w przeszłości. W szczególności, istnieje wyraźny wzrost przodków podobnych do neolityczno-anatolijskich w próbkach z zachodnich gór ormiańskich (od K > 5). Przy wyższych wartościach K, występują również różnice w włączaniu przodków EHG do starożytnych próbek z gór, co jest zgodne z poprzednimi obserwacjami. 7 Wszystkie starożytne próbki zachodnie i neolityczne wschodnie wykazują względny brak tego pochodzenia. Po jego pojawieniu się w okresie chalkolitu, wschodnie osoby z wczesnej epoki brązu wykazują widoczny spadek przodków EHG, po którym następuje odrodzenie w późnej epoce brązu. Ponadto, wyniki K = 7 sugerują podwyższone starożytne pochodzenie podobne do lewantyńskiego zarówno w zachodnich, jak i centralnych starożytnych populacjach gór ormiańskich. Kontrastuje to z wynikami wschodnich grup starożytnych wyżyn i jest zgodne z wynikami naszej analizy PCA.

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (794 KB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze

Rysunek 4. Analiza głównych składowych (PC1 vs. PC2) dla populacji współczesnych i starożytnych na podstawie danych o częstości alleli

Wartości w nawiasach oznaczają procent wariancji wyjaśniony przez dany PC. Zgodnie z PCA, starożytne próbki ze wschodnich części wyżyn ormiańskich grupują się ze wszystkimi współczesnymi grupami ormiańskimi (wszystkie są oznaczone czerwonymi literami), podczas gdy współczesne (oznaczone niebieską literą) i starożytne próbki z Bałkanów wykazują charakterystyczne grupowanie bliższe innym współczesnym populacjom europejskim. W prawym dolnym rogu znajduje się powiększony widok analizy dla klastra wyżyn ormiańskich. S, W, C i E to skróty współczesnych próbek ormiańskich z Sasun, zachodniej, centralnej i wschodniej części wyżyn ormiańskich. W legendzie ArmH odnosi się do wyżyn ormiańskich.
Wzór zaobserwowany w poprzednich analizach skłonił nas do przeprowadzenia statystyki D w formie D(Modern_Ormenians, Ancient_Armenian_highlands_eastern; Ancient_Armenian_highlands_western/central, Mbuti), aby zbadać dalej, czy wszystkie współczesne grupy ormiańskie tworzą klad ze starożytnymi próbkami ze wschodniej części wyżyn ormiańskich, w porównaniu do starożytnych przedstawicieli z jej centralnych i zachodnich regionów ( Tabela S5 ). Aby uwzględnić prawdopodobne artefaktualne przyciąganie wśród współczesnych populacji w porównaniu do starożytnych próbek dotkniętych uszkodzeniami pośmiertnymi lub między dwiema starożytnymi próbkami w porównaniu do współczesnych populacji, we wszystkich naszych analizach statystyki D obejmujących starożytne osoby stosowaliśmy wyłącznie transwersje. Ponadto, w celu zminimalizowania potencjalnego wpływu błędów technicznych, które mogłyby wyniknąć z połączenia danych dotyczących przechwytywania i strzelb, nasze analizy ograniczyliśmy do jednego typu technologii, chyba że takie ograniczenie było niewykonalne. Nie wykryliśmy żadnych przypadków, w których lokalni przedstawiciele starożytności zaburzyli klad pomiędzy jakąkolwiek współczesną populacją ormiańską a starożytnymi próbkami z wyżyn wschodniej Armenii (w niektórych przypadkach wykryliśmy silniejszy sygnał przyciągania pomiędzy starożytnymi próbkami).
Aby lepiej zrozumieć historię populacji zachodnich wyżyn ormiańskich, przeprowadziliśmy statystyki f3 grup zewnętrznych i odkryliśmy, że mieszkańcy regionu z epoki chalkolitu i brązu mają więcej wspólnego z próbkami z epoki neolitu i brązu z zachodniej Anatolii, a także z populacjami z epoki neolitu i chalkolitu z Grecji i Bułgarii ( Rysunek S19 ). Aby potwierdzić tę obserwację i sprawdzić, czy jakiekolwiek współczesne populacje przełamują klad między starożytnymi próbkami z zachodniej/centralnej i wschodniej części wyżyn ormiańskich, obliczyliśmy statystyki D w formie D(Ancient_Armenian_highlands_western/central, Ancient_Armenian_highlands_eastern; X_Modern, Mbuti). Wykryliśmy sygnał przepływu genów do starożytnych populacji zachodnich wyżyn ormiańskich ze źródeł podobnych do sardyńskich i bliskowschodnich ( Tabela S6 ). Ten sygnał jest już wykrywalny w regionie w trakcie/po chalkolicie. Wśród współczesnych populacji w Europie, Sardyńczycy mają największe powinowactwo do wczesnych europejskich rolników i często działają jako pełnomocnik neolitycznego pochodzenia w analizach genetycznych populacji. 41 , 46 Jednocześnie wykazano, że współczesne populacje Lewantu mają znaczny poziom pochodzenia z epoki brązu Lewantu, który z kolei ma przodków z lokalnych populacji neolitycznych. 80 Następnie przeprowadziliśmy podobny test statystyki D dla grupy centralnych wyżyn Armenii ( Tabela S6 ) i znaleźliśmy tylko pojedynczy przypadek znacząco złamanego kladu przez źródło podobne do bliskowschodniego, gdy w analizach wykorzystano próbkę urartyjską z regionu i populację wczesnej epoki żelaza ze wschodniej części wyżyn. Aby ustalić, czy małe rozmiary próbek w połączeniu z heterogenicznością populacji komplikują wykrywanie sygnału przepływu genów, przeprowadziliśmy serię testów statystyki D przy użyciu starożytnych populacji z zachodnich wyżyn Armenii i tych, w których znaczący klad wykryto w poprzednich analizach ( Rysunki S20–S23 ). Poprzez losowe pobieranie podprób tych populacji dla każdego przebiegu odkryliśmy, że sygnał staje się wykrywalny ( Z  > 3) w zdecydowanej większości przebiegów, gdy obie testowane starożytne populacje mają wielkość próby wynoszącą siedem (zaczyna się poprawiać od wielkości próby wynoszącej pięć, gdy sygnał jest silny). Dlatego dochodzimy do wniosku, że dodatkowe próbki są konieczne dla zbioru danych starożytnych centralnych wyżyn Armenii, aby zapewnić wiarygodne wyniki. Zastosowaliśmy te same kryteria wielkości próby i poziom ostrożności do wszystkich naszych testów statystyki D w naszym badaniu obejmującym starożytne próbki.
Biorąc pod uwagę powyższe wyniki, w poniższych analizach wykorzystaliśmy populacje wschodnich wyżyn ormiańskich jako jedynych starożytnych przedstawicieli regionu. Aby dokładniej zbadać kwestię pochodzenia genetycznego Ormian, użyliśmy statystyk D w formie D(Modern_Ormenians, Ancient_Armenian_highlands_eastern; X_Balkan, Mbuti), aby formalnie sprawdzić, czy współcześni Ormianie otrzymali jakiekolwiek dane genetyczne ze starożytnych i współczesnych próbek z Bałkanów ( Tabela S7 ). Nie zaobserwowaliśmy żadnych istotnie dodatnich wartości statystyk D (których można się spodziewać na podstawie teorii bałkańskiej), co podważa obecność przodków bałkańskich u współczesnych Ormian. Ponadto odkryliśmy, że w większości naszych porównań starożytne i współczesne próbki z wyżyn ormiańskich tworzą klad (| Z | < 3) z wykluczeniem starożytnych i współczesnych próbek z Bałkanów. Jednocześnie wykryliśmy sygnał wskazujący, że przodkowie współczesnych Ormian otrzymali napływ genetyczny z zewnętrznego źródła, prawdopodobnie po późnej epoce brązu/żelaza ( Z  < −3) (dostrzegamy małą wielkość próby dla próbek ze środkowej epoki brązu). Jednakże zauważyliśmy zwiększone współdzielenie alleli pochodnych między współczesnymi Ormianami i Grekami ( Z  > 3), co może być konsekwencją wspólnego przepływu genów między populacjami, a to wymaga dalszych badań. Aby porównać wyniki, które uzyskaliśmy dla populacji wyżyn ormiańskich, przeprowadziliśmy podobny zestaw testów statystyki D, ale tym razem zbadaliśmy klad obejmujący współczesne i starożytne populacje greckie w formie D(starożytna_grecka, współczesna_grecka; X_starożytna_populacja, Mbuti) ( Tabela S8 ). Wyniki wskazały na pewien poziom nieciągłości genetycznej w regionie po późnej epoce brązu, ujawniając związek genetyczny między próbkami z epoki mykeńskiej, minojskiej i neolitycznej Grecji a próbkami z Anatolii, Armenii i Bliskiego Wschodu ( Tabela S8 ).
Ujmując rzecz całościowo, nasze wyniki potwierdzają brak istotnego wkładu genetycznego z Bałkanów do starożytnych i współczesnych populacji Wyżyny Armeńskiej.

Wgląd w ciągłość regionalną

Następnie zastosowaliśmy podejście maksymalnego prawdopodobieństwa 64 , aby przetestować ciągłość starożytnych i współczesnych populacji wyżyn ormiańskich. Model ten zakłada scenariusz, w którym zmiany częstotliwości alleli od wspólnego przodka w czasie są wyjaśniane wyłącznie przez dryf. Test sugeruje bardzo niedawny czas dryfu we wszystkich współczesnych populacjach ormiańskich od wspólnego przodka z próbkami starożytnymi, co potwierdza bliskie pokrewieństwo starożytnych i współczesnych mieszkańców tego regionu. Jednak model odrzuca hipotezę ciągłości regionalnej, ponieważ starożytne populacje wydają się mieć znacznie dłuższe czasy dryfu ( Tabela S9 ). Wynik ten jest zgodny ze scenariuszem domieszki do współczesnych Ormian z populacji zewnętrznej, która rozeszła się wcześniej niż czas podziału między współczesnymi i starożytnymi mieszkańcami regionu. W konsekwencji domieszka ta zwiększyłaby heterozygotyczność współczesnych Ormian, a tym samym wyolbrzymiłaby czas dryfu w starożytnych populacjach wyżyn ormiańskich (ponieważ zgodnie z modelem nie jest dozwolony żaden napływ genetyczny), co ostatecznie doprowadziłoby do odrzucenia ciągłości regionalnej. Jesteśmy również świadomi, że ta metoda jest bardzo wrażliwa, nawet na niewielkie ilości domieszek, co stanowi pewne ograniczenie, biorąc pod uwagę fakt, że wszystkie współczesne populacje doświadczyły w różnych momentach swojej historii pewnego stopnia domieszek.

Określanie źródła, zakresu i czasu przepływu genów

Następnie zbadaliśmy odpowiadające sobie sygnatury przepływu genów do wyżyn ormiańskich, używając statystyk D w formie D(Modern_Ormenians, Ancient_Armenian_highlands_eastern; X_ancient_population, Mbuti). Odkryliśmy, że kilka starożytnych próbek z Bliskiego Wschodu, Anatolii i stepów euroazjatyckich jest ściślej związanych ze starożytnymi próbkami z wyżyn ormiańskich niż te ostatnie ze współczesnymi Ormianami ( Z  < −3), co potwierdza nasze poprzednie wyniki ( Tabela S10 ). Zgodnie z wynikami statystyk D dla starożytnych próbek bałkańskich, najwyższe wartości ujemne wykryto w przypadku próbek z późnej epoki brązu/żelaza z wyżyn ormiańskich. Warto wspomnieć, że populacja Sasun wykazuje podobne wyniki w statystykach D, co potwierdza ustalenie, że populacja ma podobne pochodzenie do innych grup ormiańskich ( Tabela S11 ). Ze względu na powszechność przechwyconych starożytnych próbek i nasze zaangażowanie w utrzymanie spójnego kryterium technologii sekwencjonowania dla włączenia próbki do naszych testów statystyki D, zdecydowaliśmy się nie uwzględniać próbek z wyżyn ormiańskich z epoki żelaza do średniowiecza oraz późnej epoki brązu, które zostały zsekwencjonowane przy użyciu metody shotgun. Jednak po włączeniu tych próbek do oddzielnych statystyk D w formie D(Modern_Ormenians, Late_Bronze_Age_Armenian_highlands_eastern; ancient_Lebanon, Mbuti) przy użyciu wszystkich SNP, próbki z epoki żelaza, starożytności i okresu rzymskiego w Libanie wyróżniały się jako jedyne porównawcze starożytne próbki wykazujące dodatnie wartości Z , co sugeruje pokrewieństwo ze współczesnymi Ormianami ( Tabela S12 ). Gdy ograniczyliśmy analizę tylko do transwersji, musieliśmy wykluczyć cztery z pięciu populacji wyżyn ormiańskich z późnej epoki brązu, aby spełnić próg SNP wynoszący 35 000. W rezultacie analiza z transwersjami nie przyniosła istotnych wyników, prawdopodobnie z powodu mniejszej liczebności próby i zmniejszonej liczby SNP.
Aby sprawdzić, czy jakiekolwiek współczesne populacje przerywają klad między współczesnymi Ormianami a starożytnymi próbkami z tego regionu, obliczyliśmy statystykę D w postaci D(Modern_Ormenians, Ancient_Armenian_highlands_eastern; X_modern_population, Mbuti). Znaleźliśmy sygnał przepływu genów do współczesnych Ormian ze źródeł podobnych do sardyńskich i bliskowschodnich po późnej epoce brązu/żelaza (choć należy zauważyć, że wielkość naszej próby dla próbek ze środkowej epoki brązu jest obecnie ograniczona) ( Tabela S13 ). Warto zauważyć, że podczas gdy wszystkie grupy Ormian wykazują podobną tendencję, centralna grupa Ormian miała największy wkład w ten sygnał, co może wynikać ze stosunkowo większej wielkości próby tej populacji. Asyryjczycy również przerwali klad między populacjami późnej epoki brązu/żelaza ze wschodnich części wyżyn a współczesnymi wschodnimi i środkowymi Ormianami, wykazując jednocześnie podobną tendencję dla Sasun i zachodnich Ormian. Potwierdza to nasze wcześniejsze wnioski dotyczące braku jakichkolwiek dodatkowych przodków asyryjskich w Sasun i wspiera sugestię, że wyniki poprzedniego testu D-statystyki z udziałem współczesnych Greków ( Tabela S7 ) wskazują na napływ genetyczny do współczesnych Ormian, który jest wspólny dla współczesnych Greków. Podsumowując, nasze wyniki sugerują przepływ genów ze źródła podobnego do neolityczno-lewantyńskiego rolnika do wschodnich części wyżyn ormiańskich, prawdopodobnie w trakcie/po zakończeniu epoki brązu, co odróżniało współczesnych Ormian od ich regionalnych przodków. Wynik ten jest zgodny z ustaleniami z wcześniejszego badania, które wykazało wzrost przodków z Lewantu z okresu przedceramicznego neolitu w Armenii po późnej epoce brązu (∼3200 lat temu). 7
Co ciekawe, zaobserwowaliśmy powinowactwo między próbkami ormiańskimi z późnej epoki brązu a pewnymi współczesnymi populacjami północno- i wschodnioeuropejskimi. Przypuszczamy, że może to być spowodowane późniejszym przybyciem przodków związanych ze stepem do tego regionu ( Tabela S13 ). Wykryliśmy również, że testy statystyki D z próbkami z wczesnej epoki brązu z wyżyn ormiańskich prawie osiągnęły istotność ( Z  = 3). Podczas losowego pobierania próbek osobników z późnej epoki brązu dla mniejszej populacji, potwierdziliśmy, że ograniczenia wielkości próby i heterogeniczność populacji wpływają na wyniki statystyki D ( Rysunek S24 ), co podnosi ostrożność w interpretacji wyników dla grup o ograniczonej liczbie osobników.
Następnie przeprowadziliśmy porównanie parami populacji starożytnych gór ormiańskich w celu ujawnienia czasu napływu genetycznego podobnego do neolitu-lewantyńskiego-rolników ( Tabela S14 ). Oprócz tego zidentyfikowaliśmy wpływ przepływu genów związanego ze stepem jako czynnik przyczyniający się do heterogeniczności genetycznej w obrębie populacji gór ormiańskich na wschodzie na przestrzeni czasu. Zgodnie z poprzednim badaniem, 7 testy statystyk D ujawniły wcześniej wspomniany przepływ genów w regionie, po którym nastąpiła stopniowa redukcja pochodzenia stepowego po epoce żelaza.
Następnie podjęliśmy próbę datowania napływu genetycznego na podstawie wzorców nierównowagi sprzężeń z ALDER ( rysunek S25 ). Musieliśmy przeprowadzić test jednej populacji (współcześni Ormianie jako cel z danymi wejściowymi od Sardyńczyków), który ma ograniczoną moc, więc dodaliśmy wcześniej opublikowane dane genotypowe dotyczące 99 Ormian 15 i 24 Sardyńczyków. 55 Udało nam się wykryć znaczący sygnał domieszki ze źródłem podobnym do sardyńskiego u Ormian, z szacowanym wkładem przodków wynoszącym 41,6 ± 3,6. Czas domieszki uzyskany z ALDER sugeruje stosunkowo stare wydarzenie (najlepszy sygnał odpowiada 218,50 ± 16,39 pokoleniu temu lub około 6100 lat), co jest bliższe końcowi epoki chalkolitu/wczesnego brązu w Armenii.
Podczas gdy ALDER okazał się być dość solidny w odniesieniu do dokładnego źródła domieszki, rozbieżność w datowaniu może wynikać z faktu, że Sardyńczycy byli jedynie odległym odpowiednikiem populacji, która zmieszała się z Ormianami. Następnie użyliśmy DATES, co pozwala na datowanie zdarzeń domieszki poprzez włączenie starożytnego DNA ( Rysunek S26 ). Analiza pokazuje, że próbki z wyżyn Libanu z epoki żelaza i z gór Ormian z późnej epoki brązu były zmieszane przez 55 pokoleń (wartości błędu standardowego w zakresie od 57,23 do 35,95), co mniej więcej odpowiada początkowi późnej epoki brązu w Armenii.
Wyraźnie modelowaliśmy pochodzenie Ormian, dopasowując oczekiwane wartości statystyki f do tych zaobserwowanych przy użyciu qpGraph ( rysunki 5 , S27 i S28 ). Model pasujący do danych sugeruje, że oprócz głównego wkładu genetycznego lokalnej populacji późnej epoki brązu, współcześni Ormianie otrzymali przepływ genów z populacji spokrewnionej z Lewantem z epoki żelaza. Co ciekawe, ilość wkładu genetycznego z tej drugiej grupy zmienia się, gdy weźmiemy pod uwagę ogólną populację Ormian (45%, rysunek 5 A) lub subpopulacje (28%–53%), przy czym wschodni Ormianie mają najmniejszy udział domieszek (28%, rysunek 5 B). Różnice genetyczne między grupami geograficznymi są zgodne z wynikami PCA ( rysunek S3 A), gdzie niektórzy zachodni i środkowi (w tym Sasun, który jest najbardziej oddalony) Ormianie wydawali się być dalej od centralnego klastra Ormian.

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (408 KB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze

Rysunek 5. Wykresy domieszek pasujące do współczesnych genomów ormiańskich, które można modelować jako mieszaninę ze źródeł typu Armenia_LBA i Levant_LBA

Przedstawiono wykresy dla (A) połączonej populacji Ormian (LL = 25, najgorzej dopasowana statystyka f, Z  = 2,9) i (B) wschodniej populacji Ormian (LL = 20,17, najgorzej dopasowana statystyka f, Z  = 2,77). EA to skrót od wschodnich Ormian.
Na koniec użyliśmy qpAdm w próbie modelowania współczesnych Ormian z genetycznym wkładem populacji z wyżyn Lewantu z epoki żelaza i późnej epoki brązu w Armenii. Jednak analiza ta była wysoce niespójna i niestabilna podczas zmiany wielkości próby w populacjach lub dodawania większej liczby populacji w grupie odniesienia (pomimo że qpWave wykazał ich dobrą reprezentację). W związku z tym uzyskaliśmy wynik 0,6 i 0,4 dla genetycznego wkładu populacji z wyżyn Lewantu z epoki żelaza i późnej epoki brązu w Armenii. Biorąc pod uwagę od 3 do 4 odchyleń standardowych (błąd standardowy wynosi 0,04), proporcje te są zgodne z wcześniej wspomnianym odkryciem.

Przypisanie

Chcieliśmy ocenić dokładność imputacji, gdy zestaw genomów specyficznych dla populacji zostanie dodany do najbardziej aktualnego panelu referencyjnego, takiego jak faza 3 1000 GP, wywołana przeciwko zespołowi GRCh38. W tym celu zamaskowaliśmy wszystkie pozycje w jednym genomie ormiańskim, które nie są obecne w macierzy Illumina Human-1M, imputowaliśmy te SNP z pozostałych wariantów i porównaliśmy imputowane i znane genotypy. Imputację przeprowadzono przy użyciu dwóch paneli referencyjnych, oddzielnie: danych haplotypu 1000 GP ( n  = 5248) i połączonego panelu referencyjnego, składającego się z pierwszego i pozostałych genomów ormiańskich ( n  = 35). W rezultacie znaleźliśmy nieznacznie poprawione wartości dla rzadkich wariantów przy użyciu połączonego panelu, podczas gdy rozkład w innych blokach częstotliwości pozostał dość podobny ( rysunek S29 ).

Dyskusja

Przeprowadziliśmy kompleksową analizę WGS Ormian, wykorzystując pokaźny zbiór danych genomów o dużym pokryciu. Zgodnie z wcześniejszymi badaniami nad matrylinearnym składem genetycznym26 odkryliśmy, że Ormianie charakteryzują się niewielką podstrukturą wewnątrzpopulacyjną. Jedyną populacją, która subtelnie różni się od innych grup Ormian, jest Sasun, o której wcześniej informowano jako o odrębnej na podstawie analizy linii patrylinearnych.24 Wykazaliśmy, że populacja Sasun przeszła przez wyraźne wąskie gardło demograficzne, co jest główną przyczyną obserwowanych różnic genetycznych w stosunku do innych Ormian. Należy zauważyć, że wszystkie populacje Ormian miały duże podobieństwa genetyczne do populacji w bliskiej odległości geograficznej, w tym Asyryjczyków, a Sasun nie otrzymywali znacząco większego przepływu genów od tych ostatnich, co mogłoby wyjaśniać ich niewielką dywergencję genetyczną od innych populacji Ormian.
Opisaliśmy architekturę wariantów w genomach ormiańskich i odkryliśmy ponad 500 000 wariantów, które wcześniej nie zostały zgłoszone w bazie danych wariantów dbSNP. Jako osobne pytanie zbadaliśmy moc imputacji, gdy do panelu referencyjnego fazy 3 1000 GP dodano odniesienie specyficzne dla populacji, dostosowane do zespołu GRCh38. Biorąc pod uwagę przeważnie rzadką częstotliwość występowania wariantów w genomach, uwzględnienie stosunkowo niewielkiej liczby genomów specyficznych dla populacji obok zestawu danych 1000 GP spowodowało jedynie marginalne ulepszenia w naszej zdolności imputacji. W związku z tym, aby znacząco zwiększyć moc imputacji, wymagany jest znacznie większy zestaw danych specyficznych dla populacji.
Skupiliśmy się na rozwiązaniu długotrwałej zagadki dotyczącej genetycznych korzeni Ormian. Chociaż hipoteza bałkańska od dawna jest uważana za najbardziej prawdopodobną narrację na temat pochodzenia Ormian, nasze wyniki wykazały, że współcześni Ormianie różnią się genetycznie zarówno od starożytnej, jak i współczesnej populacji Bałkanów. Podczas gdy niedawne badanie7 spekuluje , że rozcieńczenie przodków EHG po epoce żelaza może sugerować przepływ genów powiązany z Bałkanami, nasze wyniki ujawniają inne źródło tego wkładu genetycznego. Jednocześnie Lazaridis i in.7 potwierdzają brak bałkańskiego komponentu genetycznego w starożytnych próbkach z Armenii.
Wręcz przeciwnie, ujawniliśmy wysoki poziom regionalnej ciągłości genetycznej we wschodnich częściach wyżyn Armenii przez ponad 6000 lat, potwierdzając analizy z poprzednich badań. 14 , 15 Niedawne badanie sugeruje również podobny poziom stabilności aż do epoki brązu na Południowym Kaukazie (nie było testu na późniejsze wkłady, ponieważ w tym badaniu wykorzystano tylko aDNA). 6 Ten wzór stoi w kontraście do większości innych populacji zachodniej Eurazji, które przeszły przez wielokrotne duże napływy i wymiany. 9 , 41 Względnie podobny przykład stanowią Sardyńczycy, którzy od dawna byli uważani za genetyczny izolat w regionie od neolitu, ale niedawne badania wykazały, że wyspa otrzymała liczne wkłady genetyczne po epoce brązu, 81 stanowiące 38%–44% ich przodków.
Chociaż zachodnie i centralne regiony wyżyn Armenii nie są obecnie gęsto badane pod kątem starożytnego DNA, udało nam się jednak dostrzec różnice w czasie penetracji przodków spokrewnionych z Lewantyńczykami do różnych części wyżyn. Podczas gdy odkryliśmy, że te ostatnie były już obecne w zachodnich częściach wyżyn w chalkolicie (późniejszy przepływ genów podobny do Levantine-Early-Farmers mógł wzmocnić ten sygnał), udokumentowaliśmy, że wschodnie części otrzymały go poprzez zdarzenie domieszki, które prawdopodobnie miało miejsce w pewnym momencie po wczesnej epoce brązu, zakłócając tym samym ciągłość genetyczną w regionie. Uznajemy ograniczenia wielkości próby w populacjach sprzed późnej epoki brązu z wyżyn Armenii i uznajemy, że przepływ genów mógł być stopniowym procesem, który osiągnął szczytową intensywność pod koniec późnej epoki brązu, ale prawdopodobnie rozpoczął się znacznie wcześniej (zgodnie z wynikami ALDER i DATES). Tak więc pierwsza migracja na wschodnie wyżyny ormiańskie po neolicie wprowadziła pochodzenie związane ze stepem w regionie, podczas gdy druga zwiększyła proporcję pochodzenia związanego z Lewantynami, szczególnie u mieszkańców wyżyn ormiańskich po późnej epoce brązu. Nasze wyniki dotyczące populacji źródłowej i daty dla mieszanki są mniej więcej porównywalne z badaniami genetycznymi nad Ormianami przeprowadzonymi do tej pory. Podwyższone pochodzenie podobne do neolitycznych-europejskich-rolników u Ormian zostało wcześniej wykryte na podstawie samych współczesnych genomów, 15 a szybkość przepływu genów została oszacowana na 29%. W naszym badaniu zauważyliśmy klin dla napływu genetycznego podobnego do neolitycznych-lewantyńskich-rolników w obrębie ormiańskich grup geograficznych; najbardziej odizolowaną populacją byli wschodni Ormianie (28% wkładu genetycznego związanego z epoką żelaza w Libanie, wnioskowanego przez qpGraph), co zgadza się z ich geografią i w ten sposób pokazuje wpływ gór jako barier dla wymiany genetycznej. Jednocześnie uznajemy, że w przypadku modelowania przodków i obliczeń wkładu genetycznego nie było wykonalne uniknięcie mieszania różnych technologii sekwencjonowania, co mogłoby potencjalnie wpłynąć na wyniki. Jako przestrogę należy wziąć pod uwagę, że w statystykach D powinowactwa współczesne-współczesne lub starożytne-starożytne mogą wynikać nie tylko z uszkodzeń pośmiertnych, ale również z błędu odniesienia, 82 którego nie można wyeliminować wyłącznie za pomocą transwersji. Dlatego w naszym badaniu zastosowaliśmy dodatkowe metody, wyciągając wnioski ze wszystkich z nich.
Nasze badanie obejmujące próbki aDNA zwiększa siłę testów domieszek, dostarczając właściwych źródeł przodków populacji. W związku z tym nie mogliśmy znaleźć dowodów na mieszanki wielu populacji w okresie 3000–2000 p.n.e. 15 Z kolei znaleźliśmy sygnał na pojedyncze zdarzenie domieszki ze źródła podobnego do Levantine-Early-Farmers, które stale występowało w trakcie/po zakończeniu późnej epoki brązu. Przyznajemy, że zdarzenie domieszki mogło mieć miejsce wcześniej, co dobrze pasowałoby do naszych szacunkowych dat (wywnioskowanych przez ALDER i DATES) oraz ostatnich badań nad historią demograficzną w sąsiednim regionie Kaukazu. 83 Co ciekawe, dowody archeologiczne wskazują, że okresy środkowej i późnej epoki brązu na wyżynach ormiańskich charakteryzowały się znaczącymi transformacjami. 10 W środkowej epoce brązu pojawiły się różne kultury, dominujący koczowniczy tryb życia i aktywne relacje z Anatolią i Morzem Egejskim. Z kolei późna epoka brązu charakteryzowała się intensywnymi interakcjami kulturowymi z sąsiednimi ludami, w tym Hurytami, Hetytami i Mezopotamczykami.
Podsumowując, dochodzimy do wniosku, że w pewnym momencie po wczesnej epoce brązu nastąpił ruch na dużą skalę przez Bliski Wschód. Z genetycznego punktu widzenia ruch ten doprowadził do znacznego wkładu przodków neolitycznych w populacjach zamieszkujących ten region. W szczególności ruch ten dotarł do górzystych regionów wschodnich części wyżyn ormiańskich, co spowodowało genetyczne rozbieżności współczesnych populacji od ich regionalnych przodków. Pytania o to, skąd dokładnie i kiedy przybyli ci imigranci, a także co było przyczyną tak rozległej fali migracji, pozostają bez odpowiedzi. Konieczne są dalsze badania złożonych procesów demograficznych regionu wraz z włączeniem dodatkowych starożytnych i współczesnych danych z wyżyn ormiańskich, Anatolii i Lewantu.

Dostępność danych i kodu

Wygenerowane w tym badaniu nieprzetworzone pliki Fastq są dostępne w Europejskim Archiwum Nukleotydów pod numerem ENA: PRJEB78867. Dane genotypowe wygenerowane przez HaplotypeCaller i dane genotypowania Illumina są dostępne za pośrednictwem FigShare: https://doi.org/10.6084/m9.figshare.27277578 .

Podziękowanie

LY, A. Hovhannisyan, MA i ZK otrzymali wsparcie od Komitetu Naukowego Ministerstwa Edukacji i Nauki Armenii (projekt badawczy nr 21AG-1F025 ). A. Hovhannisyan potwierdza finansowanie przez EU MSCA-IF na mocy umowy o dotację 101063265 , ACTIVITY 5 programu ESF DoRa , Calouste Gulbenkian Foundation i Foundation for Armenian Science and Technology (FAST). A. Hovhannisyan jest wdzięczny Mait Metspalu i Richardowi Villiemsowi za pomoc i nadzór nad badaniami programu ESF DoRa na Uniwersytecie w Tartu. A. Manica, PMD i ERJ otrzymali wsparcie od ERC Consolidator grant 647797 „LocalAdaptation”. Dziękujemy Centrum Obliczeń Wysokiej Wydajności Uniwersytetu w Tartu za udostępnienie zaplecza obliczeniowego. Jesteśmy wdzięczni Hovann Simonian za wsparcie projektu mającego na celu stworzenie Genetic Atlas of Armenia. Dziękujemy Danielowi Bradleyowi i Larze Cassidy za konstruktywne dyskusje i komentarze.

Wkład autorów

A. Manica, LY i A. Hovhannisyan wymyślili i zaprojektowali badanie. Próbkowanie przeprowadzili LY, MA i ZK. Fundusze na nowoczesną generację całego genomu zostały pozyskane przez LY, a PHA Hovhannisyan przeprowadził odpowiednie analizy genetyczne populacji i medycyny pod nadzorem A. Manica. PMD, ERJ, A. Hakobyan, JGS, LS, HS, A. Margaryan, ZX, SJ i JB przyczynili się do analizy danych. A. Hovhannisyan i A. Manica zaprojektowali rysunki i napisali manuskrypt. Wszyscy autorzy przyczynili się do ostatecznej wersji manuskryptu.

Deklaracja interesów

Autorzy deklarują brak konfliktu interesów.

Informacje uzupełniające

Co to jest?

Pobierz: Pobierz plik Acrobat PDF (13MB)Dokument S1. Rysunki S1–S29 .

Pobierz: Pobierz arkusz kalkulacyjny (57KB)Tabela S1. Zbiór danych ormiańskich wykorzystany w badaniu .

Pobierz: Pobierz arkusz kalkulacyjny (603 KB)Tabela S2. Zbiór danych wykorzystany w badaniu .

Pobierz: Pobierz arkusz kalkulacyjny (106 KB)Tabela S3. Warianty genu MEFV w zbiorze danych ormiańskich .

Pobierz: Pobierz arkusz kalkulacyjny (9KB)Tabela S4. Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (18 KB)Tabela S5 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (31 KB)Tabela S6 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (17KB)Tabela S7 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (18 KB)Tabela S8 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (10 KB)Tabela S9. Test największego prawdopodobieństwa .

Pobierz: Pobierz arkusz kalkulacyjny (23 KB)Tabela S10 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (23 KB)Tabela S11. Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (13KB)Tabela S12. Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (144 KB)Tabela S13. Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (63 KB)Tabela S14. Statystyki D.

Pobierz: Pobierz plik Acrobat PDF (15MB)Dokument S2. Artykuł plus informacje uzupełniające .

Odniesienia

Autor: 

Anahit Hovhannisyan, Pierpaolo Maisano Delser, Anna Hakobyan, Eppie R. Jones, Joshua G. Schraiber, Mariya Antonosyan, Ashot Margaryan, Zhe Xue, Sungwon Jeon, Jong Bhak, Peter Hrechdakian, Hovhannes Sahakyan, Lehti Saag, Zaruhi Khachatryan, Levon Yepiskoposyan i in.

Historia demograficzna i zmienność genetyczna populacji ormiańskiej
Publikacja: 

Amerykańskie czasopismo genetyki człowieka

Wydawca:

Elsevier

Data:

Dostępne online 25 listopada 2024 r.

Opublikowano: 25 listopada 2024 r.
https://doi.org/10.1016/j.ajhg.2024.10.022Get rights and content
Niniejszy artykuł jest dostępny na licencji Creative Commons CC-BY-NC-ND i zezwala na niekomercyjne wykorzystanie dzieła w opublikowanej formie, bez adaptacji lub zmian, pod warunkiem, że dzieło jest w pełni przypisane.

Link do artykułu: https://www.sciencedirect.com/science/article/pii/S0002929724003914