Genetyka

Historia demograficzna i zmienność genetyczna populacji ormiańskiej / Anahit Hovhannisyan, Pierpaolo Maisano Delser, Anna Hakobyan, Eppie R. Jones, Joshua G. Schraiber, Mariya Antonosyan, Ashot Margaryan, Zhe Xue, Sungwon Jeon, Jong Bhak, Peter Hrechdakian, Hovhannes Sahakyan, Lehti Saag, Zaruhi Khachatryan, Levon Yepiskoposyan i in.

Przez

Red.

26 listopada 2024

3992

Dwoje ormiańskich dzieci, 1893. Autorstwa This file is from the Mechanical Curator collection, a set of over 1 million images scanned from out-of-copyright books and released to Flickr Commons by the British Library.View image on FlickrView all images from bookView catalogue entry for book., Domena publiczna, https://commons.wikimedia.org/w/index.php?curid=33147795

Streszczenie

Przedstawiamy pokaźny ( n = 34) zbiór danych całego genomu na temat Ormian, populacji zamieszkującej region w Azji Zachodniej znany jako Wyżyny Ormiańskie. Wyposażeni w te dane genetyczne przeprowadziliśmy badanie całego genomu Ormian i rozszyfrowaliśmy ich szczegółową strukturę populacji oraz złożoną historię demograficzną. Wykazaliśmy, że populacje Ormian z zachodnich, centralnych i wschodnich części wyżyn są stosunkowo jednorodne. Sasun, populacja na południu, o której twierdzono, że otrzymała główny wkład genetyczny od Asyryjczyków, zamiast tego wyprowadziła swój nieznacznie rozbieżny profil genetyczny z wąskiego gardła, które wystąpiło w niedawnej przeszłości. Zbadaliśmy również dyskutowaną kwestię pochodzenia genetycznego Ormian i nie znaleźliśmy żadnego znaczącego poparcia dla historycznych sugestii Herodota dotyczących ich przodków związanych z Bałkanami. Sprawdziliśmy stopień ciągłości współczesnych Ormian ze starożytnymi mieszkańcami wschodnich wyżyn Ormiańskich i wykryliśmy wkład genetyczny do regionu ze źródła powiązanego z neolitycznymi rolnikami lewantyńskimi w pewnym momencie po wczesnej epoce brązu. Ponadto skatalogowaliśmy mnóstwo nowych mutacji unikalnych dla populacji, w tym mutację missense, która prawdopodobnie powoduje rodzinną gorączkę śródziemnomorską, chorobę autozapalną bardzo rozpowszechnioną u Ormian. W ten sposób podkreślamy znaczenie dalszych badań genetycznych i medycznych tej populacji.

Słowa kluczowe: ciągłość genetyczna, Wyżyny Ormiańskie, Ormianie, Teoria bałkańska, Epoka brązu, badanie całego genomu.

1-s2.0-S0002929724003914-main

Wstęp

Ormianie są uznawani za jedną ze starożytnych populacji w Azji Zachodniej i historycznie zamieszkiwali obszar wyżyn ormiańskich ¹ ( Rysunek 1 ). Leżące między Europą a Azją terytorium wyżyn było lądowym pomostem dla głównych migracji ludzi od czasu ich wczesnego osadnictwa w górnym paleolicie. ² Ze względu na bliskość Żyznego Półksiężyca region ten wyłonił się jako jeden z najwcześniejszych ośrodków, które przyjęły rolnictwo w neolicie, odgrywając jednocześnie kluczową rolę w rozpowszechnianiu technologii, takich jak narzędzia obsydianowe, ³ obuwie skórzane, ⁴ i uprawa winorośli. ⁵ Okres ten charakteryzował się rozległymi interakcjami genetycznymi między Kaukazem, północnym Lewantem, Iranem i Anatolią przez długi okres czasu, ⁶^,⁷ ze znaczącym przepływem genów ze źródła podobnego do południowego Kaukazu do Anatolii, rozpoczynającym się po zakończeniu neolitu. ⁷ Innym dobrze udokumentowanym wydarzeniem postneolitycznym był początek migracji ludności z Kaukazu na stepy, co ostatecznie przyczyniło się genetycznie do powstania przodków Jamnych. ⁷^,⁸^,⁹ Epoka brązu na wyżynach Armenii jest naznaczona wzrostem i upadkiem wielu kultur archeologicznych, w tym wczesnej kultury brązu Kura-Araxes, środkowego brązu wczesnego Kurhanu, tradycji ceramicznych Trialeti-Wanadzor, Sewan-Artsach, Karmir-berd i Karmir-vank oraz późnej epoki brązu i wczesnej epoki żelaza kultury Lchashen-Metsamor. ¹⁰ Około po okresie wczesnej epoki brązu migracja ze stepu w kierunku południowo-wschodnim wprowadziła do regionu przodków związanych z Jamną (choć przeważnie nie dotarła do zachodnich i centralnych części wyżyn Armenii). ⁷ Wspomniane wcześniej przepływy genów, poparte dowodami językowymi wskazującymi na ukształtowanie się języka proto-ormiańskiego w drugiej połowie epoki brązu (ok. 4000 lat temu), ¹¹ plasują Wyżynę Armeńską jako potencjalny kandydat lub bliski ojczyznę języków proto-indoeuropejskich, skąd następnie rozprzestrzeniły się one na Europę Zachodnią, Azję Środkową i Indie.

Najwcześniejsze odniesienie do Armenii jako państwa znajduje się w babilońskiej wersji inskrypcji z Behistun, datowanej na 522 r. p.n.e., na początku panowania Dariusza I Wielkiego. ¹²^,¹³ W staroperskiej wersji tej samej inskrypcji region ten został nazwany Urartu, królestwem epoki żelaza, które rozkwitało na wyżynach ormiańskich przez około trzy stulecia i charakteryzowało się znaczną heterogenicznością genetyczną. ⁷ Następne okresy w regionie zostały naznaczone serią najazdów i masowych migracji miejscowej ludności, które w różny sposób wpłynęły na różne części wyżyn. Obejmowały one najazdy imperiów asyryjskiego, perskiego i bizantyjskiego, Arabów, Turków seldżuckich, Mongołów i Imperium Osmańskiego. Chociaż w przeszłości Ormianie zamieszkiwali regiony sięgające aż do wybrzeża Morza Śródziemnego, obecnie zamieszkują głównie wschodnią część wyżyn ormiańskich, położoną na południowym Kaukazie, gdzie znajduje się dzisiejsza Armenia ( Rysunek 1 ).

To złożone tło historyczne wyżyn sprawia, że badanie historii demograficznej Ormian jest kwestią ważną, aby rzucić światło na zaludnianie i migracje regionalne. Jednocześnie górski krajobraz, odrębny i bardzo stary język ormiański oraz silna tożsamość narodowa i kulturowa, wzmocniona później przez przyjęcie chrześcijaństwa, mogły sprzyjać długotrwałej izolacji genetycznej Ormian od sąsiednich populacji. ¹⁴^,¹⁵^,¹⁶ Rzeczywiście, porównanie starożytnych i współczesnych genomów mitochondrialnych (mtDNA) na przestrzeni 8000 lat ujawniło niezwykle wysoki poziom ciągłości genetycznej matrylinearnej w regionie. ¹⁴ Obraz izolacji genetycznej jest dodatkowo poparty badaniami autosomalnymi całego genomu współczesnych Ormian, które sugerują brak zewnętrznego napływu genetycznego co najmniej od epoki brązu. ¹⁵^,¹⁶ Niemniej jednak współczesne genomy mają ograniczoną możliwość wyciągania wniosków na temat ciągłości genetycznej w czasie, a szczegółowe badanie historii demograficznej i populacyjnej Ormian obejmujące zarówno starożytne, jak i współczesne genomy nie zostało jeszcze przeprowadzone.

Innym niedostatecznie zbadanym i bardzo dyskutowanym pytaniem jest pochodzenie Ormian. Istnieje kilka teorii i legend dotyczących formowania się populacji, choć dwie z nich przeważają. Według długoletniej „teorii bałkańskiej” opartej na pismach starożytnego greckiego historyka Herodota przodkami Ormian byli frygijscy koloniści, którzy przybyli na wyżyny ormiańskie z Bałkanów. ¹⁷ Wniosek ten wyprowadzono głównie z faktu, że Ormianie byli uzbrojeni na sposób frygijski, gdy byli częścią armii perskiej. Wspólne pochodzenie Ormian i Frygów sugerują ponadto niektórzy językoznawcy, którzy spekulują, że język protoormiański należał do podgrupy trako-frygijskiej w obrębie rodziny języków indoeuropejskich. ¹⁸ Niedawne badanie językoznawcze pogrupowało języki ormiański i grecki w jedną głęboką gałąź, co sugeruje, że oddzieliły się one od głównego europejskiego kladu na wczesnym etapie indoeuropejskiego drzewa językowego. ¹¹ Jednak alternatywny pogląd oparty na popularnej legendzie o pochodzeniu Ormian sugeruje lokalne ukształtowanie się populacji. ¹⁹ Pomimo rozległych wykopalisk w tym rejonie, do tej pory nie znaleziono przekonujących dowodów archeologicznych, które potwierdzałyby którąkolwiek z tych hipotez. ²⁰ W kwestii pochodzenia, etnogeneza Sasun, ludności ormiańskiej zamieszkującej południową część wyżyn ormiańskich (współczesna południowo-wschodnia Turcja) i mówiącej odrębnym dialektem w języku ormiańskim, ²¹ wyróżnia się jako szczególna kontrowersja. Według starożytnego ormiańskiego historyka Movsesa Khorenatsiego (V w. n.e.), książęce klany Sasun były potomkami synów Sennacheryba, króla asyryjskiego. ²² Sprawozdanie historyka opierało się na Biblii, ²³ źródłach klinowych i lokalnych tradycyjnych opowieściach. Co intrygujące, skład haplogrupy chromosomu Y Sasun różni się od składu innych populacji ormiańskich uderzająco wysoką częstością występowania haplogrupy T, ²⁴ co sugeruje prawdopodobne procesy demograficzne specyficzne dla danej populacji. Dlatego też konieczne jest dokładne badanie genetyczne dotyczące relacji między współczesnymi Ormianami a starożytnymi i współczesnymi próbkami z Bałkanów, a także wewnętrznej podstruktury w obrębie populacji ormiańskich.

Wreszcie, istnieje dobrze znana potrzeba rozszerzenia badań genetycznych na populacje zróżnicowane etnicznie, ponieważ zrozumienie specyficznych dla populacji wariantów genetycznych odgrywa kluczową rolę w badaniach medycznych i biomedycznych. Ormianie pozostają niedostatecznie reprezentowani w obecnych bazach danych genomicznych, w tym w 1000 Genomes Project (1000 GP). Struktura genetyczna populacji została w większości zbadana przy użyciu technologii mikromacierzy lub markerów genetycznych uniparentalnych, ¹⁵^,²⁴^,²⁵^,²⁶ i do tej pory zgłoszono tylko osiem pełnych genomów Ormian (dwa zsekwencjonowane za pomocą platformy Illumina, a pozostałe sześć za pomocą Complete Genomics).27 ^,²⁸^Tak więc kompletny obraz zmienności genetycznej u Ormian pozostaje w dużej mierze niezbadany.

Tutaj przedstawiamy zbiór danych obejmujący 34 sekwencje całego genomu osób ormiańskich, których wszyscy czterej dziadkowie (4GP) pochodzili z tego samego regionu w obrębie wyżyn ormiańskich. Podzieliliśmy próbki na trzy grupy reprezentujące regiony zachodnie (WA; n = 11), centralne (CA; n = 17, co obejmuje populację Sasun; n = 5) i wschodnie (EA; n = 6) w obrębie wyżyn ormiańskich ( Rysunek 1 i Tabela S1 ). Wygenerowaliśmy również dane z chipa Illumina obejmujące cały genom 23 osób ormiańskich zebranych przy użyciu podobnych kryteriów pochodzenia (WA = 2, CA = 7 i EA = 14). W całym tekście odnosimy się do tych populacji jako do współczesnych Ormian zachodnich, centralnych i wschodnich. Uzbrojeni w nasz nowoczesny zestaw danych, a także gęsto pobrane starożytne genomy z regionu ⁷^,²⁹^,³⁰^,³¹ ( ryc. 1 i tabela S2 ), przeprowadziliśmy szczegółową analizę podstruktury genetycznej wśród Ormian, zbadaliśmy ich pochodzenie genetyczne i demografię oraz sprawdziliśmy, czy populację można rzeczywiście uznać za izolat chroniony przed głównymi migracjami, które ukształtowały resztę zachodniej Eurazji. ¹⁵^,¹⁶ Ponadto scharakteryzowaliśmy spektrum wariantów genetycznych w kohorcie ormiańskiej. Jako część naszych analiz zajęliśmy się również kwestią dokładności procesu imputacji, gdy uwzględniono panel referencyjny specyficzny dla populacji i najbardziej aktualny panel referencyjny haplotypów 1000 GP dla zespołu GRCh38.

Materiał i metody

Pobieranie próbek, sekwencjonowanie i etyka

Wszyscy darczyńcy, którzy przekazali próbki do tego projektu, zostali przepytani na temat swojego pochodzenia i wypełnili kwestionariusz dotyczący miasta pochodzenia ich rodziców i dziadków. Próbki pobrano od osób zarówno z diaspory, jak i z Republiki Armenii. Wybraliśmy niespokrewnione osoby, których czwórka dziadków pochodziła z tego samego regionu w obrębie Wyżyny Armeńskiej i podzieliliśmy ich geograficznie na zachodnią ( n = 13), centralną ( n = 24) i wschodnią ( n = 20) grupę Ormian. Dlatego w tym badaniu używamy terminu „Ormianie” w odniesieniu do osób, które etnicznie i kulturowo identyfikują się jako część tej populacji i których przodkowie sięgają co najmniej czterech pokoleń wstecz w obrębie określonego regionu Wyżyny Armeńskiej. Nie mieliśmy żadnych wcześniejszych informacji na temat praktyk małżeńskich w tych społecznościach. Badanie to zostało zatwierdzone przez Komisję Etyki Instytutu Biologii Molekularnej Narodowej Akademii Nauk Republiki Armenii (NAS RA) (IRB #00004079). Wszyscy uczestnicy zostali poinformowani o celu badania i wyrazili zgodę na udział.

Pobrano próbki krwi od naszych dawców. Próbki DNA wyekstrahowano w Instytucie Biologii Molekularnej NAS RA, stosując modyfikację procedury wysolania. ³² próbki DNA znormalizowano (∼50 ng/μL), a 34 próbki wysłano do sekwencjonowania całego genomu metodą parzystych końców (WGS) o wysokim pokryciu (∼30×) na platformie Illumina HiSeq X Ten (Macrogen, Seul, Korea Południowa). Pozostałe próbki genotypowano za pomocą chipa Illumina 713K w estońskim biocentrum w Tartu w Estonii. Wszystkie szczegóły dotyczące pobierania próbek i sekwencjonowania podano w Tabeli S1 .

Przetwarzanie danych do analiz genomiki populacyjnej z próbkami WGS

Sekwencje adapterów przycięto z końców odczytów za pomocą trimadap. ³³ Wyrównanie próbek przeprowadzono zgodnie z procedurą opisaną w Mallick i in. ²⁷ W szczególności sekwencje wyrównano do kompilacji hs37d5 ludzkiego genomu referencyjnego za pomocą Burrows-Wheeler Aligner (BWA) w wersji 0.7.16, ³⁴ a odczyty klonalne usunięto za pomocą samblastera. ³⁵ Duplikaty odczytów oznaczono za pomocą Picarda w wersji 2.12.1. ³⁶ Kalibrację baz przeprowadzono za pomocą Genome Analysis Toolkit (GATK) w wersji 4.1.9.0, ³⁷ a filtrowanie jakości mapowania ustawiono na 20 za pomocą samtools 1.16. ³⁸ Wywołanie wariantu przeprowadzono przy użyciu HaplotypeCaller w GATK w celu wygenerowania pośrednich plików gVCF, które następnie połączono z GenomicsDBImport i wykorzystano w GenotypeGVCF do wspólnego genotypowania wielu próbek. Ponowna kalibracja wyniku jakości wariantu została przeprowadzona przez VariantRecalibrator dla obu SNP i indelów (insercji i delecji) oddzielnie, a odfiltrowane miejsca zostały wykluczone za pomocą SelectVariants.

Przed przeprowadzeniem kolejnych analiz sprawdzono pokrewieństwo z KING na nowo wygenerowanych danych WGS i chipie Illumina. Jako próg odcięcia przy filtrowaniu krewnych drugiego stopnia lub bliższych zastosowano współczynnik pokrewieństwa wynoszący 0,0884 ^.

Łączenie ze starożytnymi i nowoczesnymi zbiorami danych referencyjnych

Połączyliśmy nasze 34 pełne genomy z dwoma ormiańskimi (4GP) całymi genomami z projektu Simons. ²⁷ danych Fastq zostało wyrównanych i genotypowanych przy użyciu tej samej procedury, co opisano powyżej. Tidypopgen ⁴⁰ został użyty do połączenia współczesnych próbek ormiańskich z połączeniami z współczesnych populacji w zestawie danych Human Origins (HO) ⁴¹ i danymi obejmującymi cały genom ze starożytnych próbek w Lazaridis et al. ⁷ Wykluczyliśmy pozycje z wieloma allelami; bez żadnego dodatkowego filtrowania specyficznego dla analizy doprowadziło to do następujących zestawów SNP: 1 053 115 SNP, gdy analiza opierała się wyłącznie na współczesnych próbkach ormiańskich i starożytnych, i 591 014 SNP, gdy użyto połączonego zestawu danych starożytnych i innych współczesnych próbek, odpowiednio z początkowych 1 054 671 i 591 642 SNP w panelu HO. Aby złagodzić potencjalny wpływ stronniczości technologicznej, ograniczyliśmy nasz zbiór danych do jednego typu technologii, shotgun lub capture, kiedykolwiek było to wykonalne. ⁴² W związku z tym nasza analiza Dstat i analiza głównych składowych (PCA) zostały przeprowadzone wyłącznie na genomach wygenerowanych przez capture, podczas gdy analizy DATES wykorzystywały wyłącznie genomy wygenerowane przez shotgun. Jednak w przypadku niektórych analiz, takich jak ADMIXTURE, qpAdmix i qpGraph, w których połączyliśmy współczesne i starożytne zbiory danych, genomy reprezentujące przodków wymaganych do modelowania nie były konsekwentnie generowane przy użyciu tej samej technologii. Wyeliminowaliśmy zarówno próbki wykazujące bliskie pokrewieństwo, jak i te, które nie spełniały kryteriów analizy zanieczyszczeń. Szczegółowe informacje przedstawiono szczegółowo w Tabeli S2 .

Analizy genomiczne populacji

PCA wykonano z szerokim panelem nowoczesnych i starożytnych próbek przy użyciu oprogramowania smartpca firmy Eigensoft 7.2.0 ⁴³ z wyłączoną opcją usuwania wartości odstających. Wszystkie starożytne próbki zostały rzutowane na główne komponenty przy użyciu opcji lsqproject: YES. Do analiz ustawiliśmy próg 100 000 SNP.

Statystyki D dla danych z tablicy SNP obliczono przy użyciu programu qpDstat w pakiecie ADMIXTOOLS 7.0.1. ⁴⁴ Statystyki uznawano za istotne, jeśli wynik Z był większy niż 3, co odpowiadało wartości p <0,001. Aby uwzględnić potencjalny wpływ uszkodzeń starożytnego DNA, użyliśmy wyłącznie transwersji. ⁴⁵ Tak więc statystyki D dla próbek porównawczych zarówno starożytnych, jak i współczesnych wykonano na podstawie 109 869 SNP, podczas gdy w przypadku próbek starożytnych oparto się na 197 022 SNP. Do analiz zastosowano próg 35 000 SNP.

Współdzielenie alleli między współczesnymi populacjami ormiańskimi oraz między każdą populacją ormiańską a sąsiednimi grupami etnicznymi zostało oszacowane dla każdego miejsca jako prawdopodobieństwo, że dwóch losowo wybranych nosicieli w połączonej populacji pochodzi z różnych populacji, znormalizowane przez panmiktyczne oczekiwanie, jak opisano w Chiang et al. ⁴⁶ Biorąc pod uwagę osobliwości genetyczne populacji Sasun, nie uwzględniliśmy jej w centralnej grupie ormiańskiej w analizie. Jednak ze względu na niewielką liczebność populacji ( n = 5) nie przeprowadziliśmy również osobno analizy współdzielenia alleli dla tej populacji. Aby zwiększyć liczbę próbek, do zestawu danych dodano również nowo genotypowane dane Illumina 23 Ormian za pomocą Genotype Harmonizer ( Tabela S1 ). Usunięto ⁴⁷ pojedynczych, miejsc niezmiennych i miejsc brakujących. Tak więc nasze filtrowanie dało w rezultacie 677 047 SNP. W przypadku analiz między populacją ormiańską i porównawczą połączoną populację ormiańską połączono z zestawem danych HO. Po usunięciu dwóch irańskich próbek, w których brakowało znacznej liczby miejsc, w analizie współdzielenia alleli uwzględniono łącznie 514 134 SNP.

Proporcje przodków oszacowano przy użyciu programu ADMIXTURE w wersji 1.3. ⁴⁸ Przed analizami przycięliśmy SNP w nierównowadze sprzężeń (LD) poleceniem „-indep-pairwise 200 25 0.4” w programie PLINK 1.9. ⁴⁹ W przypadku nienadzorowanego programu ADMIXTURE z populacjami ormiańskimi uzyskano 199 955 SNP, w przypadku populacji ormiańskich i porównywalnych współczesnych 203 863 SNP, a w przypadku połączonych danych starożytnych i współczesnych 289 247 SNP. Przeprowadziliśmy analizy pięć razy, a macierze współczynników przynależności do klastra z wielu przebiegów przeanalizowaliśmy przy użyciu CLUMPP. ⁵⁰

Aby zwiększyć naszą zdolność do identyfikacji relacji między osobami, zastosowaliśmy technikę „malowania chromosomów” zastosowaną do danych haplotypów całego genomu, jak zaimplementowano w wersji 2 programu CHROMOPAINTER. ⁵¹ Zestaw danych obejmował 926 próbek i 482 117 SNP po przeprowadzeniu filtrowania wariantów za pomocą –geno 0,01, –hwe 0,000001 i –maf 0,001 w programie PLINK. Przeprowadziliśmy fazowanie naszych danych za pomocą narzędzia shapeit5 (narzędzie phase_common_static) ⁵² , korzystając z danych haplotypów z 1000 GP fazy 3 dostarczonych jako panel odniesienia. ⁵³ Najpierw oszacowano parametry N _e (efektywna wielkość populacji) i μ (globalny współczynnik mutacji) dla czterech chromosomów oddzielnie (chromosomy 1, 4, 15, 22) przez 10 iteracji EM. Zbieżność wyników została później potwierdzona, a średnie wartości dla wszystkich chromosomów zostały obliczone. Te stałe wartości zostały użyte w kolejnym przebiegu ze wszystkimi chromosomami i wszystkimi osobnikami w porównaniu ze wszystkimi innymi z opcją „-a 0 0”. ChromoCombine został zastosowany do binowania różnych wyników chromosomowych. Przeprowadziliśmy PCA podobieństwa haplotypowego w oparciu o macierz współprzodków CHROMOPAINTER.

Następnie użyliśmy wersji 4.1.1 ⁵¹ fineSTRUCTURE do klasyfikowania osobników do klastrów na podstawie relacji genetycznych. Przeprowadziliśmy 2 000 000 iteracji próbek łańcucha Markowa Monte Carlo (MCMC) ze 100 000 krokami wypalania, zachowując każdą 10 000 próbkę.

Wdrożono podejście wielokrotnej sekwencyjnej koalescencji Markowa (MSMC) (wersja 2.1.2) ^{54 w celu wywnioskowania historycznych zmian w efektywnej wielkości populacji i współczynnikach koalescencji krzyżowej (CCR). Genomy zostały fazowane za pomocą shapeit5 przy użyciu 1000 GP fazy 3 wariantu wydania.}⁵³ Skrypty niestandardowe z repozytorium github zostały użyte do przygotowania plików wejściowych do analizy. ⁵⁴ Brakujące miejsca zostały odfiltrowane, a warianty wieloalleliczne znormalizowane przed analizą. Do oszacowania efektywnej wielkości populacji uwzględniliśmy cztery osobniki (8 haplotypów) z każdej populacji, podczas gdy do separacji populacji użyliśmy dwóch haplotypów na populację. Przyjęliśmy współczynnik mutacji 1,25 × 10 ⁻⁸ na parę zasad na pokolenie i czas pokolenia 25 lat. Do oszacowania CCR użyto jednego osobnika (2 haplotypy) z każdej populacji. Porównawcze zestawy danych uzyskano z panelu CEPH Human Genome Diversity Project (HGDP) ⁵⁵ i wcześniejszych publikacji. ⁵⁶^,⁵⁷ Tylko w przypadku próbek syryjskich przeprowadziliśmy dopasowanie przy użyciu Long Ranger ⁵⁸ (wersja 2.2.2, przy użyciu GATK v.3.7), oprogramowania przeznaczonego do przetwarzania wyników sekwencjonowania chromu. Pozostałe próbki wyrównano przy użyciu opisanego powyżej potoku.

Modelowanie wykresu domieszek przeprowadzono za pomocą qpGraph w ADMIXTOOLS2 ⁵⁹ , używając Mbuti jako grupy zewnętrznej. Naszym celem było uzyskanie wykresów, w których współcześni Ormianie otrzymują domieszki z Armenia_LBA i Lebanon_IA. Do wstępnej analizy wykresów użyliśmy find_graph() z 250 powtórzeniami. Zauważyliśmy jednak, że większość wykresów wydawała się niepoprawna pod względem kolejności chronologicznej uwzględnionych populacji i/lub wykazywała nieprawidłowe relacje między próbkami, pomimo istniejącej wiedzy na temat tych relacji. Następnie najpierw uzyskaliśmy wykres rusztowania ( rysunek S24 ) z Lebanon_IA, Armenia_LBA wraz z populacjami, które okazały się źródłem starożytnych osobników z wyżyn Armenii. ⁷ Są to łowcy-zbieracze z Kaukazu (CHG), łowcy-zbieracze ze Wschodu (EHG), Anatolia_N i Levant_N. Do analiz wykorzystaliśmy tylko transwersję i nie uwzględniliśmy brakujących miejsc, co po filtrowaniu dało 65 370 SNP. Przyznajemy, że kilka innych wykresów również pasuje do zestawu danych. Jednak naszym głównym podejściem było dopasowanie naszego wykresu do wiedzy o relacjach z poprzednich analiz i przestrzeganie kolejności chronologicznej próbek. Aby modelować pochodzenie próbek ormiańskich, użyliśmy qpAdm z tego samego pakietu. Przetestowaliśmy dwukierunkową domieszkę z populacji z epoki żelaza w Libanie i późnej epoki brązu na wyżynach ormiańskich. Użyliśmy Mbuti, EHG, Kostenki14, Anatolia_N, Italy_North i Villabruna_HG jako populacji odniesienia. Przed przeprowadzeniem analizy oceniliśmy, czy populacje odniesienia mogą dobrze różnicować populacje źródłowe, obliczając qpWave. Po odfiltrowaniu transwersji mieliśmy 109 797 SNP. Zarówno w przypadku qpGraph, jak i qpAdm przyjęliśmy wartość graniczną 35 000 SNP dla analiz.

Oszacowanie współczynników par F _ST przeprowadzono w smartpca z domyślnymi parametrami i fstonly: TAK.

Przebiegi homozygotyczności (ROH) obliczono za pomocą PLINK na połączonych danych genotypowych dla wszystkich populacji, z filtrem częstości występowania alleli mniejszościowych (MAF) ustawionym na 0,05. Regiony homozygotyczne zdefiniowano jako te z ponad 50 homozygotycznymi SNP w 500 kb okna przesuwnego. Użyliśmy również współczynnika trafień okna skanowania wynoszącego 0,05 i opcji –homozyg-window-het 1 –homozyg-window-missing 5, aby umożliwić jedno heterozygotyczne i pięć brakujących wywołań na okno. Dało to 399 509 SNP.

Segmenty tożsamości według pochodzenia (IBD) wykryto przy użyciu HapIBD ⁶⁰ , a segmenty krótsze niż 3 cm odfiltrowano. Następnie użyliśmy HapNe-IBD, aby wywnioskować rozmiary demograficzne populacji na podstawie pozostałych segmentów współdzielących IBD. ⁶¹

Rozpad LD obliczono przy użyciu PLINK z opcją –r2, oknem przesuwnym o wielkości 70 kb i brakiem limitu dla r2. Pary SNP posortowano w przedziałach 70 kb na podstawie odległości między parami, a dla każdego przedziału obliczono wartości średnie.

Haplogrupy chromosomu Y zostały przypisane za pomocą yHaplo ⁶² , a następnie ręcznie sprawdzone i udoskonalone pod kątem SNP o wyższej rozdzielczości wymienionych w International Society of Genetic Genealogy w wersji 15.73. Przypisanie haplogrupy mitochondrialnej zostało wykonane za pomocą HaploGrep2. ⁶³

Wykonano formalny test ciągłości przy użyciu metody opisanej w Schraiber, ⁶⁴ oddzielnie dla współczesnych populacji ormiańskich. Przeprowadziliśmy ten test tylko dla przechwyconych starożytnych genomów. Biblioteka pysam w pythonie została użyta do wykonania pileupu plików bam. ⁶⁵ Przed analizą dopasowaliśmy a priori alfa i beta do dyskretnych częstości alleli referencyjnych. Pliki alleli przodków pobrano z 1000 GP fazy 1. ⁵³ Ograniczyliśmy analizy do miejsc z wywołaniami o wysokiej pewności, w których stan przodków jest potwierdzony przez wszystkie porównania sekwencji. Nie uwzględniliśmy również alleli o częstości 0 lub 1 we współczesnej populacji. Tak więc do testów ciągłości populacji z danymi przechwytywania użyliśmy ∼700 000 SNP. Do daty czasu domieszki użyliśmy ALDER ⁶⁶ (wersja 1.03) z mindis 0,005. Przetworzyliśmy dane Fastq na 24 próbkach sardyńskich z panelu HGDP-CEPH ⁵⁵ za pomocą potoku podobnego do tego dla współczesnych genomów ormiańskich. Połączyliśmy je z danymi z całego genomu na temat 99 Ormian z Haber et al. ¹⁵ za pomocą Genotype Harmonizer, co dało 645 992 SNP. Użyto rozmiaru bin 0,0001 i mindis 0,005.

Do ustalenia dat zmieszania się osób pochodzenia ormiańskiego z Libanu z epoki żelaza i ludności zamieszkującej wyżyny ormiańskie z późnej epoki brązu u współczesnych Ormian posłużyliśmy się wersją DATES 4010 ^{67 .}

Przetwarzanie danych do analiz genomiki medycznej z próbkami WGS

Do celów medycznych zastosowaliśmy procedurę dopasowania i genotypowania podobną do opisanej powyżej, wykorzystując referencyjny genom GRCh38.

Adnotacja wariantowa

Statystyki wariantów dotyczące liczby SNP i indelów obliczono za pomocą bcftools ³⁸ dla pozycji wariantów w pliku vcf z 36 próbkami ormiańskimi. Loci wariantów zdefiniowano jako te z allelami niereferencyjnymi. Określiliśmy stan patogenny mutacji MEFV , korzystając z informacji o allelach pomocniczych z raportu dbSNP ( https://www.ncbi.nlm.nih.gov/snp/ ).

Vcftomaf ⁶⁸ został użyty do uruchomienia adnotacji przez VEP ⁶⁹ i konwersji plików vcf do MAF. Warianty z adnotacjami „Frame_Shift_Del,” „Frame_Shift_Ins,” „In_Frame_Del,” „In_Frame_Ins,” „Nonsense_Mutation,” „Nonstop_Mutations,” lub „Splice_Site” zostały zgrupowane jako mutacje utraty funkcji (LoF). Do wizualizacji wariantów genu użyto Maftools. ⁷⁰ Obliczenia obejmujące AF odnoszą się do znormalizowanych miejsc adnotowanych przez MAF, gdzie wszystkie 36 próbek ormiańskich nie ma brakujących miejsc.

Przypisanie

Zamaskowaliśmy SNP z chipu Illumina 1M w jednym z genomów ormiańskich. Rozważano tylko dwualleliczne, niebrakujące miejsca wariantów. Aby ocenić dokładność imputacji zamaskowanego genotypu, użyliśmy dwóch paneli referencyjnych: (1) zintegrowane dane fazowe shapeit5 z fazy 3 1000 GP, ⁷¹ wywołane przeciwko montażowi GRCh38; i (2) panel referencyjny 1000 GP połączony z danymi fazowymi dla pozostałych genomów ormiańskich ( n = 35). Użyliśmy phasing_common w shapeit5 do fazowania zestawu danych ormiańskich i IMPUTE5 do imputacji. Obliczono ⁷² kwadratowe współczynniki korelacji Pearsona ( R ² ), aby ocenić dokładność imputacji między genotypami CG (0, 1, 2) a imputowanymi dawkami (0, 2).

Wyniki

Warianty statystyk dla współczesnego ormiańskiego zestawu danych

Łącznie w naszym zestawie danych obejmującym 36 współczesnych próbek ormiańskich (z których dwie zostały wcześniej opublikowane) zidentyfikowaliśmy 13 523 774 wariantów autosomalnych obejmujących 11 134 554 SNP; i 2 510 513 indeli, z których 1 180 458 pozycji było wieloallelowych. Następnie sklasyfikowaliśmy warianty według częstości alleli w połączonym zestawie danych ormiańskich. Większość wariantów była bardzo powszechna (częstotliwość alleli >0,05) ( n = 8 503 355), a tylko około jedna piąta z nich była singletonami ( n = 3 388 182) ( Rysunek 2 A). Łącznie 13 283 198 wariantów było już obecnych w dbSNP, podczas gdy 567 320 było nowych i reprezentowanych głównie przez singletony ( n = 512 915). Zgodnie z oczekiwaniami większość wariantów zidentyfikowano w intronach lub regionach międzygenowych (∼12 milionów), podczas gdy warianty LoF były rzadsze i ze znacznie większym udziałem pojedynczych lub podwójnych w porównaniu do innych wariantów ( Rysunek 2 B). Genomy zostały wzbogacone o krótkie indele i w większości powodowały zmianę bez przesunięcia ramki ( Rysunek S1 ). Podobnie, mniejsze indele były liczniejsze w regionach kodujących białka. Łącznie 12 172 i 10 442 warianty zostały rozpoznane jako uszkadzające lub potencjalnie uszkadzające z różnym poziomem pewności przez SIFT i PolyPhen (z 7472 nakładającymi się wariantami między dwiema adnotacjami).

Wiadomo, że populacja ormiańska jest narażona na wysokie ryzyko rodzinnej gorączki śródziemnomorskiej (FMF [MIM: 134610 ]), ⁷³ zaburzenia autozapalnego spowodowanego szerokim spektrum mutacji w genie MEFV [MIM: 608107 ] i występującego głównie u osób pochodzenia śródziemnomorskiego. Gen koduje 781-aminokwasowe białko zwane piryną, które jest ważnym modulatorem wrodzonej odporności. ⁷⁴ Co uderzające, w naszym zestawie danych stwierdzono, że prawie połowa osób (16 z 36) jest nosicielami patogennych lub prawdopodobnie patogennych wariantów genu MEFV , co stanowi znacznie wyższą częstość występowania niż 20% zgłaszane w poprzednich badaniach. ⁷³ Podkreśla to ograniczenia konwencjonalnych metod diagnostycznych, takich jak testy paskowe, które nie wydają się być czułą metodą identyfikacji patogennych lub prawdopodobnie patogennych mutacji w populacji ormiańskiej ( Rysunek S2 i Tabela S3 ). Co więcej, w jednej z naszych próbek znaleźliśmy nową mutację typu missense w genie MEFV , która według przewidywań PolyPhen (0,998) będzie szkodliwa.

Struktura populacji współczesnych Ormian

Oceniliśmy różnorodność genetyczną i podstrukturę w obrębie populacji ormiańskich. Chociaż Sasun geograficznie należy do centralnej części wyżyn ormiańskich, w większości naszych analiz traktujemy go jako odrębną grupę ( n = 5), mając na celu zbadanie jego domniemanych różnic genetycznych w stosunku do innych populacji ormiańskich. Pozostałe osobniki ormiańskie zostały zgrupowane jako populacje zachodnie ( n = 11), centralne ( n = 12) i wschodnie ( n = 6) wyżyn ormiańskich, biorąc pod uwagę ich historyczne, geopolityczne, kulturowe i językowe tło ( rysunek 1 ). Ogólnie rzecz biorąc, nie znaleźliśmy wyraźnego podziału między grupami ormiańskimi ( rysunki S3 i S4 A–S4C). Analiza współdzielenia alleli wykazała wysoki poziom podobieństwa genetycznego między wszystkimi grupami, ze szczególnie silnymi powiązaniami genetycznymi między wschodnimi i centralnymi populacjami ormiańskimi dla binów MAF (Sasun nie jest uwzględniony w analizie ze względu na małą liczebność próby). Co godne uwagi, połączona kohorta ormiańska wykazała znaczny stopień pokrewieństwa genetycznego z sąsiednimi populacjami ( rysunki S4 D–S4F). Podczas gdy wzór w PCA ( rysunek S3 A) można w większości wyjaśnić położeniem geograficznym populacji, z wyjątkiem kilku zachodnich osobników ormiańskich, ADMIXTURE dla próbek ormiańskich wskazał na subtelną odrębność w komponentach przodków Sasun ( rysunek S3 B), co może wynikać z domieszki lub podwyższonego tempa dryfu w populacji. Analiza ADMIXTURE z innymi współczesnymi populacjami wykazała bliskie pokrewieństwo między wszystkimi grupami ormiańskimi a Asyryjczykami ( rysunek S5 ). Gdy przeprowadziliśmy ponownie ADMIXTURE tylko dla kilku populacji Bliskiego Wschodu, wywnioskowaliśmy, że Sasun mają odrębny komponent przodków w porównaniu z większością osobników z innych populacji ormiańskich i Asyryjczyków przy K ≥ 3 ( rysunek S6 ). Mając na uwadze, że wyniki projektu ADMIXTURE należy interpretować ostrożnie w przypadku populacji, w których niedawno wystąpiło wąskie gardło, ⁷⁵ zastosowaliśmy dodatkowe metody, umożliwiając tym samym solidniejszą analizę historii populacji i demografii regionu.

Porównanie par F _ST między populacjami ujawniło bliskie podobieństwa genetyczne między Ormianami a ich sąsiadującymi populacjami ( rysunki 3 B , S7 i S8 ), w tym Asyryjczykami, chociaż te zależności były stosunkowo mniej wyraźne w przypadku populacji Sasun. Wyniki te zostały dodatkowo potwierdzone podczas badania wzorców dzielenia się haplotypami grup ormiańskich za pomocą CHROMOPAINTER ( rysunek S9 ) i dalszej wizualizacji w formie hierarchicznego drzewa klastrowania za pomocą fineSTRUCTURE ( rysunek S10 ). Chociaż Sasunowie znajdowali się w siostrzanej gałęzi, wszystkie grupy ormiańskie grupowały się blisko siebie, co sugeruje, że nie ma między nimi istotnych różnic genetycznych. Jednocześnie zaobserwowaliśmy garstkę osób Asyryjskich, Tureckich i Syryjskich w klastrze ormiańskim, co raczej sugeruje pewną podstrukturę genetyczną w obrębie tych populacji i/lub poziom domieszki z Ormianami. Nasza analiza PCA oparta na dzieleniu się haplotypami ( Rysunek 3 A) konsekwentnie wykazywała grupowanie się Ormian z sąsiednimi populacjami z Kaukazu, Anatolii, Iranu i Asyrii. Ponadto wyniki grupowania populacji Ormian potwierdzają nasz podział na grupy regionalne.

Aby formalnie sprawdzić, czy Sasunowie otrzymali dodatkowy przepływ genów z Asyrii w porównaniu z innymi grupami ormiańskimi, przeprowadziliśmy D-statystykę w formie D(Sasun, other_modern_Armenian; Assyrian, Mbuti). Nasze wyniki wykazały, że Sasunowie utworzyli klad z innymi populacjami ormiańskimi, który nie został zerwany przez Asyryjczyków ( Tabela S4 ). Na podstawie tych analiz wnioskujemy, że wszyscy współcześni Ormianie są stosunkowo jednorodni, jednocześnie wykazując duże podobieństwo do sąsiednich populacji, i nie ma dowodów na to, że Sasunowie mają niezwykle wysoki wkład ze strony Asyryjczyków.

Historia demograficzna i skala czasowa rozbieżności

Analizy MSMC wykazały dowody na zmniejszenie liczebności populacji po 10 000 lat temu w przypadku Sasun. Odkrycie to może leżeć u podstaw ich odrębnych cech genetycznych zaobserwowanych w poprzednich analizach i sugeruje zdarzenie wąskiego gardła i/lub brak zewnętrznego przepływu genów (co wyolbrzymiałoby liczebność populacji) w Sasun w porównaniu z resztą populacji ormiańskich. Co znamienne, liczebność populacji była nawet mniejsza niż u Sardyńczyków (jak przedstawiono na rysunku 3 C), u których wcześniej wykazano znaczny spadek liczebności populacji w podobnym okresie. ³⁵ Pozostałe grupy ormiańskie wykazywały efektywne liczebności populacji typowe dla większości Europejczyków z kontynentu, tj. z silnym wąskim gardłem między 50 000 a 60 000 lat temu, związanym z ekspansją poza Afrykę i późniejszym okresem szybkiego wzrostu populacji. Niemniej jednak zauważyliśmy, że większość krzywych szybkości koalescencji krzyżowej była dość niestabilna, co mogło wynikać z bardzo niedawnego momentu rozbieżności i, co za tym idzie, niewystarczającej rozdzielczości analizy MSMC ( rysunek S11 ).Przeanalizowaliśmy dalej średni wskaźnik zaniku LD u Ormian, co wskazuje na dryf genetyczny i historię populacji. Odkryliśmy, że Ormianie wykazują większe LD niż populacje afrykańskie, bliskowschodnie, południowoazjatyckie, kaukaskie i zachodnio-południowoeuropejskie oraz niższe LD niż populacje wschodnioazjatyckie i wschodnio-środkowoeuropejskie ( Rysunek 3 D). Sprawdziliśmy również status inbredu populacji, mierząc średnią całkowitą liczbę ROH ( Rysunek S12 ). Ormianie wykazali stosunkowo niską liczbę ROH w kategoriach krótkiej długości ROH w porównaniu z innymi populacjami. Wykazali jednak stosunkowo wysoką liczbę długich ROH, co odzwierciedla pewien poziom małżeństw pokrewieństwa w ogólnej populacji Ormian. Kiedy przeprowadziliśmy osobną analizę dla grup Ormian ( Rysunek S13 ), odkryliśmy, że najwyższe wskazanie pokrewieństwa zaobserwowano w zachodniej populacji Ormian. Przeanalizowaliśmy również dzielenie się IBD w obrębie populacji i nie znaleźliśmy dowodów na długie dzielenie się IBD między osobnikami, co sugeruje brak zarówno bliskich, jak i dalekich krewnych w populacjach ( Rysunek S14 ). Na podstawie wzorców dzielenia się IBD, przetestowaliśmy następnie scenariusze demograficzne w ciągu ostatnich 100 pokoleń, co jest uważane za bardziej wrażliwą metodę dla ostatnich okresów czasu niż MSMC. Chociaż istnieje niewiele sygnałów dla zmian populacji w ostatniej skali czasu, na podstawie wnioskowanego przedziału ufności możemy wnioskować, że populacja Sasun miała najniższą efektywną wielkość populacji w porównaniu z innymi grupami, co jest zgodne z naszymi poprzednimi wynikami ( Rysunek S15 ).

Dystrybucja haplogrup mitochondrialnych i chromosomu Y

Analiza spektrum haplogrup chromosomu Y i mtDNA u Ormian wykazała przewagę linii specyficznych dla regionu ( rysunki S16 i S17 ; tabela S1 ). W szczególności najczęstszymi haplogrupami chromosomu Y były R1b (23%), J2a (26%) i J1a (16%). W naszym zestawie danych wszyscy Ormianie z haplogrupą R1b należą do linii R-Z2103 związanej z Jamną. ⁷ Co ciekawe, największą różnorodność genetyczną zaobserwowano na wyżynach ormiańskich. ²⁴ Haplogrupy J2a i J1a są uważane za bliskowschodnie ze względu na swoje pochodzenie, ale mają również głębokie korzenie na Kaukazie, ponieważ znaleziono je w próbkach paleolitycznych z Gruzji. ⁷⁶ Pula genów matrylinearnych Ormian jest reprezentowana głównie przez haplogrupy H (28%), J (17%), U (14%) i N (11%). Współczesny skład haplogrupy mtDNA był typowy dla starożytnych osobników z wyżyn Armenii, z wyjątkiem tej ostatniej linii, która nie występowała w próbkach od czasów neolitu do średniowiecza. ¹⁴ Ogólnie rzecz biorąc, nasze obserwacje patrylinearnych i matrylinearnych puli genetycznych Ormian były zgodne z poprzednimi wynikami. ¹⁴^,²⁴^,²⁵^,²⁶

Ormianie w relacji do innych współczesnych i starożytnych populacji: testowanie teorii bałkańskiej

W naszym badaniu ograniczyliśmy nasz zbiór danych starożytnych próbek z zachodniej i centralnej części wyżyn ormiańskich do stanowisk zlokalizowanych w granicach gór ( Rysunek 1 i Tabela S2 ), które naturalnie stanowiły barierę geograficzną dla starożytnej migracji ludności. ⁷⁷ Aby ocenić powinowactwa genetyczne współczesnych Ormian do współczesnych i starożytnych osób z Bałkanów, najpierw przeprowadziliśmy analizę PCA, projektując starożytne próbki z regionu na pierwsze dwa główne komponenty wywnioskowane ze współczesnych populacji Europy, Bliskiego Wschodu i Kaukazu ( Rysunek 4 ). Zaobserwowaliśmy, że klaster współczesnych Ormian mieści się pomiędzy zmiennością genetyczną współczesnego Kaukazu i Bliskiego Wschodu, co jest zgodne z ich położeniem geograficznym. Porównując ze starożytnymi próbkami z wyżyn ormiańskich, zauważyliśmy, że wszystkie współczesne grupy Ormian częściowo pokrywają się ze starożytnymi mieszkańcami wschodniej części wyżyn, co sugeruje pewien stopień regionalnej ciągłości genetycznej od neolitu (najwcześniejsze dostępne próbki dla tego regionu). Podczas gdy starożytne próbki z centralnego regionu wyżyn ormiańskich (obecnie opublikowanych jest ich tylko kilka) znajdują się na skraju klastra ormiańskiego, większość starożytnych próbek z jego zachodnich części znajduje się dalej od jego rdzenia. Biorąc pod uwagę, że najnowsze starożytne okazy z zachodnich wyżyn ormiańskich należą do wczesnej epoki brązu (zestaw danych obejmujący ∼3950–2300 p.n.e.), wynik ten uzupełnia zapisy historyczne dotyczące późniejszego zasiedlenia tego regionu przez Ormian. ⁷⁸ Co godne uwagi, grupowanie współczesnych zachodnich Ormian bliżej zarówno współczesnych, jak i starożytnych grup z wyżyn ormiańskich w środkowej części kraju pokrywa się z dowodami historycznymi dotyczącymi ruchów ludności i przesiedleń Ormian z przeważnie centralnych na zachodnie terytoria wyżyn w okresie Cesarstwa Bizantyjskiego. ⁷⁹ W ostrym kontraście, zarówno współczesne, jak i starożytne próbki z Bałkanów wydają się znacznie oddalone od klastra ormiańskiego i są przyciągane głównie w stronę innych populacji europejskich. Następnie przeprowadziliśmy analizę ADMIXTURE z porównawczym zestawem danych współczesnych i starożytnych populacji ( Rysunek S18 ). Zgodnie z poprzednimi analizami, ⁷zarówno współczesne, jak i starożytne próbki z gór ormiańskich wykazują znaczną proporcję przodków CHG. Jednakże, podczas gdy współcześni Ormianie wykazują stosunkowo jednolity wzór przodków w obrębie grup, starożytne próbki z gór wykazują większy stopień regionalnej heterogeniczności w przeszłości. W szczególności, istnieje wyraźny wzrost przodków podobnych do neolityczno-anatolijskich w próbkach z zachodnich gór ormiańskich (od K > 5). Przy wyższych wartościach K, występują również różnice w włączaniu przodków EHG do starożytnych próbek z gór, co jest zgodne z poprzednimi obserwacjami. ⁷ Wszystkie starożytne próbki zachodnie i neolityczne wschodnie wykazują względny brak tego pochodzenia. Po jego pojawieniu się w okresie chalkolitu, wschodnie osoby z wczesnej epoki brązu wykazują widoczny spadek przodków EHG, po którym następuje odrodzenie w późnej epoce brązu. Ponadto, wyniki K = 7 sugerują podwyższone starożytne pochodzenie podobne do lewantyńskiego zarówno w zachodnich, jak i centralnych starożytnych populacjach gór ormiańskich. Kontrastuje to z wynikami wschodnich grup starożytnych wyżyn i jest zgodne z wynikami naszej analizy PCA.

Wzór zaobserwowany w poprzednich analizach skłonił nas do przeprowadzenia statystyki D w formie D(Modern_Ormenians, Ancient_Armenian_highlands_eastern; Ancient_Armenian_highlands_western/central, Mbuti), aby zbadać dalej, czy wszystkie współczesne grupy ormiańskie tworzą klad ze starożytnymi próbkami ze wschodniej części wyżyn ormiańskich, w porównaniu do starożytnych przedstawicieli z jej centralnych i zachodnich regionów ( Tabela S5 ). Aby uwzględnić prawdopodobne artefaktualne przyciąganie wśród współczesnych populacji w porównaniu do starożytnych próbek dotkniętych uszkodzeniami pośmiertnymi lub między dwiema starożytnymi próbkami w porównaniu do współczesnych populacji, we wszystkich naszych analizach statystyki D obejmujących starożytne osoby stosowaliśmy wyłącznie transwersje. Ponadto, w celu zminimalizowania potencjalnego wpływu błędów technicznych, które mogłyby wyniknąć z połączenia danych dotyczących przechwytywania i strzelb, nasze analizy ograniczyliśmy do jednego typu technologii, chyba że takie ograniczenie było niewykonalne. Nie wykryliśmy żadnych przypadków, w których lokalni przedstawiciele starożytności zaburzyli klad pomiędzy jakąkolwiek współczesną populacją ormiańską a starożytnymi próbkami z wyżyn wschodniej Armenii (w niektórych przypadkach wykryliśmy silniejszy sygnał przyciągania pomiędzy starożytnymi próbkami).

Aby lepiej zrozumieć historię populacji zachodnich wyżyn ormiańskich, przeprowadziliśmy statystyki f3 grup zewnętrznych i odkryliśmy, że mieszkańcy regionu z epoki chalkolitu i brązu mają więcej wspólnego z próbkami z epoki neolitu i brązu z zachodniej Anatolii, a także z populacjami z epoki neolitu i chalkolitu z Grecji i Bułgarii ( Rysunek S19 ). Aby potwierdzić tę obserwację i sprawdzić, czy jakiekolwiek współczesne populacje przełamują klad między starożytnymi próbkami z zachodniej/centralnej i wschodniej części wyżyn ormiańskich, obliczyliśmy statystyki D w formie D(Ancient_Armenian_highlands_western/central, Ancient_Armenian_highlands_eastern; X_Modern, Mbuti). Wykryliśmy sygnał przepływu genów do starożytnych populacji zachodnich wyżyn ormiańskich ze źródeł podobnych do sardyńskich i bliskowschodnich ( Tabela S6 ). Ten sygnał jest już wykrywalny w regionie w trakcie/po chalkolicie. Wśród współczesnych populacji w Europie, Sardyńczycy mają największe powinowactwo do wczesnych europejskich rolników i często działają jako pełnomocnik neolitycznego pochodzenia w analizach genetycznych populacji. ⁴¹^,⁴⁶ Jednocześnie wykazano, że współczesne populacje Lewantu mają znaczny poziom pochodzenia z epoki brązu Lewantu, który z kolei ma przodków z lokalnych populacji neolitycznych. ⁸⁰ Następnie przeprowadziliśmy podobny test statystyki D dla grupy centralnych wyżyn Armenii ( Tabela S6 ) i znaleźliśmy tylko pojedynczy przypadek znacząco złamanego kladu przez źródło podobne do bliskowschodniego, gdy w analizach wykorzystano próbkę urartyjską z regionu i populację wczesnej epoki żelaza ze wschodniej części wyżyn. Aby ustalić, czy małe rozmiary próbek w połączeniu z heterogenicznością populacji komplikują wykrywanie sygnału przepływu genów, przeprowadziliśmy serię testów statystyki D przy użyciu starożytnych populacji z zachodnich wyżyn Armenii i tych, w których znaczący klad wykryto w poprzednich analizach ( Rysunki S20–S23 ). Poprzez losowe pobieranie podprób tych populacji dla każdego przebiegu odkryliśmy, że sygnał staje się wykrywalny ( Z > 3) w zdecydowanej większości przebiegów, gdy obie testowane starożytne populacje mają wielkość próby wynoszącą siedem (zaczyna się poprawiać od wielkości próby wynoszącej pięć, gdy sygnał jest silny). Dlatego dochodzimy do wniosku, że dodatkowe próbki są konieczne dla zbioru danych starożytnych centralnych wyżyn Armenii, aby zapewnić wiarygodne wyniki. Zastosowaliśmy te same kryteria wielkości próby i poziom ostrożności do wszystkich naszych testów statystyki D w naszym badaniu obejmującym starożytne próbki.

Biorąc pod uwagę powyższe wyniki, w poniższych analizach wykorzystaliśmy populacje wschodnich wyżyn ormiańskich jako jedynych starożytnych przedstawicieli regionu. Aby dokładniej zbadać kwestię pochodzenia genetycznego Ormian, użyliśmy statystyk D w formie D(Modern_Ormenians, Ancient_Armenian_highlands_eastern; X_Balkan, Mbuti), aby formalnie sprawdzić, czy współcześni Ormianie otrzymali jakiekolwiek dane genetyczne ze starożytnych i współczesnych próbek z Bałkanów ( Tabela S7 ). Nie zaobserwowaliśmy żadnych istotnie dodatnich wartości statystyk D (których można się spodziewać na podstawie teorii bałkańskiej), co podważa obecność przodków bałkańskich u współczesnych Ormian. Ponadto odkryliśmy, że w większości naszych porównań starożytne i współczesne próbki z wyżyn ormiańskich tworzą klad (| Z | < 3) z wykluczeniem starożytnych i współczesnych próbek z Bałkanów. Jednocześnie wykryliśmy sygnał wskazujący, że przodkowie współczesnych Ormian otrzymali napływ genetyczny z zewnętrznego źródła, prawdopodobnie po późnej epoce brązu/żelaza ( Z < −3) (dostrzegamy małą wielkość próby dla próbek ze środkowej epoki brązu). Jednakże zauważyliśmy zwiększone współdzielenie alleli pochodnych między współczesnymi Ormianami i Grekami ( Z > 3), co może być konsekwencją wspólnego przepływu genów między populacjami, a to wymaga dalszych badań. Aby porównać wyniki, które uzyskaliśmy dla populacji wyżyn ormiańskich, przeprowadziliśmy podobny zestaw testów statystyki D, ale tym razem zbadaliśmy klad obejmujący współczesne i starożytne populacje greckie w formie D(starożytna_grecka, współczesna_grecka; X_starożytna_populacja, Mbuti) ( Tabela S8 ). Wyniki wskazały na pewien poziom nieciągłości genetycznej w regionie po późnej epoce brązu, ujawniając związek genetyczny między próbkami z epoki mykeńskiej, minojskiej i neolitycznej Grecji a próbkami z Anatolii, Armenii i Bliskiego Wschodu ( Tabela S8 ).

Ujmując rzecz całościowo, nasze wyniki potwierdzają brak istotnego wkładu genetycznego z Bałkanów do starożytnych i współczesnych populacji Wyżyny Armeńskiej.

Wgląd w ciągłość regionalną

Następnie zastosowaliśmy podejście maksymalnego prawdopodobieństwa ⁶⁴ , aby przetestować ciągłość starożytnych i współczesnych populacji wyżyn ormiańskich. Model ten zakłada scenariusz, w którym zmiany częstotliwości alleli od wspólnego przodka w czasie są wyjaśniane wyłącznie przez dryf. Test sugeruje bardzo niedawny czas dryfu we wszystkich współczesnych populacjach ormiańskich od wspólnego przodka z próbkami starożytnymi, co potwierdza bliskie pokrewieństwo starożytnych i współczesnych mieszkańców tego regionu. Jednak model odrzuca hipotezę ciągłości regionalnej, ponieważ starożytne populacje wydają się mieć znacznie dłuższe czasy dryfu ( Tabela S9 ). Wynik ten jest zgodny ze scenariuszem domieszki do współczesnych Ormian z populacji zewnętrznej, która rozeszła się wcześniej niż czas podziału między współczesnymi i starożytnymi mieszkańcami regionu. W konsekwencji domieszka ta zwiększyłaby heterozygotyczność współczesnych Ormian, a tym samym wyolbrzymiłaby czas dryfu w starożytnych populacjach wyżyn ormiańskich (ponieważ zgodnie z modelem nie jest dozwolony żaden napływ genetyczny), co ostatecznie doprowadziłoby do odrzucenia ciągłości regionalnej. Jesteśmy również świadomi, że ta metoda jest bardzo wrażliwa, nawet na niewielkie ilości domieszek, co stanowi pewne ograniczenie, biorąc pod uwagę fakt, że wszystkie współczesne populacje doświadczyły w różnych momentach swojej historii pewnego stopnia domieszek.

Określanie źródła, zakresu i czasu przepływu genów

Następnie zbadaliśmy odpowiadające sobie sygnatury przepływu genów do wyżyn ormiańskich, używając statystyk D w formie D(Modern_Ormenians, Ancient_Armenian_highlands_eastern; X_ancient_population, Mbuti). Odkryliśmy, że kilka starożytnych próbek z Bliskiego Wschodu, Anatolii i stepów euroazjatyckich jest ściślej związanych ze starożytnymi próbkami z wyżyn ormiańskich niż te ostatnie ze współczesnymi Ormianami ( Z < −3), co potwierdza nasze poprzednie wyniki ( Tabela S10 ). Zgodnie z wynikami statystyk D dla starożytnych próbek bałkańskich, najwyższe wartości ujemne wykryto w przypadku próbek z późnej epoki brązu/żelaza z wyżyn ormiańskich. Warto wspomnieć, że populacja Sasun wykazuje podobne wyniki w statystykach D, co potwierdza ustalenie, że populacja ma podobne pochodzenie do innych grup ormiańskich ( Tabela S11 ). Ze względu na powszechność przechwyconych starożytnych próbek i nasze zaangażowanie w utrzymanie spójnego kryterium technologii sekwencjonowania dla włączenia próbki do naszych testów statystyki D, zdecydowaliśmy się nie uwzględniać próbek z wyżyn ormiańskich z epoki żelaza do średniowiecza oraz późnej epoki brązu, które zostały zsekwencjonowane przy użyciu metody shotgun. Jednak po włączeniu tych próbek do oddzielnych statystyk D w formie D(Modern_Ormenians, Late_Bronze_Age_Armenian_highlands_eastern; ancient_Lebanon, Mbuti) przy użyciu wszystkich SNP, próbki z epoki żelaza, starożytności i okresu rzymskiego w Libanie wyróżniały się jako jedyne porównawcze starożytne próbki wykazujące dodatnie wartości Z , co sugeruje pokrewieństwo ze współczesnymi Ormianami ( Tabela S12 ). Gdy ograniczyliśmy analizę tylko do transwersji, musieliśmy wykluczyć cztery z pięciu populacji wyżyn ormiańskich z późnej epoki brązu, aby spełnić próg SNP wynoszący 35 000. W rezultacie analiza z transwersjami nie przyniosła istotnych wyników, prawdopodobnie z powodu mniejszej liczebności próby i zmniejszonej liczby SNP.

Aby sprawdzić, czy jakiekolwiek współczesne populacje przerywają klad między współczesnymi Ormianami a starożytnymi próbkami z tego regionu, obliczyliśmy statystykę D w postaci D(Modern_Ormenians, Ancient_Armenian_highlands_eastern; X_modern_population, Mbuti). Znaleźliśmy sygnał przepływu genów do współczesnych Ormian ze źródeł podobnych do sardyńskich i bliskowschodnich po późnej epoce brązu/żelaza (choć należy zauważyć, że wielkość naszej próby dla próbek ze środkowej epoki brązu jest obecnie ograniczona) ( Tabela S13 ). Warto zauważyć, że podczas gdy wszystkie grupy Ormian wykazują podobną tendencję, centralna grupa Ormian miała największy wkład w ten sygnał, co może wynikać ze stosunkowo większej wielkości próby tej populacji. Asyryjczycy również przerwali klad między populacjami późnej epoki brązu/żelaza ze wschodnich części wyżyn a współczesnymi wschodnimi i środkowymi Ormianami, wykazując jednocześnie podobną tendencję dla Sasun i zachodnich Ormian. Potwierdza to nasze wcześniejsze wnioski dotyczące braku jakichkolwiek dodatkowych przodków asyryjskich w Sasun i wspiera sugestię, że wyniki poprzedniego testu D-statystyki z udziałem współczesnych Greków ( Tabela S7 ) wskazują na napływ genetyczny do współczesnych Ormian, który jest wspólny dla współczesnych Greków. Podsumowując, nasze wyniki sugerują przepływ genów ze źródła podobnego do neolityczno-lewantyńskiego rolnika do wschodnich części wyżyn ormiańskich, prawdopodobnie w trakcie/po zakończeniu epoki brązu, co odróżniało współczesnych Ormian od ich regionalnych przodków. Wynik ten jest zgodny z ustaleniami z wcześniejszego badania, które wykazało wzrost przodków z Lewantu z okresu przedceramicznego neolitu w Armenii po późnej epoce brązu (∼3200 lat temu). ⁷

Co ciekawe, zaobserwowaliśmy powinowactwo między próbkami ormiańskimi z późnej epoki brązu a pewnymi współczesnymi populacjami północno- i wschodnioeuropejskimi. Przypuszczamy, że może to być spowodowane późniejszym przybyciem przodków związanych ze stepem do tego regionu ( Tabela S13 ). Wykryliśmy również, że testy statystyki D z próbkami z wczesnej epoki brązu z wyżyn ormiańskich prawie osiągnęły istotność ( Z = 3). Podczas losowego pobierania próbek osobników z późnej epoki brązu dla mniejszej populacji, potwierdziliśmy, że ograniczenia wielkości próby i heterogeniczność populacji wpływają na wyniki statystyki D ( Rysunek S24 ), co podnosi ostrożność w interpretacji wyników dla grup o ograniczonej liczbie osobników.

Następnie przeprowadziliśmy porównanie parami populacji starożytnych gór ormiańskich w celu ujawnienia czasu napływu genetycznego podobnego do neolitu-lewantyńskiego-rolników ( Tabela S14 ). Oprócz tego zidentyfikowaliśmy wpływ przepływu genów związanego ze stepem jako czynnik przyczyniający się do heterogeniczności genetycznej w obrębie populacji gór ormiańskich na wschodzie na przestrzeni czasu. Zgodnie z poprzednim badaniem, ⁷ testy statystyk D ujawniły wcześniej wspomniany przepływ genów w regionie, po którym nastąpiła stopniowa redukcja pochodzenia stepowego po epoce żelaza.

Następnie podjęliśmy próbę datowania napływu genetycznego na podstawie wzorców nierównowagi sprzężeń z ALDER ( rysunek S25 ). Musieliśmy przeprowadzić test jednej populacji (współcześni Ormianie jako cel z danymi wejściowymi od Sardyńczyków), który ma ograniczoną moc, więc dodaliśmy wcześniej opublikowane dane genotypowe dotyczące 99 Ormian ¹⁵ i 24 Sardyńczyków. ⁵⁵ Udało nam się wykryć znaczący sygnał domieszki ze źródłem podobnym do sardyńskiego u Ormian, z szacowanym wkładem przodków wynoszącym 41,6 ± 3,6. Czas domieszki uzyskany z ALDER sugeruje stosunkowo stare wydarzenie (najlepszy sygnał odpowiada 218,50 ± 16,39 pokoleniu temu lub około 6100 lat), co jest bliższe końcowi epoki chalkolitu/wczesnego brązu w Armenii.

Podczas gdy ALDER okazał się być dość solidny w odniesieniu do dokładnego źródła domieszki, rozbieżność w datowaniu może wynikać z faktu, że Sardyńczycy byli jedynie odległym odpowiednikiem populacji, która zmieszała się z Ormianami. Następnie użyliśmy DATES, co pozwala na datowanie zdarzeń domieszki poprzez włączenie starożytnego DNA ( Rysunek S26 ). Analiza pokazuje, że próbki z wyżyn Libanu z epoki żelaza i z gór Ormian z późnej epoki brązu były zmieszane przez 55 pokoleń (wartości błędu standardowego w zakresie od 57,23 do 35,95), co mniej więcej odpowiada początkowi późnej epoki brązu w Armenii.

Wyraźnie modelowaliśmy pochodzenie Ormian, dopasowując oczekiwane wartości statystyki f do tych zaobserwowanych przy użyciu qpGraph ( rysunki 5 , S27 i S28 ). Model pasujący do danych sugeruje, że oprócz głównego wkładu genetycznego lokalnej populacji późnej epoki brązu, współcześni Ormianie otrzymali przepływ genów z populacji spokrewnionej z Lewantem z epoki żelaza. Co ciekawe, ilość wkładu genetycznego z tej drugiej grupy zmienia się, gdy weźmiemy pod uwagę ogólną populację Ormian (45%, rysunek 5 A) lub subpopulacje (28%–53%), przy czym wschodni Ormianie mają najmniejszy udział domieszek (28%, rysunek 5 B). Różnice genetyczne między grupami geograficznymi są zgodne z wynikami PCA ( rysunek S3 A), gdzie niektórzy zachodni i środkowi (w tym Sasun, który jest najbardziej oddalony) Ormianie wydawali się być dalej od centralnego klastra Ormian.

Na koniec użyliśmy qpAdm w próbie modelowania współczesnych Ormian z genetycznym wkładem populacji z wyżyn Lewantu z epoki żelaza i późnej epoki brązu w Armenii. Jednak analiza ta była wysoce niespójna i niestabilna podczas zmiany wielkości próby w populacjach lub dodawania większej liczby populacji w grupie odniesienia (pomimo że qpWave wykazał ich dobrą reprezentację). W związku z tym uzyskaliśmy wynik 0,6 i 0,4 dla genetycznego wkładu populacji z wyżyn Lewantu z epoki żelaza i późnej epoki brązu w Armenii. Biorąc pod uwagę od 3 do 4 odchyleń standardowych (błąd standardowy wynosi 0,04), proporcje te są zgodne z wcześniej wspomnianym odkryciem.

Przypisanie

Chcieliśmy ocenić dokładność imputacji, gdy zestaw genomów specyficznych dla populacji zostanie dodany do najbardziej aktualnego panelu referencyjnego, takiego jak faza 3 1000 GP, wywołana przeciwko zespołowi GRCh38. W tym celu zamaskowaliśmy wszystkie pozycje w jednym genomie ormiańskim, które nie są obecne w macierzy Illumina Human-1M, imputowaliśmy te SNP z pozostałych wariantów i porównaliśmy imputowane i znane genotypy. Imputację przeprowadzono przy użyciu dwóch paneli referencyjnych, oddzielnie: danych haplotypu 1000 GP ( n = 5248) i połączonego panelu referencyjnego, składającego się z pierwszego i pozostałych genomów ormiańskich ( n = 35). W rezultacie znaleźliśmy nieznacznie poprawione wartości dla rzadkich wariantów przy użyciu połączonego panelu, podczas gdy rozkład w innych blokach częstotliwości pozostał dość podobny ( rysunek S29 ).

Dyskusja

Przeprowadziliśmy kompleksową analizę WGS Ormian, wykorzystując pokaźny zbiór danych genomów o dużym pokryciu. Zgodnie z wcześniejszymi badaniami nad matrylinearnym składem genetycznym26 odkryliśmy, że Ormianie ^{charakteryzują} się niewielką podstrukturą wewnątrzpopulacyjną. Jedyną populacją, która subtelnie różni się od innych grup Ormian, jest Sasun, o której wcześniej informowano jako o odrębnej na podstawie analizy linii patrylinearnych.24 Wykazaliśmy, że populacja Sasun przeszła przez wyraźne wąskie gardło demograficzne, co jest główną przyczyną obserwowanych różnic genetycznych w stosunku do innych Ormian. Należy zauważyć, że wszystkie populacje Ormian ^miały duże podobieństwa genetyczne do populacji w bliskiej odległości geograficznej, w tym Asyryjczyków, a Sasun nie otrzymywali znacząco większego przepływu genów od tych ostatnich, co mogłoby wyjaśniać ich niewielką dywergencję genetyczną od innych populacji Ormian.

Opisaliśmy architekturę wariantów w genomach ormiańskich i odkryliśmy ponad 500 000 wariantów, które wcześniej nie zostały zgłoszone w bazie danych wariantów dbSNP. Jako osobne pytanie zbadaliśmy moc imputacji, gdy do panelu referencyjnego fazy 3 1000 GP dodano odniesienie specyficzne dla populacji, dostosowane do zespołu GRCh38. Biorąc pod uwagę przeważnie rzadką częstotliwość występowania wariantów w genomach, uwzględnienie stosunkowo niewielkiej liczby genomów specyficznych dla populacji obok zestawu danych 1000 GP spowodowało jedynie marginalne ulepszenia w naszej zdolności imputacji. W związku z tym, aby znacząco zwiększyć moc imputacji, wymagany jest znacznie większy zestaw danych specyficznych dla populacji.

Skupiliśmy się na rozwiązaniu długotrwałej zagadki dotyczącej genetycznych korzeni Ormian. Chociaż hipoteza bałkańska od dawna jest uważana za najbardziej prawdopodobną narrację na temat pochodzenia Ormian, nasze wyniki wykazały, że współcześni Ormianie różnią się genetycznie zarówno od starożytnej, jak i współczesnej populacji Bałkanów. Podczas gdy niedawne badanie7 ^spekuluje , że rozcieńczenie przodków EHG po epoce żelaza może sugerować przepływ genów powiązany z Bałkanami, nasze wyniki ujawniają inne źródło tego wkładu genetycznego. Jednocześnie Lazaridis i in.7 ^{potwierdzają} brak bałkańskiego komponentu genetycznego w starożytnych próbkach z Armenii.

Wręcz przeciwnie, ujawniliśmy wysoki poziom regionalnej ciągłości genetycznej we wschodnich częściach wyżyn Armenii przez ponad 6000 lat, potwierdzając analizy z poprzednich badań. ¹⁴^,¹⁵ Niedawne badanie sugeruje również podobny poziom stabilności aż do epoki brązu na Południowym Kaukazie (nie było testu na późniejsze wkłady, ponieważ w tym badaniu wykorzystano tylko aDNA). ⁶ Ten wzór stoi w kontraście do większości innych populacji zachodniej Eurazji, które przeszły przez wielokrotne duże napływy i wymiany. ⁹^,⁴¹ Względnie podobny przykład stanowią Sardyńczycy, którzy od dawna byli uważani za genetyczny izolat w regionie od neolitu, ale niedawne badania wykazały, że wyspa otrzymała liczne wkłady genetyczne po epoce brązu, ⁸¹ stanowiące 38%–44% ich przodków.

Chociaż zachodnie i centralne regiony wyżyn Armenii nie są obecnie gęsto badane pod kątem starożytnego DNA, udało nam się jednak dostrzec różnice w czasie penetracji przodków spokrewnionych z Lewantyńczykami do różnych części wyżyn. Podczas gdy odkryliśmy, że te ostatnie były już obecne w zachodnich częściach wyżyn w chalkolicie (późniejszy przepływ genów podobny do Levantine-Early-Farmers mógł wzmocnić ten sygnał), udokumentowaliśmy, że wschodnie części otrzymały go poprzez zdarzenie domieszki, które prawdopodobnie miało miejsce w pewnym momencie po wczesnej epoce brązu, zakłócając tym samym ciągłość genetyczną w regionie. Uznajemy ograniczenia wielkości próby w populacjach sprzed późnej epoki brązu z wyżyn Armenii i uznajemy, że przepływ genów mógł być stopniowym procesem, który osiągnął szczytową intensywność pod koniec późnej epoki brązu, ale prawdopodobnie rozpoczął się znacznie wcześniej (zgodnie z wynikami ALDER i DATES). Tak więc pierwsza migracja na wschodnie wyżyny ormiańskie po neolicie wprowadziła pochodzenie związane ze stepem w regionie, podczas gdy druga zwiększyła proporcję pochodzenia związanego z Lewantynami, szczególnie u mieszkańców wyżyn ormiańskich po późnej epoce brązu. Nasze wyniki dotyczące populacji źródłowej i daty dla mieszanki są mniej więcej porównywalne z badaniami genetycznymi nad Ormianami przeprowadzonymi do tej pory. Podwyższone pochodzenie podobne do neolitycznych-europejskich-rolników u Ormian zostało wcześniej wykryte na podstawie samych współczesnych genomów, ¹⁵ a szybkość przepływu genów została oszacowana na 29%. W naszym badaniu zauważyliśmy klin dla napływu genetycznego podobnego do neolitycznych-lewantyńskich-rolników w obrębie ormiańskich grup geograficznych; najbardziej odizolowaną populacją byli wschodni Ormianie (28% wkładu genetycznego związanego z epoką żelaza w Libanie, wnioskowanego przez qpGraph), co zgadza się z ich geografią i w ten sposób pokazuje wpływ gór jako barier dla wymiany genetycznej. Jednocześnie uznajemy, że w przypadku modelowania przodków i obliczeń wkładu genetycznego nie było wykonalne uniknięcie mieszania różnych technologii sekwencjonowania, co mogłoby potencjalnie wpłynąć na wyniki. Jako przestrogę należy wziąć pod uwagę, że w statystykach D powinowactwa współczesne-współczesne lub starożytne-starożytne mogą wynikać nie tylko z uszkodzeń pośmiertnych, ale również z błędu odniesienia, ⁸² którego nie można wyeliminować wyłącznie za pomocą transwersji. Dlatego w naszym badaniu zastosowaliśmy dodatkowe metody, wyciągając wnioski ze wszystkich z nich.

Nasze badanie obejmujące próbki aDNA zwiększa siłę testów domieszek, dostarczając właściwych źródeł przodków populacji. W związku z tym nie mogliśmy znaleźć dowodów na mieszanki wielu populacji w okresie 3000–2000 p.n.e. ¹⁵ Z kolei znaleźliśmy sygnał na pojedyncze zdarzenie domieszki ze źródła podobnego do Levantine-Early-Farmers, które stale występowało w trakcie/po zakończeniu późnej epoki brązu. Przyznajemy, że zdarzenie domieszki mogło mieć miejsce wcześniej, co dobrze pasowałoby do naszych szacunkowych dat (wywnioskowanych przez ALDER i DATES) oraz ostatnich badań nad historią demograficzną w sąsiednim regionie Kaukazu. ⁸³ Co ciekawe, dowody archeologiczne wskazują, że okresy środkowej i późnej epoki brązu na wyżynach ormiańskich charakteryzowały się znaczącymi transformacjami. ¹⁰ W środkowej epoce brązu pojawiły się różne kultury, dominujący koczowniczy tryb życia i aktywne relacje z Anatolią i Morzem Egejskim. Z kolei późna epoka brązu charakteryzowała się intensywnymi interakcjami kulturowymi z sąsiednimi ludami, w tym Hurytami, Hetytami i Mezopotamczykami.

Podsumowując, dochodzimy do wniosku, że w pewnym momencie po wczesnej epoce brązu nastąpił ruch na dużą skalę przez Bliski Wschód. Z genetycznego punktu widzenia ruch ten doprowadził do znacznego wkładu przodków neolitycznych w populacjach zamieszkujących ten region. W szczególności ruch ten dotarł do górzystych regionów wschodnich części wyżyn ormiańskich, co spowodowało genetyczne rozbieżności współczesnych populacji od ich regionalnych przodków. Pytania o to, skąd dokładnie i kiedy przybyli ci imigranci, a także co było przyczyną tak rozległej fali migracji, pozostają bez odpowiedzi. Konieczne są dalsze badania złożonych procesów demograficznych regionu wraz z włączeniem dodatkowych starożytnych i współczesnych danych z wyżyn ormiańskich, Anatolii i Lewantu.

Dostępność danych i kodu

Wygenerowane w tym badaniu nieprzetworzone pliki Fastq są dostępne w Europejskim Archiwum Nukleotydów pod numerem ENA: PRJEB78867. Dane genotypowe wygenerowane przez HaplotypeCaller i dane genotypowania Illumina są dostępne za pośrednictwem FigShare: https://doi.org/10.6084/m9.figshare.27277578 .

Podziękowanie

LY, A. Hovhannisyan, MA i ZK otrzymali wsparcie od Komitetu Naukowego Ministerstwa Edukacji i Nauki Armenii (projekt badawczy nr 21AG-1F025 ). A. Hovhannisyan potwierdza finansowanie przez EU MSCA-IF na mocy umowy o dotację 101063265 , ACTIVITY 5 programu ESF DoRa , Calouste Gulbenkian Foundation i Foundation for Armenian Science and Technology (FAST). A. Hovhannisyan jest wdzięczny Mait Metspalu i Richardowi Villiemsowi za pomoc i nadzór nad badaniami programu ESF DoRa na Uniwersytecie w Tartu. A. Manica, PMD i ERJ otrzymali wsparcie od ERC Consolidator grant 647797 „LocalAdaptation”. Dziękujemy Centrum Obliczeń Wysokiej Wydajności Uniwersytetu w Tartu za udostępnienie zaplecza obliczeniowego. Jesteśmy wdzięczni Hovann Simonian za wsparcie projektu mającego na celu stworzenie Genetic Atlas of Armenia. Dziękujemy Danielowi Bradleyowi i Larze Cassidy za konstruktywne dyskusje i komentarze.

Wkład autorów

A. Manica, LY i A. Hovhannisyan wymyślili i zaprojektowali badanie. Próbkowanie przeprowadzili LY, MA i ZK. Fundusze na nowoczesną generację całego genomu zostały pozyskane przez LY, a PHA Hovhannisyan przeprowadził odpowiednie analizy genetyczne populacji i medycyny pod nadzorem A. Manica. PMD, ERJ, A. Hakobyan, JGS, LS, HS, A. Margaryan, ZX, SJ i JB przyczynili się do analizy danych. A. Hovhannisyan i A. Manica zaprojektowali rysunki i napisali manuskrypt. Wszyscy autorzy przyczynili się do ostatecznej wersji manuskryptu.

Deklaracja interesów

Autorzy deklarują brak konfliktu interesów.

Informacje uzupełniające

Co to jest?

Pobierz: Pobierz plik Acrobat PDF (13MB)Dokument S1. Rysunki S1–S29 .

Pobierz: Pobierz arkusz kalkulacyjny (57KB)Tabela S1. Zbiór danych ormiańskich wykorzystany w badaniu .

Pobierz: Pobierz arkusz kalkulacyjny (603 KB)Tabela S2. Zbiór danych wykorzystany w badaniu .

Pobierz: Pobierz arkusz kalkulacyjny (106 KB)Tabela S3. Warianty genu MEFV w zbiorze danych ormiańskich .

Pobierz: Pobierz arkusz kalkulacyjny (9KB)Tabela S4. Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (18 KB)Tabela S5 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (31 KB)Tabela S6 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (17KB)Tabela S7 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (18 KB)Tabela S8 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (10 KB)Tabela S9. Test największego prawdopodobieństwa .

Pobierz: Pobierz arkusz kalkulacyjny (23 KB)Tabela S10 . Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (23 KB)Tabela S11. Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (13KB)Tabela S12. Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (144 KB)Tabela S13. Statystyki D.

Pobierz: Pobierz arkusz kalkulacyjny (63 KB)Tabela S14. Statystyki D.

Pobierz: Pobierz plik Acrobat PDF (15MB)Dokument S2. Artykuł plus informacje uzupełniające .

Odniesienia

1

D.Lang

Ormianie: Naród na wygnaniu

Routledge ( 1981 )

Google Scholar
2

P. Dolukhanov , S. Aslanyan , E. Kolpakov , E. Belyayeva

Miejsca prehistoryczne w północnej Armenii

Starożytność , 78 ( 2004 ) , artykuł 301

https://antiquity.ac.uk/projgall/dolukhanov301/

Google Scholar
3

E. Frahm , CM Carolus

Identyfikacja pochodzenia artefaktów obsydianowych na równinie Deh Luran (południowo-zachodni Iran) podkreśla powiązania społecznościowe w neolitycznym Zagrosie

Proc. Natl. Acad. Sci. USA , 119 ( 2022 ) , Artykuł e2109321119 , 10.1073/pnas.2109321119

Znajdowanie pliku PDF…Zobacz w Scopus Google Scholar
4

R. Pinhasi , B. Gasparian , G. Areshian , D. Zardaryan , A. Smith , G. Bar-Oz , T. Higham

Pierwszy bezpośredni dowód na istnienie obuwia chalkolitycznego na wyżynach Bliskiego Wschodu

PLoS One , 5 ( 2010 ) , Artykuł e10984 , 10.1371/journal.pone.0010984

Zobacz w Scopus Google Scholar
5

Y. Dong , S. Duan , Q. Xia , Z. Liang , X. Dong , K. Margaryan , M. Musayev , S. Goryslavets , G. Zdunić , PF Bert i in.

Podwójne udomowienia i pochodzenie cech w ewolucji winorośli

Nauka , 379 ( 2023 ) , str. 892 – 901 , 10.1126/science.add8655

Zobacz w Scopus Google Scholar
6

E. Skourtanioti , YS Erdal , M. Frangipane , F. Balossi Restelli , KA Yener , F. Pinnock , P. Matthiae , R. Özbal , UD Schoop , F. Guliyev i in.

Historia genomiczna Anatolii, północnego Lewantu i południowego Kaukazu od epoki neolitu do brązu

Komórka , 181 ( 2020 ) , s. 1158 – 1175.e28 , 10.1016/j.cell.2020.04.044

Wyświetl PDF Wyświetl artykuł Wyświetl w Scopus Google Scholar
7

I. Lazaridis , S. Alpaslan-Roodenberg , A. Acar , A. Açıkkol , A. Agelarakis , L. Aghikyan , U. Akyüz , D. Andreeva , G. Andrijašević , D. Antonović i in .

Genetyczna historia Łuku Południowego: Most między Azją Zachodnią a Europą

Nauka , 377 ( 2022 ) , Artykuł eabm4247 , 10.1126/science.abm4247

Zobacz u wydawcy

Zobacz w Scopus Google Scholar
8

CC Wang , S. Reinhold , A. Kalmykov , A. Wissgott , G. Brandt , C. Jeong , O. Cheronet , M. Ferry , E. Harney , D. Keating i in .

Dane dotyczące całego starożytnego genomu ludzkiego z 3000-letniego okresu na Kaukazie odpowiadają regionom ekogeograficznym

Nat. Commun. , 10 ( 2019 ) , s. 590 , 10.1038/s41467-018-08220-8

Wyświetl PDF Zobacz artykuł Google Scholar
9

W. Haak , I. Lazaridis , N. Patterson , N. Rohland , S. Mallick , B. Llamas , G. Brandt , S. Nordenfelt , E. Harney , K. Stewardson i in .

Masowa migracja ze stepów była źródłem języków indoeuropejskich w Europie

Natura , 522 ( 2015 ) , str. 207 – 211 , 10.1038/nature14317

Znajdowanie pliku PDF…Zobacz w Scopus Google Scholar
10

A. Bobokhyan , R. Kunze , K. Meliksetian , E. Pernichka

Społeczeństwo i metal w epoce brązu w Armenii

E. Rova , M. Tonussi (red.) , Na północnej granicy archeologii bliskowschodniej: najnowsze badania nad Kaukazem i Anatolią w epoce brązu. Prace Międzynarodowego Humboldt-Kolleg Venice , Brepols ( 2017 ) , s. 501 – 525

Google Scholar
11

P. Heggarty , C. Anderson , M. Scarborough , B. King , R. Bouckaert , L. Jocz , MJ Kümmel , T. Jügel , B. Irslinger , R. Pooth i in .

Drzewa językowe z wybranymi przodkami wspierają hybrydowy model pochodzenia języków indoeuropejskich

Nauka , 381 ( 2023 ) , Artykuł eabg0818 , 10.1126/science.abg0818

Zobacz u wydawcy

Zobacz w Scopus Google Scholar
12

RG Kent

Staroperski: Gramatyka. Teksty. Leksykon , 33 , American Oriental Society ( 1953 )

Google Scholar
13

GG Cameron

Staroperski tekst inskrypcji Bisitun

J. Cuneif. Stud. , 5 ( 1951 ) , s. 47 – 54

Widok Crossref w Scopus Google Scholar
14

A. Margaryan , M. Derenko , H. Hovhannisyan , B. Malyarchuk , R. Heller , Z. Khachatryan , P. Avetisyan , R. Badalyan , A. Bobokhyan , V. Melikyan i in.

Osiem tysięcy lat matrylinearnej ciągłości genetycznej na południowym Kaukazie

Aktualny Biol. , 27 ( 2017 ) , s. 2023 – 2028.e7 , 10.1016/j.cub.2017.05.087

Wyświetl PDF Wyświetl artykuł Wyświetl w Scopus Google Scholar
15

M. Haber , M. Mezzavilla , Y. Xue , D. Comas , P. Gasparini , P. Zalloua , C. Tyler-Smith

Dowody genetyczne na pochodzenie Ormian z epoki brązu, mieszanie się wielu populacji

Eur. J. Hum. Genet. , 24 ( 2016 ) , s. 931 – 936 , 10.1038/ejhg.2015.206

Zobacz w Scopus Google Scholar
16

G. Hellenthal , GBJ Busby , G. Band , JF Wilson , C. Capelli , D. Falush , S. Myers

Atlas genetyczny historii domieszek ludzkich

Nauka , 343 ( 2014 ) , s. 747 – 751 , 10.1126/science.1243518

Zobacz w Scopus Google Scholar
17

Herodot, Dzieje

Z tłumaczeniem na język angielski autorstwa Godleya, AD

Wydawnictwo Uniwersytetu Harvarda ( 1920 )

Google Scholar
18

M. Diakonow

Prehistoria narodu ormiańskiego (Caravan Books, Delmar, NY)

( 1984 )

Google Scholar
19

M. Chorenaci

Historia Ormian

Wydawnictwo Uniwersytetu Harvarda ( 1978 )

Google Scholar
20

A.E. Redgate

Ormianie

Oksford: Blackwell ( 2000 )

Google Scholar
21

G. Jahukian

Hay barbaragitutyan neratsutyun (Wprowadzenie do dialektologii ormiańskiej) (Akademia Nauk, Erywań)

( 1972 )

Google Scholar
22

S. Haroutyunian

Ormiańska tradycja epicka i kurdyjski folklor

Iran Cauc. , 1 ( 1997 ) , s. 85 – 92

Zobacz w Scopus Google Scholar
23
Biblia, 2 Królów 19:37.

Google Scholar
24

A. Hovhannisyan , Z. Khachatryan , M. Haber , P. Hrechdakian , T. Karafet , P. Zalloua , L. Yepiskoposyan

Różne fale i kierunki migracji neolitycznych na wyżynach Armenii

Zbadaj Genet , 5 ( 2014 ) , s. 1 – 11 , 10.1186/s13323-014-0015-6

Google Scholar
25

KJ Herrera , RK Lowery , L. Hadden , S. Calderon , C. Chiou , L. Yepiskoposyan , M. Regueiro , PA Underhill , RJ Herrera

Neolityczne sygnały patrylinearne wskazują, że płaskowyż ormiański został ponownie zasiedlony przez rolników

Eur. J. Hum. Genet. , 20 ( 2012 ) , s. 313 – 320 , 10.1038/ejhg.2011.192

Zobacz w Scopus Google Scholar
26

M. Derenko , G. Denisova , B. Malyarchuk , A. Hovhannisyan , Z. Khachatryan , P. Hrechdakian , A. Litvinov , L. Yepiskoposyan

Wgląd w strukturę genetyczną matrilinearną, różnicowanie i pochodzenie Ormian w oparciu o kompletne dane mitogenomowe

Mol. Geneta. Genom. , 294 ( 2019 ) , s. 1547 – 1559 , 10.1007/s00438-019-01596-2

Zobacz w Scopus Google Scholar
27

S. Mallick , H. Li , M. Lipson , I. Mathieson , M. Gymrek , F. Racimo , M. Zhao , N. Chennagiri , S. Nordenfelt , A. Tandon i in .

Projekt różnorodności genomu Simonsa: 300 genomów ze 142 różnych populacji

Natura , 538 ( 2016 ) , str. 201 – 206 , 10.1038/nature18964

Zobacz w Scopus Google Scholar
28

L. Pagani , DJ Lawson , E. Jagoda , A. Mörseburg , A. Eriksson , M. Mitt , F. Clemente , G. Hudjashov , M. DeGiorgio , L. Saag i in.

Analizy genomiczne dostarczają informacji o wydarzeniach migracyjnych podczas zaludniania Eurazji

Natura , 538 ( 2016 ) , str. 238 – 242 , 10.1038/nature19792

Zobacz w Scopus Google Scholar
29

I. Lazaridis , D. Nadel , G. Rollefson , DC Merrett , N. Rohland , S. Mallick , D. Fernandes , M. Novak , B. Gamarra , K. Sirak i in .

Wgląd w genomikę pochodzenia rolnictwa na starożytnym Bliskim Wschodzie

Natura , 536 ( 2016 ) , str. 419 – 424 , 10.1038/nature19310

Zobacz w Scopus Google Scholar
30

ME Allentoft , M. Sikora , K.-G. Sjögren , S. Rasmussen , M. Rasmussen , J. Stenderup , PB Damgaard , H. Schroeder , T. Ahlström , L. Vinner i in.

Genomika populacji epoki brązu w Eurazji

Natura , 522 ( 2015 ) , str. 167 – 172 , 10.1038/nature14507

Zobacz w Scopus Google Scholar
31

PdB Damgaard , N. Marchi , S. Rasmussen , M. Peyrot , G. Renaud , T. Korneliussen , JV Moreno -Mayar , MW Pedersen , A. Goldberg , E. Usmanova i in.

137 starożytnych genomów ludzkich z stepów euroazjatyckich

Natura , 557 ( 2018 ) , s. 369 – 374 , 10.1038/s41586-018-0094-2

Google Scholar
32

SA Miller , DD Dykes , HF Polesky

Prosta procedura wysolania służąca do ekstrakcji DNA z ludzkich komórek jądrzastych

Kwasy nukleinowe Res. , 16 ( 1988 ) , str. 1215 , 10.1093/nar/16.3.1215

Zobacz w Scopus Google Scholar
33
Li, H., Trimadap. GitHub. https://github.com/lh3/trimadap .

Google Scholar
34

H. Li , R. Durbin

Szybkie i dokładne dopasowanie odczytu krótkiego z transformacją Burrowsa–Wheelera

Bioinformatyka , 25 ( 2009 ) , s. 1754 – 1760 , 10.1093/bioinformatyka/btp324

Zobacz w Scopus Google Scholar
35

GG Faust , IM Hall

SAMBLASTER: szybkie oznaczanie duplikatów i ekstrakcja odczytu wariantów strukturalnych

Bioinformatyka , 30 ( 2014 ) , s. 2503 – 2505 , 10.1093/bioinformatyka/btu314

Zobacz w Scopus Google Scholar
36

Szeroki Instytut

Zestaw narzędzi Picarda

( 2019 )

https://broadinstitute.github.io/picard/

Google Scholar
37

A. McKenna , M. Hanna , E. Banks , A. Sivachenko , K. Cibulskis , A. Kernytsky , K. Garimella , D. Altshuler , S. Gabriel , M. Daly , MA DePristo

Zestaw narzędzi do analizy genomu: struktura MapReduce do analizy danych sekwencjonowania DNA nowej generacji

Genome Res. , 20 ( 2010 ) , str. 1297 – 1303 , 10.1101/gr.107524.110

Zobacz w Scopus Google Scholar
38

P. Danecek , JK Bonfield , J. Liddle , J. Marshall , V. Ohan , MO Pollard , A. Whitwham , T. Keane , SA McCarthy , RM Davies , H. Li

Dwanaście lat SAMtools i BCFtools

GigaScience , 10 ( 2021 ) , Artykuł giab008 , 10.1093/gigascience/giab008

Zobacz w Scopus Google Scholar
39

A. Manichaikul , JC Mychaleckyj , SS Rich , K. Daly , M. Sale , WM Chen

Solidne wnioskowanie o relacjach w badaniach asocjacyjnych w całym genomie

Bioinformatyka , 26 ( 2010 ) , s. 2867 – 2873 , 10.1093/bioinformatyka/btq559

Zobacz w Scopus Google Scholar
40

E. Carter , A. Manica

Tidypopgen: Tidy Population Genetics. Wersja pakietu R 0.0.0.9016

( 2024 )

https://github.com/evolecolgroup/tidypopgen

Google Scholar
41

I. Lazaridis , N. Patterson , A. Mittnik , G. Renaud , S. Mallick , K. Kirsanow , PH Sudmant , JG Schraiber , S. Castellano , M. Lipson i in .

Starożytne genomy ludzkie sugerują istnienie trzech populacji przodków współczesnych Europejczyków

Natura , 513 ( 2014 ) , str. 409 – 413 , 10.1038/nature13673

Zobacz w Scopus Google Scholar
42

R. Davidson , poseł Williams , X. Roca-Rada , K. Kassadjikova , R. Tobler , L. Fehren-Schmitz , B. Llamas

Odchylenie alleliczne podczas wzbogacania w roztworze starożytnego ludzkiego DNA

Mol. Ecol. Resour. , 23 ( 2023 ) , str. 1823 – 1840 , 10.1111/1755-0998.13869

Zobacz w Scopus Google Scholar
43

N. Patterson , AL Cena , D. Reich

Struktura populacji i analiza własna

PLoS Genet. , 2 ( 2006 ) , s. e190 , 10.1371/journal.pgen.0020190

Google Scholar
44

N. Patterson , P. Moorjani , Y. Luo , S. Mallick , N. Rohland , Y. Zhan , T. Genschoreck , T. Webster , D. Reich

Starożytna domieszka w historii ludzkości

Genetyka , 192 ( 2012 ) , s. 1065 – 1093 , 10.1534/genetics.112.145037

Zobacz w Scopus Google Scholar
45

M. Molak , SYW Ho

Ocena wpływu uszkodzeń pośmiertnych w starożytnym DNA: podejście teoretyczne

J. Mol. Evol. , 73 ( 2011 ) , str. 244 – 255 , 10.1007/s00239-011-9474-z

Zobacz w Scopus Google Scholar
46

CWK Chiang , JH Marcus , C. Sidore , A. Biddanda , H. Al-Asadi , M. Zoledziewska , M. Pitzalis , F. Busonero , A. Maschio , G. Pistis i in.

Historia genomiczna populacji Sardynii

Nat. Geneta. , 50 ( 2018 ) , s. 1426 – 1434 , 10.1038/s41588-018-0215-8

Zobacz w Scopus Google Scholar
47

P. Deelen , MJ Bonder , KJ van der Velde , H.-J. Westra , E. Winder , D. Hendriksen , L. Franke , MA Swertz

Harmonizator genotypów: automatyczne dopasowanie nici i konwersja formatu w celu integracji danych genotypowych

BMC Res. Notes , 7 ( 2014 ) , s. 901 – 904 , 10.1186/1756-0500-7-901

Zobacz w Scopus Google Scholar
48

DH Alexander , J. Novembre , K. Lange

Szybka, oparta na modelu ocena pochodzenia u osób niespokrewnionych

Genome Res. , 19 ( 2009 ) , str. 1655 – 1664 , 10.1101/gr.094052.109

Zobacz w Scopus Google Scholar
49

S. Purcell , B. Neale , K. Todd-Brown , L. Thomas , MAR Ferreira , D. Bender , J. Maller , P. Sklar , PIW de Bakker , MJ Daly , PC Sham

PLINK: zestaw narzędzi do analizy powiązań całego genomu i sprzężeń populacyjnych

Am. J. Hum. Genet. , 81 ( 2007 ) , str. 559 – 575 , 10.1086/519795

Wyświetl PDF Wyświetl artykuł Wyświetl w Scopus Google Scholar
50

M. Jakobsson , NA Rosenberg

CLUMPP: program do dopasowywania i permutacji klastrów do radzenia sobie z przełączaniem etykiet i multimodalnością w analizie struktury populacji

Bioinformatyka , 23 ( 2007 ) , s. 1801 – 1806

Widok Crossref w Scopus Google Scholar
51

DJ Lawson , G. Hellenthal , S. Myers , D. Falush

Wnioskowanie o strukturze populacji przy użyciu gęstych danych haplotypowych

PLoS Genet. , 8 ( 2012 ) , Artykuł e1002453 , 10.1371/journal.pgen.1002453

Zobacz w Scopus Google Scholar
52

RJ Hofmeister , DM Ribeiro , S. Rubinacci , O. Delaneau

Dokładne określanie faz rzadkich wariantów danych sekwencjonowania całego genomu i całego eksomu w brytyjskim biobanku

Nat. Genet. , 55 ( 2023 ) , s. 1243 – 1249 , 10.1038/s41588-023-01415-w

Zobacz w Scopus Google Scholar
53

Konsorcjum projektu 1000 genomów , A. Auton , LD Brooks , RM Durbin , EP Garrison , HM Kang , JO Korbel , JL Marchini , S. McCarthy , GA McVean , GR Abecasis

Globalne odniesienie do zmienności genetycznej człowieka

Natura , 526 ( 2015 ) , str. 68 – 74 , 10.1038/nature15393

Zobacz w Scopus Google Scholar
54

S. Schiffels , R. Durbin

Wnioskowanie o wielkości populacji ludzkiej i historii separacji na podstawie wielu sekwencji genomu

Nat. Geneta. , 46 ( 2014 ) , s. 919 – 925 , 10.1038/ng.3015

Zobacz w Scopus Google Scholar
55

A. Bergström , SA McCarthy , R. Hui , MA Almarri , Q. Ayub , P. Danecek , Y. Chen , S. Felkel , P. Halllast , J. Kamm i in .

Wgląd w zmienność genetyczną człowieka i historię populacji na podstawie 929 różnych genomów

Nauka , 367 ( 2020 ) , Artykuł eaay5012 , 10.1126/science.aay5012

Google Scholar
56

C. Alkan , P. Kavak , M. Somel , O. Gokcumen , S. Ugurlu , C. Saygi , E. Dal , K. Bugra , T. Güngör , SC Sahinalp i in.

Całkowite sekwencjonowanie genomów tureckich ujawnia funkcjonalne allele prywatne i wpływ interakcji genetycznych z Europą, Azją i Afryką

Gen BMC. , 15 ( 2014 ) , Artykuł 963 , 10.1186/1471-2164-15-963

Zobacz w Scopus Google Scholar
57

MA Almarri , M. Haber , RA Lootah , P. Halllast , S. Al Turki , HC Martin , Y. Xue , C. Tyler-Smith

Historia genomiczna Bliskiego Wschodu

Komórka , 184 ( 2021 ) , s. 4612 – 4625.e14 , 10.1016/j.cell.2021.07.013

Wyświetl PDF Wyświetl artykuł Wyświetl w Scopus Google Scholar
58
https://support.10xgenomics.com/genome-exome/software/downloads/latest .

Google Scholar
59

R. Maier , P. Flegontov , O. Flegontova , U. Işıldak , P. Changmai , D. Reich

O granicach dopasowania złożonych modeli historii populacji do statystyki f

Elife , 12 ( 2023 ) , Artykuł e85492 , 10.7554/eLife.85492

Zobacz w Scopus Google Scholar
60

Y. Zhou , SR Browning , BL Browning

Szybka i prosta metoda wykrywania segmentów tożsamości według pochodzenia w danych na dużą skalę

Jestem. J. Hum. Geneta. , 106 ( 2020 ) , s. 426 – 437 , 10.1016/j.ajhg.2020.02.010

Wyświetl PDF Wyświetl artykuł Wyświetl w Scopus Google Scholar
61

R. Fournier , Z. Tsangalidou , D. Reich , PF Palamara

Wnioskowanie na podstawie haplotypu o niedawnej efektywnej wielkości populacji w próbkach współczesnego i starożytnego DNA

Nat. Commun. , 14 ( 2023 ) , s. 7945 , 10.1038/s41467-023-43522-6

Zobacz w Scopus Google Scholar
62

GD Poznik

Identyfikacja haplogrup chromosomu Y w dowolnie dużych próbkach zsekwencjonowanych lub genotypowanych mężczyzn

Wydruk wstępny w

bioRxiv ( 2016 ) , 10.1101/088716

Google Scholar
63

H. Weissensteiner , D. Pacher , A. Kloss-Brandstätter , L. Forer , G. Specht , HJ Bandelt , F. Kronenberg , A. Salas , S. Schönherr

HaploGrep 2: klasyfikacja haplogrup mitochondrialnych w erze sekwencjonowania o wysokiej przepustowości

Kwasy nukleinowe Res. , 44 ( 2016 ) , str. W58 – W63 , 10.1093/nar/gkw233

Zobacz w Scopus Google Scholar
64

J.G. Schraiber

Ocena relacji między populacjami starożytnymi i współczesnymi

Genetyka , 208 ( 2018 ) , s. 383 – 398 , 10.1534/genetics.117.300448

Zobacz w Scopus Google Scholar
65
https://github.com/pysam-developers/pysam .

Google Scholar
66

P.-R. Loh , M. Lipson , N. Patterson , P. Moorjani , J.K Pickrell , D. Reich , B. Berger

Wnioskowanie o historii domieszek w populacjach ludzkich przy użyciu nierównowagi sprzężeniowej

Genetyka , 193 ( 2013 ) , s. 1233 – 1254 , 10.1534/genetics.112.147330

Zobacz w Scopus Google Scholar
67

M. Chintalapati , N. Patterson , P. Moorjani

Przestrzenno-czasowe wzorce głównych wydarzeń związanych z domieszką człowieka w europejskim holocenie

Elife , 11 ( 2022 ) , Artykuł e77625 , 10.7554/eLife.77625

Zobacz w Scopus Google Scholar
68

C. Kandoth

Wersja vcf2maf 1.6.19

( 2020 ) , 10.5281/zenodo.593251

Google Scholar
69

W. McLaren , L. Gil , SE Hunt , HS Riat , GRS Ritchie , A. Thormann , P. Flicek , F. Cunningham

Predyktor efektu wariantu zespołu

Genom Biol. , 17 ( 2016 ) , str. 122 , 10.1186/s13059-016-0974-4

Zobacz w Scopus Google Scholar
70

A. Mayakonda , DC Lin , Y. Assenov , C. Plass , HP Koeffler

Maftools: wydajna i kompleksowa analiza wariantów somatycznych w nowotworach

Genome Res. , 28 ( 2018 ) , str. 1747 – 1756 , 10.1101/gr.239244.118

Zobacz w Scopus Google Scholar
71

M. Byrska-Bishop , US Evani , X. Zhao , AO Basile , HJ Abel , AA Regier , A. Corvelo , WE Clarke , R. Musunuri , K. Nagulapalli i in.

Sekwencjonowanie całego genomu o dużym zasięgu rozszerzonej kohorty projektu 1000 genomów obejmującej 602 tria

Komórka , 185 ( 2022 ) , s. 3426 – 3440.e19 , 10.1016/j.cell.2022.08.004

Wyświetl PDF Wyświetl artykuł Wyświetl w Scopus Google Scholar
72

S. Rubinacci , O. Delaneau , J. Marchini

Imputacja genotypu przy użyciu transformacji pozycyjnej Burrowsa Wheelera

PLoS Genet. , 16 ( 2020 ) , Artykuł e1009049 , 10.1371/journal.pgen.1009049

Zobacz w Scopus Google Scholar
73

T. Sarkisian , H. Ajrapetian , A. Beglarian , G. Shahsuvarian , A. Egiazarian

Rodzinna gorączka śródziemnomorska w populacji ormiańskiej

Georgian Med. News , 156 ( 2008 ) , s. 105 – 111

Zobacz w Scopus Google Scholar
74

NG Shoham , M. Centola , E. Mansfield , KM Hull , G. Wood , CA Wise , DL Kastner

Pyryna wiąże białko PSTPIP1/CD2BP1, co oznacza, że rodzinna gorączka śródziemnomorska i zespół PAPA są zaburzeniami na tej samej drodze

Proc. Natl. Acad. Sci. USA , 100 ( 2003 ) , str. 13501 – 13506 , 10.1073/pnas.2135380100

Zobacz w Scopus Google Scholar
75

DJ Lawson , L. van Dorp , D. Falush

Samouczek na temat tego, jak nie nadinterpretować wykresów słupkowych STRUCTURE i ADMIXTURE

Nat. Commun. , 9 ( 2018 ) , s. 3258 , 10.1038/s41467-018-05257-7

Zobacz w Scopus Google Scholar
76

ER Jones , G. Gonzalez-Fortes , S. Connell , V. Siska , A. Eriksson , R. Martiniano , RL McLaughlin , M. Gallego Llorente , LM Cassidy , C. Gamba i in.

Genomy górnego paleolitu ujawniają głębokie korzenie współczesnych Euroazjatów

Nat. Commun. , 6 ( 2015 ) , s. 8912 , 10.1038/ncomms9912

Zobacz w Scopus Google Scholar
77

Premier Delser , M. Krapp , R. Beyer , ER Jones , EF Miller , A. Hovhannisyan , M. Parker , V. Siska , M., T. Vizzari , EJ Pearmain i in.

Klimat i góry ukształtowały linie genetyczne przodków człowieka

Wydruk wstępny w

bioRxiv ( 2021 ) , 10.1101/2021.07.13.452067

Google Scholar
78

JAC Greppin , IM Diakonoff

Niektóre skutki działalności ludu Hurro-Urartu i jego języków na najwcześniejszych Ormianach

J. Am. Orient. Soc. , 111 ( 1991 ) , s. 720 – 730

Odnośnik krzyżowy Google Scholar
79

R.H. Hewsen

Armenia Maritima: Historyczna geografia Cylicji

Ormiańska Cylicja , Wydawnictwo Mazda ( 2008 ) , str. 27 – 66

Google Scholar
80

M. Haber , C. Doumet-Serhal , CL Scheib , Y. Xue , R. Mikulski , R. Martiniano , B. Fischer-Genz , H. Schutkowski , T. Kivisild , C. Tyler-Smith

Przejściowy impuls domieszki genetycznej krzyżowców z Bliskiego Wschodu zidentyfikowany na podstawie starożytnych sekwencji genomu

Jestem. J. Hum. Geneta. , 104 ( 2019 ) , s. 977 – 984 , 10.1016/j.ajhg.2019.03.015

Wyświetl PDF Wyświetl artykuł Wyświetl w Scopus Google Scholar
81

DM Fernandes , A. Mittnik , I. Olalde , I. Lazaridis , O. Cheronet , N. Rohland , S. Mallick , R. Bernardos , N. Broomandkhoshbacht , J. Carlsson i in .

Rozprzestrzenianie się przodków stepowych i irańskich na wyspach zachodniej części Morza Śródziemnego

Nat. Ecol. Evol. , 4 ( 2020 ) , s. 334 – 345 , 10.1038/s41559-020-1102-0

Znajdowanie pliku PDF…Zobacz w Scopus Google Scholar
82

T. Günther , C. Nettelblad

Obecność i wpływ błędu referencyjnego na badania genomiczne populacji prehistorycznych populacji ludzkich

PLoS Genet. , 15 ( 2019 ) , Artykuł e1008302 , 10.1371/journal.pgen.1008302

Znajdowanie pliku PDF…Zobacz w Scopus Google Scholar
83

E. Skourtanioti , X. Jia , N. Tavartkiladze , L. Bitadze , R. Shengelia , N. Tushabramishvili , GU Neumann , RA Bianco , A. Mötsch , K. Prüfer i in.

Historia genetyczna Południowego Kaukazu od epoki brązu do wczesnego średniowiecza: 5000 lat ciągłości genetycznej pomimo dużej mobilności

Wydruk wstępny w

bioRxiv ( 2024 ) , 10.1101/2024.06.11.597880

Znajdowanie pliku PDF…Google Scholar

Autor:

Anahit Hovhannisyan, Pierpaolo Maisano Delser, Anna Hakobyan, Eppie R. Jones, Joshua G. Schraiber, Mariya Antonosyan, Ashot Margaryan, Zhe Xue, Sungwon Jeon, Jong Bhak, Peter Hrechdakian, Hovhannes Sahakyan, Lehti Saag, Zaruhi Khachatryan, Levon Yepiskoposyan i in.

, , , , , , , , , , , , , , ,

Historia demograficzna i zmienność genetyczna populacji ormiańskiej

Publikacja:

Amerykańskie czasopismo genetyki człowieka

Wydawca:

Elsevier

Data:

Dostępne online 25 listopada 2024 r.

Opublikowano: 25 listopada 2024 r.

https://doi.org/10.1016/j.ajhg.2024.10.022 Get rights and content

Niniejszy artykuł jest dostępny na licencji Creative Commons CC-BY-NC-ND i zezwala na niekomercyjne wykorzystanie dzieła w opublikowanej formie, bez adaptacji lub zmian, pod warunkiem, że dzieło jest w pełni przypisane.

Link do artykułu: https://www.sciencedirect.com/science/article/pii/S0002929724003914

Streszczenie

Słowa kluczowe: ciągłość genetyczna, Wyżyny Ormiańskie, Ormianie, Teoria bałkańska, Epoka brązu, badanie całego genomu.

Wstęp

Rysunek 1. Mapy przedstawiające Armenię z lokalizacją starożytnych i współczesnych osobników z pełnym genomem, wraz z proponowaną trasą migracji Ormian według teorii bałkańskiej

Materiał i metody

Pobieranie próbek, sekwencjonowanie i etyka

Przetwarzanie danych do analiz genomiki populacyjnej z próbkami WGS

Przed przeprowadzeniem kolejnych analiz sprawdzono pokrewieństwo z KING na nowo wygenerowanych danych WGS i chipie Illumina. Jako próg odcięcia przy filtrowaniu krewnych drugiego stopnia lub bliższych zastosowano współczynnik pokrewieństwa wynoszący 0,0884 .

Łączenie ze starożytnymi i nowoczesnymi zbiorami danych referencyjnych

Analizy genomiczne populacji

Następnie użyliśmy wersji 4.1.1 51 fineSTRUCTURE do klasyfikowania osobników do klastrów na podstawie relacji genetycznych. Przeprowadziliśmy 2 000 000 iteracji próbek łańcucha Markowa Monte Carlo (MCMC) ze 100 000 krokami wypalania, zachowując każdą 10 000 próbkę.

Oszacowanie współczynników par F ST przeprowadzono w smartpca z domyślnymi parametrami i fstonly: TAK.

Segmenty tożsamości według pochodzenia (IBD) wykryto przy użyciu HapIBD 60 , a segmenty krótsze niż 3 cm odfiltrowano. Następnie użyliśmy HapNe-IBD, aby wywnioskować rozmiary demograficzne populacji na podstawie pozostałych segmentów współdzielących IBD. 61

Rozpad LD obliczono przy użyciu PLINK z opcją –r2, oknem przesuwnym o wielkości 70 kb i brakiem limitu dla r2. Pary SNP posortowano w przedziałach 70 kb na podstawie odległości między parami, a dla każdego przedziału obliczono wartości średnie.

Do ustalenia dat zmieszania się osób pochodzenia ormiańskiego z Libanu z epoki żelaza i ludności zamieszkującej wyżyny ormiańskie z późnej epoki brązu u współczesnych Ormian posłużyliśmy się wersją DATES 4010 67 .

Przetwarzanie danych do analiz genomiki medycznej z próbkami WGS

Adnotacja wariantowa

Przypisanie

Wyniki

Warianty statystyk dla współczesnego ormiańskiego zestawu danych

Warianty pogrupowano według (A) częstości występowania alleli i (B) lokalizacji oraz odpowiadających jej proporcji.

Struktura populacji współczesnych Ormian

Rysunek 3. Analizy struktury populacji, relacji genetycznych i historii wielkości populacji współczesnych Ormian

(A) Analiza głównych składowych (PCA) oparta na dzieleniu się haplotypem. Do wykonania PCA wykorzystano macierz coancestry chunkcount z CHROMOPAINTER.

(B) Macierz parami odległości genetycznych F ST pomiędzy populacjami.

Historia demograficzna i skala czasowa rozbieżności

Dystrybucja haplogrup mitochondrialnych i chromosomu Y

Ormianie w relacji do innych współczesnych i starożytnych populacji: testowanie teorii bałkańskiej

Wgląd w ciągłość regionalną

Określanie źródła, zakresu i czasu przepływu genów

Przypisanie

Dyskusja

Dostępność danych i kodu

Podziękowanie

Wkład autorów

Deklaracja interesów

Informacje uzupełniające

Odniesienia

Autor:

Historia demograficzna i zmienność genetyczna populacji ormiańskiej

Publikacja:

Wydawca:

Data:

Opublikowano: 25 listopada 2024 r.

Niniejszy artykuł jest dostępny na licencji Creative Commons CC-BY-NC-ND i zezwala na niekomercyjne wykorzystanie dzieła w opublikowanej formie, bez adaptacji lub zmian, pod warunkiem, że dzieło jest w pełni przypisane.

Popularne posty

Miesięcznik internetowy „Wobec” ISSN: 2450-3983

Przed przeprowadzeniem kolejnych analiz sprawdzono pokrewieństwo z KING na nowo wygenerowanych danych WGS i chipie Illumina. Jako próg odcięcia przy filtrowaniu krewnych drugiego stopnia lub bliższych zastosowano współczynnik pokrewieństwa wynoszący 0,0884 ^.

Następnie użyliśmy wersji 4.1.1 ⁵¹ fineSTRUCTURE do klasyfikowania osobników do klastrów na podstawie relacji genetycznych. Przeprowadziliśmy 2 000 000 iteracji próbek łańcucha Markowa Monte Carlo (MCMC) ze 100 000 krokami wypalania, zachowując każdą 10 000 próbkę.

Oszacowanie współczynników par F _ST przeprowadzono w smartpca z domyślnymi parametrami i fstonly: TAK.

Segmenty tożsamości według pochodzenia (IBD) wykryto przy użyciu HapIBD ⁶⁰ , a segmenty krótsze niż 3 cm odfiltrowano. Następnie użyliśmy HapNe-IBD, aby wywnioskować rozmiary demograficzne populacji na podstawie pozostałych segmentów współdzielących IBD. ⁶¹

Do ustalenia dat zmieszania się osób pochodzenia ormiańskiego z Libanu z epoki żelaza i ludności zamieszkującej wyżyny ormiańskie z późnej epoki brązu u współczesnych Ormian posłużyliśmy się wersją DATES 4010 ^{67 .}

(B) Macierz parami odległości genetycznych F _ST pomiędzy populacjami.