Dwoje ormiańskich dzieci, 1893. Autorstwa This file is from the Mechanical Curator collection, a set of over 1 million images scanned from out-of-copyright books and released to Flickr Commons by the British Library.View image on FlickrView all images from bookView catalogue entry for book., Domena publiczna, https://commons.wikimedia.org/w/index.php?curid=33147795
Streszczenie
Przedstawiamy pokaźny ( n = 34) zbiór danych całego genomu na temat Ormian, populacji zamieszkującej region w Azji Zachodniej znany jako Wyżyny Ormiańskie. Wyposażeni w te dane genetyczne przeprowadziliśmy badanie całego genomu Ormian i rozszyfrowaliśmy ich szczegółową strukturę populacji oraz złożoną historię demograficzną. Wykazaliśmy, że populacje Ormian z zachodnich, centralnych i wschodnich części wyżyn są stosunkowo jednorodne. Sasun, populacja na południu, o której twierdzono, że otrzymała główny wkład genetyczny od Asyryjczyków, zamiast tego wyprowadziła swój nieznacznie rozbieżny profil genetyczny z wąskiego gardła, które wystąpiło w niedawnej przeszłości. Zbadaliśmy również dyskutowaną kwestię pochodzenia genetycznego Ormian i nie znaleźliśmy żadnego znaczącego poparcia dla historycznych sugestii Herodota dotyczących ich przodków związanych z Bałkanami. Sprawdziliśmy stopień ciągłości współczesnych Ormian ze starożytnymi mieszkańcami wschodnich wyżyn Ormiańskich i wykryliśmy wkład genetyczny do regionu ze źródła powiązanego z neolitycznymi rolnikami lewantyńskimi w pewnym momencie po wczesnej epoce brązu. Ponadto skatalogowaliśmy mnóstwo nowych mutacji unikalnych dla populacji, w tym mutację missense, która prawdopodobnie powoduje rodzinną gorączkę śródziemnomorską, chorobę autozapalną bardzo rozpowszechnioną u Ormian. W ten sposób podkreślamy znaczenie dalszych badań genetycznych i medycznych tej populacji.
Słowa kluczowe: ciągłość genetyczna, Wyżyny Ormiańskie, Ormianie, Teoria bałkańska, Epoka brązu, badanie całego genomu.
1-s2.0-S0002929724003914-mainWstęp
Ormianie są uznawani za jedną ze starożytnych populacji w Azji Zachodniej i historycznie zamieszkiwali obszar wyżyn ormiańskich 1 ( Rysunek 1 ). Leżące między Europą a Azją terytorium wyżyn było lądowym pomostem dla głównych migracji ludzi od czasu ich wczesnego osadnictwa w górnym paleolicie. 2 Ze względu na bliskość Żyznego Półksiężyca region ten wyłonił się jako jeden z najwcześniejszych ośrodków, które przyjęły rolnictwo w neolicie, odgrywając jednocześnie kluczową rolę w rozpowszechnianiu technologii, takich jak narzędzia obsydianowe, 3 obuwie skórzane, 4 i uprawa winorośli. 5 Okres ten charakteryzował się rozległymi interakcjami genetycznymi między Kaukazem, północnym Lewantem, Iranem i Anatolią przez długi okres czasu, 6 , 7 ze znaczącym przepływem genów ze źródła podobnego do południowego Kaukazu do Anatolii, rozpoczynającym się po zakończeniu neolitu. 7 Innym dobrze udokumentowanym wydarzeniem postneolitycznym był początek migracji ludności z Kaukazu na stepy, co ostatecznie przyczyniło się genetycznie do powstania przodków Jamnych. 7 , 8 , 9 Epoka brązu na wyżynach Armenii jest naznaczona wzrostem i upadkiem wielu kultur archeologicznych, w tym wczesnej kultury brązu Kura-Araxes, środkowego brązu wczesnego Kurhanu, tradycji ceramicznych Trialeti-Wanadzor, Sewan-Artsach, Karmir-berd i Karmir-vank oraz późnej epoki brązu i wczesnej epoki żelaza kultury Lchashen-Metsamor. 10 Około po okresie wczesnej epoki brązu migracja ze stepu w kierunku południowo-wschodnim wprowadziła do regionu przodków związanych z Jamną (choć przeważnie nie dotarła do zachodnich i centralnych części wyżyn Armenii). 7 Wspomniane wcześniej przepływy genów, poparte dowodami językowymi wskazującymi na ukształtowanie się języka proto-ormiańskiego w drugiej połowie epoki brązu (ok. 4000 lat temu), 11 plasują Wyżynę Armeńską jako potencjalny kandydat lub bliski ojczyznę języków proto-indoeuropejskich, skąd następnie rozprzestrzeniły się one na Europę Zachodnią, Azję Środkową i Indie.
Najwcześniejsze odniesienie do Armenii jako państwa znajduje się w babilońskiej wersji inskrypcji z Behistun, datowanej na 522 r. p.n.e., na początku panowania Dariusza I Wielkiego. 12 , 13 W staroperskiej wersji tej samej inskrypcji region ten został nazwany Urartu, królestwem epoki żelaza, które rozkwitało na wyżynach ormiańskich przez około trzy stulecia i charakteryzowało się znaczną heterogenicznością genetyczną. 7 Następne okresy w regionie zostały naznaczone serią najazdów i masowych migracji miejscowej ludności, które w różny sposób wpłynęły na różne części wyżyn. Obejmowały one najazdy imperiów asyryjskiego, perskiego i bizantyjskiego, Arabów, Turków seldżuckich, Mongołów i Imperium Osmańskiego. Chociaż w przeszłości Ormianie zamieszkiwali regiony sięgające aż do wybrzeża Morza Śródziemnego, obecnie zamieszkują głównie wschodnią część wyżyn ormiańskich, położoną na południowym Kaukazie, gdzie znajduje się dzisiejsza Armenia ( Rysunek 1 ).
To złożone tło historyczne wyżyn sprawia, że badanie historii demograficznej Ormian jest kwestią ważną, aby rzucić światło na zaludnianie i migracje regionalne. Jednocześnie górski krajobraz, odrębny i bardzo stary język ormiański oraz silna tożsamość narodowa i kulturowa, wzmocniona później przez przyjęcie chrześcijaństwa, mogły sprzyjać długotrwałej izolacji genetycznej Ormian od sąsiednich populacji. 14 , 15 , 16 Rzeczywiście, porównanie starożytnych i współczesnych genomów mitochondrialnych (mtDNA) na przestrzeni 8000 lat ujawniło niezwykle wysoki poziom ciągłości genetycznej matrylinearnej w regionie. 14 Obraz izolacji genetycznej jest dodatkowo poparty badaniami autosomalnymi całego genomu współczesnych Ormian, które sugerują brak zewnętrznego napływu genetycznego co najmniej od epoki brązu. 15 , 16 Niemniej jednak współczesne genomy mają ograniczoną możliwość wyciągania wniosków na temat ciągłości genetycznej w czasie, a szczegółowe badanie historii demograficznej i populacyjnej Ormian obejmujące zarówno starożytne, jak i współczesne genomy nie zostało jeszcze przeprowadzone.
Innym niedostatecznie zbadanym i bardzo dyskutowanym pytaniem jest pochodzenie Ormian. Istnieje kilka teorii i legend dotyczących formowania się populacji, choć dwie z nich przeważają. Według długoletniej „teorii bałkańskiej” opartej na pismach starożytnego greckiego historyka Herodota przodkami Ormian byli frygijscy koloniści, którzy przybyli na wyżyny ormiańskie z Bałkanów. 17 Wniosek ten wyprowadzono głównie z faktu, że Ormianie byli uzbrojeni na sposób frygijski, gdy byli częścią armii perskiej. Wspólne pochodzenie Ormian i Frygów sugerują ponadto niektórzy językoznawcy, którzy spekulują, że język protoormiański należał do podgrupy trako-frygijskiej w obrębie rodziny języków indoeuropejskich. 18 Niedawne badanie językoznawcze pogrupowało języki ormiański i grecki w jedną głęboką gałąź, co sugeruje, że oddzieliły się one od głównego europejskiego kladu na wczesnym etapie indoeuropejskiego drzewa językowego. 11 Jednak alternatywny pogląd oparty na popularnej legendzie o pochodzeniu Ormian sugeruje lokalne ukształtowanie się populacji. 19 Pomimo rozległych wykopalisk w tym rejonie, do tej pory nie znaleziono przekonujących dowodów archeologicznych, które potwierdzałyby którąkolwiek z tych hipotez. 20 W kwestii pochodzenia, etnogeneza Sasun, ludności ormiańskiej zamieszkującej południową część wyżyn ormiańskich (współczesna południowo-wschodnia Turcja) i mówiącej odrębnym dialektem w języku ormiańskim, 21 wyróżnia się jako szczególna kontrowersja. Według starożytnego ormiańskiego historyka Movsesa Khorenatsiego (V w. n.e.), książęce klany Sasun były potomkami synów Sennacheryba, króla asyryjskiego. 22 Sprawozdanie historyka opierało się na Biblii, 23 źródłach klinowych i lokalnych tradycyjnych opowieściach. Co intrygujące, skład haplogrupy chromosomu Y Sasun różni się od składu innych populacji ormiańskich uderzająco wysoką częstością występowania haplogrupy T, 24 co sugeruje prawdopodobne procesy demograficzne specyficzne dla danej populacji. Dlatego też konieczne jest dokładne badanie genetyczne dotyczące relacji między współczesnymi Ormianami a starożytnymi i współczesnymi próbkami z Bałkanów, a także wewnętrznej podstruktury w obrębie populacji ormiańskich.
Wreszcie, istnieje dobrze znana potrzeba rozszerzenia badań genetycznych na populacje zróżnicowane etnicznie, ponieważ zrozumienie specyficznych dla populacji wariantów genetycznych odgrywa kluczową rolę w badaniach medycznych i biomedycznych. Ormianie pozostają niedostatecznie reprezentowani w obecnych bazach danych genomicznych, w tym w 1000 Genomes Project (1000 GP). Struktura genetyczna populacji została w większości zbadana przy użyciu technologii mikromacierzy lub markerów genetycznych uniparentalnych, 15 , 24 , 25 , 26 i do tej pory zgłoszono tylko osiem pełnych genomów Ormian (dwa zsekwencjonowane za pomocą platformy Illumina, a pozostałe sześć za pomocą Complete Genomics).27 , 28 Tak więc kompletny obraz zmienności genetycznej u Ormian pozostaje w dużej mierze niezbadany.
Tutaj przedstawiamy zbiór danych obejmujący 34 sekwencje całego genomu osób ormiańskich, których wszyscy czterej dziadkowie (4GP) pochodzili z tego samego regionu w obrębie wyżyn ormiańskich. Podzieliliśmy próbki na trzy grupy reprezentujące regiony zachodnie (WA; n = 11), centralne (CA; n = 17, co obejmuje populację Sasun; n = 5) i wschodnie (EA; n = 6) w obrębie wyżyn ormiańskich ( Rysunek 1 i Tabela S1 ). Wygenerowaliśmy również dane z chipa Illumina obejmujące cały genom 23 osób ormiańskich zebranych przy użyciu podobnych kryteriów pochodzenia (WA = 2, CA = 7 i EA = 14). W całym tekście odnosimy się do tych populacji jako do współczesnych Ormian zachodnich, centralnych i wschodnich. Uzbrojeni w nasz nowoczesny zestaw danych, a także gęsto pobrane starożytne genomy z regionu 7 , 29 , 30 , 31 ( ryc. 1 i tabela S2 ), przeprowadziliśmy szczegółową analizę podstruktury genetycznej wśród Ormian, zbadaliśmy ich pochodzenie genetyczne i demografię oraz sprawdziliśmy, czy populację można rzeczywiście uznać za izolat chroniony przed głównymi migracjami, które ukształtowały resztę zachodniej Eurazji. 15 , 16 Ponadto scharakteryzowaliśmy spektrum wariantów genetycznych w kohorcie ormiańskiej. Jako część naszych analiz zajęliśmy się również kwestią dokładności procesu imputacji, gdy uwzględniono panel referencyjny specyficzny dla populacji i najbardziej aktualny panel referencyjny haplotypów 1000 GP dla zespołu GRCh38.
Materiał i metody
Pobieranie próbek, sekwencjonowanie i etyka
Wszyscy darczyńcy, którzy przekazali próbki do tego projektu, zostali przepytani na temat swojego pochodzenia i wypełnili kwestionariusz dotyczący miasta pochodzenia ich rodziców i dziadków. Próbki pobrano od osób zarówno z diaspory, jak i z Republiki Armenii. Wybraliśmy niespokrewnione osoby, których czwórka dziadków pochodziła z tego samego regionu w obrębie Wyżyny Armeńskiej i podzieliliśmy ich geograficznie na zachodnią ( n = 13), centralną ( n = 24) i wschodnią ( n = 20) grupę Ormian. Dlatego w tym badaniu używamy terminu „Ormianie” w odniesieniu do osób, które etnicznie i kulturowo identyfikują się jako część tej populacji i których przodkowie sięgają co najmniej czterech pokoleń wstecz w obrębie określonego regionu Wyżyny Armeńskiej. Nie mieliśmy żadnych wcześniejszych informacji na temat praktyk małżeńskich w tych społecznościach. Badanie to zostało zatwierdzone przez Komisję Etyki Instytutu Biologii Molekularnej Narodowej Akademii Nauk Republiki Armenii (NAS RA) (IRB #00004079). Wszyscy uczestnicy zostali poinformowani o celu badania i wyrazili zgodę na udział.
Pobrano próbki krwi od naszych dawców. Próbki DNA wyekstrahowano w Instytucie Biologii Molekularnej NAS RA, stosując modyfikację procedury wysolania. 32 próbki DNA znormalizowano (∼50 ng/μL), a 34 próbki wysłano do sekwencjonowania całego genomu metodą parzystych końców (WGS) o wysokim pokryciu (∼30×) na platformie Illumina HiSeq X Ten (Macrogen, Seul, Korea Południowa). Pozostałe próbki genotypowano za pomocą chipa Illumina 713K w estońskim biocentrum w Tartu w Estonii. Wszystkie szczegóły dotyczące pobierania próbek i sekwencjonowania podano w Tabeli S1 .
Przetwarzanie danych do analiz genomiki populacyjnej z próbkami WGS
Sekwencje adapterów przycięto z końców odczytów za pomocą trimadap. 33 Wyrównanie próbek przeprowadzono zgodnie z procedurą opisaną w Mallick i in. 27 W szczególności sekwencje wyrównano do kompilacji hs37d5 ludzkiego genomu referencyjnego za pomocą Burrows-Wheeler Aligner (BWA) w wersji 0.7.16, 34 a odczyty klonalne usunięto za pomocą samblastera. 35 Duplikaty odczytów oznaczono za pomocą Picarda w wersji 2.12.1. 36 Kalibrację baz przeprowadzono za pomocą Genome Analysis Toolkit (GATK) w wersji 4.1.9.0, 37 a filtrowanie jakości mapowania ustawiono na 20 za pomocą samtools 1.16. 38 Wywołanie wariantu przeprowadzono przy użyciu HaplotypeCaller w GATK w celu wygenerowania pośrednich plików gVCF, które następnie połączono z GenomicsDBImport i wykorzystano w GenotypeGVCF do wspólnego genotypowania wielu próbek. Ponowna kalibracja wyniku jakości wariantu została przeprowadzona przez VariantRecalibrator dla obu SNP i indelów (insercji i delecji) oddzielnie, a odfiltrowane miejsca zostały wykluczone za pomocą SelectVariants.
Przed przeprowadzeniem kolejnych analiz sprawdzono pokrewieństwo z KING na nowo wygenerowanych danych WGS i chipie Illumina. Jako próg odcięcia przy filtrowaniu krewnych drugiego stopnia lub bliższych zastosowano współczynnik pokrewieństwa wynoszący 0,0884 .
Łączenie ze starożytnymi i nowoczesnymi zbiorami danych referencyjnych
Połączyliśmy nasze 34 pełne genomy z dwoma ormiańskimi (4GP) całymi genomami z projektu Simons. 27 danych Fastq zostało wyrównanych i genotypowanych przy użyciu tej samej procedury, co opisano powyżej. Tidypopgen 40 został użyty do połączenia współczesnych próbek ormiańskich z połączeniami z współczesnych populacji w zestawie danych Human Origins (HO) 41 i danymi obejmującymi cały genom ze starożytnych próbek w Lazaridis et al. 7 Wykluczyliśmy pozycje z wieloma allelami; bez żadnego dodatkowego filtrowania specyficznego dla analizy doprowadziło to do następujących zestawów SNP: 1 053 115 SNP, gdy analiza opierała się wyłącznie na współczesnych próbkach ormiańskich i starożytnych, i 591 014 SNP, gdy użyto połączonego zestawu danych starożytnych i innych współczesnych próbek, odpowiednio z początkowych 1 054 671 i 591 642 SNP w panelu HO. Aby złagodzić potencjalny wpływ stronniczości technologicznej, ograniczyliśmy nasz zbiór danych do jednego typu technologii, shotgun lub capture, kiedykolwiek było to wykonalne. 42 W związku z tym nasza analiza Dstat i analiza głównych składowych (PCA) zostały przeprowadzone wyłącznie na genomach wygenerowanych przez capture, podczas gdy analizy DATES wykorzystywały wyłącznie genomy wygenerowane przez shotgun. Jednak w przypadku niektórych analiz, takich jak ADMIXTURE, qpAdmix i qpGraph, w których połączyliśmy współczesne i starożytne zbiory danych, genomy reprezentujące przodków wymaganych do modelowania nie były konsekwentnie generowane przy użyciu tej samej technologii. Wyeliminowaliśmy zarówno próbki wykazujące bliskie pokrewieństwo, jak i te, które nie spełniały kryteriów analizy zanieczyszczeń. Szczegółowe informacje przedstawiono szczegółowo w Tabeli S2 .
Analizy genomiczne populacji
PCA wykonano z szerokim panelem nowoczesnych i starożytnych próbek przy użyciu oprogramowania smartpca firmy Eigensoft 7.2.0 43 z wyłączoną opcją usuwania wartości odstających. Wszystkie starożytne próbki zostały rzutowane na główne komponenty przy użyciu opcji lsqproject: YES. Do analiz ustawiliśmy próg 100 000 SNP.
Statystyki D dla danych z tablicy SNP obliczono przy użyciu programu qpDstat w pakiecie ADMIXTOOLS 7.0.1. 44 Statystyki uznawano za istotne, jeśli wynik Z był większy niż 3, co odpowiadało wartości p <0,001. Aby uwzględnić potencjalny wpływ uszkodzeń starożytnego DNA, użyliśmy wyłącznie transwersji. 45 Tak więc statystyki D dla próbek porównawczych zarówno starożytnych, jak i współczesnych wykonano na podstawie 109 869 SNP, podczas gdy w przypadku próbek starożytnych oparto się na 197 022 SNP. Do analiz zastosowano próg 35 000 SNP.
Współdzielenie alleli między współczesnymi populacjami ormiańskimi oraz między każdą populacją ormiańską a sąsiednimi grupami etnicznymi zostało oszacowane dla każdego miejsca jako prawdopodobieństwo, że dwóch losowo wybranych nosicieli w połączonej populacji pochodzi z różnych populacji, znormalizowane przez panmiktyczne oczekiwanie, jak opisano w Chiang et al. 46 Biorąc pod uwagę osobliwości genetyczne populacji Sasun, nie uwzględniliśmy jej w centralnej grupie ormiańskiej w analizie. Jednak ze względu na niewielką liczebność populacji ( n = 5) nie przeprowadziliśmy również osobno analizy współdzielenia alleli dla tej populacji. Aby zwiększyć liczbę próbek, do zestawu danych dodano również nowo genotypowane dane Illumina 23 Ormian za pomocą Genotype Harmonizer ( Tabela S1 ). Usunięto 47 pojedynczych, miejsc niezmiennych i miejsc brakujących. Tak więc nasze filtrowanie dało w rezultacie 677 047 SNP. W przypadku analiz między populacją ormiańską i porównawczą połączoną populację ormiańską połączono z zestawem danych HO. Po usunięciu dwóch irańskich próbek, w których brakowało znacznej liczby miejsc, w analizie współdzielenia alleli uwzględniono łącznie 514 134 SNP.
Proporcje przodków oszacowano przy użyciu programu ADMIXTURE w wersji 1.3. 48 Przed analizami przycięliśmy SNP w nierównowadze sprzężeń (LD) poleceniem „-indep-pairwise 200 25 0.4” w programie PLINK 1.9. 49 W przypadku nienadzorowanego programu ADMIXTURE z populacjami ormiańskimi uzyskano 199 955 SNP, w przypadku populacji ormiańskich i porównywalnych współczesnych 203 863 SNP, a w przypadku połączonych danych starożytnych i współczesnych 289 247 SNP. Przeprowadziliśmy analizy pięć razy, a macierze współczynników przynależności do klastra z wielu przebiegów przeanalizowaliśmy przy użyciu CLUMPP. 50
Aby zwiększyć naszą zdolność do identyfikacji relacji między osobami, zastosowaliśmy technikę „malowania chromosomów” zastosowaną do danych haplotypów całego genomu, jak zaimplementowano w wersji 2 programu CHROMOPAINTER. 51 Zestaw danych obejmował 926 próbek i 482 117 SNP po przeprowadzeniu filtrowania wariantów za pomocą –geno 0,01, –hwe 0,000001 i –maf 0,001 w programie PLINK. Przeprowadziliśmy fazowanie naszych danych za pomocą narzędzia shapeit5 (narzędzie phase_common_static) 52 , korzystając z danych haplotypów z 1000 GP fazy 3 dostarczonych jako panel odniesienia. 53 Najpierw oszacowano parametry N e (efektywna wielkość populacji) i μ (globalny współczynnik mutacji) dla czterech chromosomów oddzielnie (chromosomy 1, 4, 15, 22) przez 10 iteracji EM. Zbieżność wyników została później potwierdzona, a średnie wartości dla wszystkich chromosomów zostały obliczone. Te stałe wartości zostały użyte w kolejnym przebiegu ze wszystkimi chromosomami i wszystkimi osobnikami w porównaniu ze wszystkimi innymi z opcją „-a 0 0”. ChromoCombine został zastosowany do binowania różnych wyników chromosomowych. Przeprowadziliśmy PCA podobieństwa haplotypowego w oparciu o macierz współprzodków CHROMOPAINTER.
Następnie użyliśmy wersji 4.1.1 51 fineSTRUCTURE do klasyfikowania osobników do klastrów na podstawie relacji genetycznych. Przeprowadziliśmy 2 000 000 iteracji próbek łańcucha Markowa Monte Carlo (MCMC) ze 100 000 krokami wypalania, zachowując każdą 10 000 próbkę.
Wdrożono podejście wielokrotnej sekwencyjnej koalescencji Markowa (MSMC) (wersja 2.1.2) 54 w celu wywnioskowania historycznych zmian w efektywnej wielkości populacji i współczynnikach koalescencji krzyżowej (CCR). Genomy zostały fazowane za pomocą shapeit5 przy użyciu 1000 GP fazy 3 wariantu wydania. 53 Skrypty niestandardowe z repozytorium github zostały użyte do przygotowania plików wejściowych do analizy. 54 Brakujące miejsca zostały odfiltrowane, a warianty wieloalleliczne znormalizowane przed analizą. Do oszacowania efektywnej wielkości populacji uwzględniliśmy cztery osobniki (8 haplotypów) z każdej populacji, podczas gdy do separacji populacji użyliśmy dwóch haplotypów na populację. Przyjęliśmy współczynnik mutacji 1,25 × 10 −8 na parę zasad na pokolenie i czas pokolenia 25 lat. Do oszacowania CCR użyto jednego osobnika (2 haplotypy) z każdej populacji. Porównawcze zestawy danych uzyskano z panelu CEPH Human Genome Diversity Project (HGDP) 55 i wcześniejszych publikacji. 56 , 57 Tylko w przypadku próbek syryjskich przeprowadziliśmy dopasowanie przy użyciu Long Ranger 58 (wersja 2.2.2, przy użyciu GATK v.3.7), oprogramowania przeznaczonego do przetwarzania wyników sekwencjonowania chromu. Pozostałe próbki wyrównano przy użyciu opisanego powyżej potoku.
Modelowanie wykresu domieszek przeprowadzono za pomocą qpGraph w ADMIXTOOLS2 59 , używając Mbuti jako grupy zewnętrznej. Naszym celem było uzyskanie wykresów, w których współcześni Ormianie otrzymują domieszki z Armenia_LBA i Lebanon_IA. Do wstępnej analizy wykresów użyliśmy find_graph() z 250 powtórzeniami. Zauważyliśmy jednak, że większość wykresów wydawała się niepoprawna pod względem kolejności chronologicznej uwzględnionych populacji i/lub wykazywała nieprawidłowe relacje między próbkami, pomimo istniejącej wiedzy na temat tych relacji. Następnie najpierw uzyskaliśmy wykres rusztowania ( rysunek S24 ) z Lebanon_IA, Armenia_LBA wraz z populacjami, które okazały się źródłem starożytnych osobników z wyżyn Armenii. 7 Są to łowcy-zbieracze z Kaukazu (CHG), łowcy-zbieracze ze Wschodu (EHG), Anatolia_N i Levant_N. Do analiz wykorzystaliśmy tylko transwersję i nie uwzględniliśmy brakujących miejsc, co po filtrowaniu dało 65 370 SNP. Przyznajemy, że kilka innych wykresów również pasuje do zestawu danych. Jednak naszym głównym podejściem było dopasowanie naszego wykresu do wiedzy o relacjach z poprzednich analiz i przestrzeganie kolejności chronologicznej próbek. Aby modelować pochodzenie próbek ormiańskich, użyliśmy qpAdm z tego samego pakietu. Przetestowaliśmy dwukierunkową domieszkę z populacji z epoki żelaza w Libanie i późnej epoki brązu na wyżynach ormiańskich. Użyliśmy Mbuti, EHG, Kostenki14, Anatolia_N, Italy_North i Villabruna_HG jako populacji odniesienia. Przed przeprowadzeniem analizy oceniliśmy, czy populacje odniesienia mogą dobrze różnicować populacje źródłowe, obliczając qpWave. Po odfiltrowaniu transwersji mieliśmy 109 797 SNP. Zarówno w przypadku qpGraph, jak i qpAdm przyjęliśmy wartość graniczną 35 000 SNP dla analiz.
Oszacowanie współczynników par F ST przeprowadzono w smartpca z domyślnymi parametrami i fstonly: TAK.
Przebiegi homozygotyczności (ROH) obliczono za pomocą PLINK na połączonych danych genotypowych dla wszystkich populacji, z filtrem częstości występowania alleli mniejszościowych (MAF) ustawionym na 0,05. Regiony homozygotyczne zdefiniowano jako te z ponad 50 homozygotycznymi SNP w 500 kb okna przesuwnego. Użyliśmy również współczynnika trafień okna skanowania wynoszącego 0,05 i opcji –homozyg-window-het 1 –homozyg-window-missing 5, aby umożliwić jedno heterozygotyczne i pięć brakujących wywołań na okno. Dało to 399 509 SNP.
Segmenty tożsamości według pochodzenia (IBD) wykryto przy użyciu HapIBD 60 , a segmenty krótsze niż 3 cm odfiltrowano. Następnie użyliśmy HapNe-IBD, aby wywnioskować rozmiary demograficzne populacji na podstawie pozostałych segmentów współdzielących IBD. 61
Rozpad LD obliczono przy użyciu PLINK z opcją –r2, oknem przesuwnym o wielkości 70 kb i brakiem limitu dla r2. Pary SNP posortowano w przedziałach 70 kb na podstawie odległości między parami, a dla każdego przedziału obliczono wartości średnie.
Haplogrupy chromosomu Y zostały przypisane za pomocą yHaplo 62 , a następnie ręcznie sprawdzone i udoskonalone pod kątem SNP o wyższej rozdzielczości wymienionych w International Society of Genetic Genealogy w wersji 15.73. Przypisanie haplogrupy mitochondrialnej zostało wykonane za pomocą HaploGrep2. 63
Wykonano formalny test ciągłości przy użyciu metody opisanej w Schraiber, 64 oddzielnie dla współczesnych populacji ormiańskich. Przeprowadziliśmy ten test tylko dla przechwyconych starożytnych genomów. Biblioteka pysam w pythonie została użyta do wykonania pileupu plików bam. 65 Przed analizą dopasowaliśmy a priori alfa i beta do dyskretnych częstości alleli referencyjnych. Pliki alleli przodków pobrano z 1000 GP fazy 1. 53 Ograniczyliśmy analizy do miejsc z wywołaniami o wysokiej pewności, w których stan przodków jest potwierdzony przez wszystkie porównania sekwencji. Nie uwzględniliśmy również alleli o częstości 0 lub 1 we współczesnej populacji. Tak więc do testów ciągłości populacji z danymi przechwytywania użyliśmy ∼700 000 SNP. Do daty czasu domieszki użyliśmy ALDER 66 (wersja 1.03) z mindis 0,005. Przetworzyliśmy dane Fastq na 24 próbkach sardyńskich z panelu HGDP-CEPH 55 za pomocą potoku podobnego do tego dla współczesnych genomów ormiańskich. Połączyliśmy je z danymi z całego genomu na temat 99 Ormian z Haber et al. 15 za pomocą Genotype Harmonizer, co dało 645 992 SNP. Użyto rozmiaru bin 0,0001 i mindis 0,005.
Do ustalenia dat zmieszania się osób pochodzenia ormiańskiego z Libanu z epoki żelaza i ludności zamieszkującej wyżyny ormiańskie z późnej epoki brązu u współczesnych Ormian posłużyliśmy się wersją DATES 4010 67 .
Przetwarzanie danych do analiz genomiki medycznej z próbkami WGS
Do celów medycznych zastosowaliśmy procedurę dopasowania i genotypowania podobną do opisanej powyżej, wykorzystując referencyjny genom GRCh38.
Adnotacja wariantowa
Statystyki wariantów dotyczące liczby SNP i indelów obliczono za pomocą bcftools 38 dla pozycji wariantów w pliku vcf z 36 próbkami ormiańskimi. Loci wariantów zdefiniowano jako te z allelami niereferencyjnymi. Określiliśmy stan patogenny mutacji MEFV , korzystając z informacji o allelach pomocniczych z raportu dbSNP ( https://www.ncbi.nlm.nih.gov/snp/ ).
Vcftomaf 68 został użyty do uruchomienia adnotacji przez VEP 69 i konwersji plików vcf do MAF. Warianty z adnotacjami „Frame_Shift_Del,” „Frame_Shift_Ins,” „In_Frame_Del,” „In_Frame_Ins,” „Nonsense_Mutation,” „Nonstop_Mutations,” lub „Splice_Site” zostały zgrupowane jako mutacje utraty funkcji (LoF). Do wizualizacji wariantów genu użyto Maftools. 70 Obliczenia obejmujące AF odnoszą się do znormalizowanych miejsc adnotowanych przez MAF, gdzie wszystkie 36 próbek ormiańskich nie ma brakujących miejsc.
Przypisanie
Zamaskowaliśmy SNP z chipu Illumina 1M w jednym z genomów ormiańskich. Rozważano tylko dwualleliczne, niebrakujące miejsca wariantów. Aby ocenić dokładność imputacji zamaskowanego genotypu, użyliśmy dwóch paneli referencyjnych: (1) zintegrowane dane fazowe shapeit5 z fazy 3 1000 GP, 71 wywołane przeciwko montażowi GRCh38; i (2) panel referencyjny 1000 GP połączony z danymi fazowymi dla pozostałych genomów ormiańskich ( n = 35). Użyliśmy phasing_common w shapeit5 do fazowania zestawu danych ormiańskich i IMPUTE5 do imputacji. Obliczono 72 kwadratowe współczynniki korelacji Pearsona ( R 2 ), aby ocenić dokładność imputacji między genotypami CG (0, 1, 2) a imputowanymi dawkami (0, 2).
Wyniki
Warianty statystyk dla współczesnego ormiańskiego zestawu danych
Łącznie w naszym zestawie danych obejmującym 36 współczesnych próbek ormiańskich (z których dwie zostały wcześniej opublikowane) zidentyfikowaliśmy 13 523 774 wariantów autosomalnych obejmujących 11 134 554 SNP; i 2 510 513 indeli, z których 1 180 458 pozycji było wieloallelowych. Następnie sklasyfikowaliśmy warianty według częstości alleli w połączonym zestawie danych ormiańskich. Większość wariantów była bardzo powszechna (częstotliwość alleli >0,05) ( n = 8 503 355), a tylko około jedna piąta z nich była singletonami ( n = 3 388 182) ( Rysunek 2 A). Łącznie 13 283 198 wariantów było już obecnych w dbSNP, podczas gdy 567 320 było nowych i reprezentowanych głównie przez singletony ( n = 512 915). Zgodnie z oczekiwaniami większość wariantów zidentyfikowano w intronach lub regionach międzygenowych (∼12 milionów), podczas gdy warianty LoF były rzadsze i ze znacznie większym udziałem pojedynczych lub podwójnych w porównaniu do innych wariantów ( Rysunek 2 B). Genomy zostały wzbogacone o krótkie indele i w większości powodowały zmianę bez przesunięcia ramki ( Rysunek S1 ). Podobnie, mniejsze indele były liczniejsze w regionach kodujących białka. Łącznie 12 172 i 10 442 warianty zostały rozpoznane jako uszkadzające lub potencjalnie uszkadzające z różnym poziomem pewności przez SIFT i PolyPhen (z 7472 nakładającymi się wariantami między dwiema adnotacjami).
Wiadomo, że populacja ormiańska jest narażona na wysokie ryzyko rodzinnej gorączki śródziemnomorskiej (FMF [MIM: 134610 ]), 73 zaburzenia autozapalnego spowodowanego szerokim spektrum mutacji w genie MEFV [MIM: 608107 ] i występującego głównie u osób pochodzenia śródziemnomorskiego. Gen koduje 781-aminokwasowe białko zwane piryną, które jest ważnym modulatorem wrodzonej odporności. 74 Co uderzające, w naszym zestawie danych stwierdzono, że prawie połowa osób (16 z 36) jest nosicielami patogennych lub prawdopodobnie patogennych wariantów genu MEFV , co stanowi znacznie wyższą częstość występowania niż 20% zgłaszane w poprzednich badaniach. 73 Podkreśla to ograniczenia konwencjonalnych metod diagnostycznych, takich jak testy paskowe, które nie wydają się być czułą metodą identyfikacji patogennych lub prawdopodobnie patogennych mutacji w populacji ormiańskiej ( Rysunek S2 i Tabela S3 ). Co więcej, w jednej z naszych próbek znaleźliśmy nową mutację typu missense w genie MEFV , która według przewidywań PolyPhen (0,998) będzie szkodliwa.
Struktura populacji współczesnych Ormian
Oceniliśmy różnorodność genetyczną i podstrukturę w obrębie populacji ormiańskich. Chociaż Sasun geograficznie należy do centralnej części wyżyn ormiańskich, w większości naszych analiz traktujemy go jako odrębną grupę ( n = 5), mając na celu zbadanie jego domniemanych różnic genetycznych w stosunku do innych populacji ormiańskich. Pozostałe osobniki ormiańskie zostały zgrupowane jako populacje zachodnie ( n = 11), centralne ( n = 12) i wschodnie ( n = 6) wyżyn ormiańskich, biorąc pod uwagę ich historyczne, geopolityczne, kulturowe i językowe tło ( rysunek 1 ). Ogólnie rzecz biorąc, nie znaleźliśmy wyraźnego podziału między grupami ormiańskimi ( rysunki S3 i S4 A–S4C). Analiza współdzielenia alleli wykazała wysoki poziom podobieństwa genetycznego między wszystkimi grupami, ze szczególnie silnymi powiązaniami genetycznymi między wschodnimi i centralnymi populacjami ormiańskimi dla binów MAF (Sasun nie jest uwzględniony w analizie ze względu na małą liczebność próby). Co godne uwagi, połączona kohorta ormiańska wykazała znaczny stopień pokrewieństwa genetycznego z sąsiednimi populacjami ( rysunki S4 D–S4F). Podczas gdy wzór w PCA ( rysunek S3 A) można w większości wyjaśnić położeniem geograficznym populacji, z wyjątkiem kilku zachodnich osobników ormiańskich, ADMIXTURE dla próbek ormiańskich wskazał na subtelną odrębność w komponentach przodków Sasun ( rysunek S3 B), co może wynikać z domieszki lub podwyższonego tempa dryfu w populacji. Analiza ADMIXTURE z innymi współczesnymi populacjami wykazała bliskie pokrewieństwo między wszystkimi grupami ormiańskimi a Asyryjczykami ( rysunek S5 ). Gdy przeprowadziliśmy ponownie ADMIXTURE tylko dla kilku populacji Bliskiego Wschodu, wywnioskowaliśmy, że Sasun mają odrębny komponent przodków w porównaniu z większością osobników z innych populacji ormiańskich i Asyryjczyków przy K ≥ 3 ( rysunek S6 ). Mając na uwadze, że wyniki projektu ADMIXTURE należy interpretować ostrożnie w przypadku populacji, w których niedawno wystąpiło wąskie gardło, 75 zastosowaliśmy dodatkowe metody, umożliwiając tym samym solidniejszą analizę historii populacji i demografii regionu.
Porównanie par F ST między populacjami ujawniło bliskie podobieństwa genetyczne między Ormianami a ich sąsiadującymi populacjami ( rysunki 3 B , S7 i S8 ), w tym Asyryjczykami, chociaż te zależności były stosunkowo mniej wyraźne w przypadku populacji Sasun. Wyniki te zostały dodatkowo potwierdzone podczas badania wzorców dzielenia się haplotypami grup ormiańskich za pomocą CHROMOPAINTER ( rysunek S9 ) i dalszej wizualizacji w formie hierarchicznego drzewa klastrowania za pomocą fineSTRUCTURE ( rysunek S10 ). Chociaż Sasunowie znajdowali się w siostrzanej gałęzi, wszystkie grupy ormiańskie grupowały się blisko siebie, co sugeruje, że nie ma między nimi istotnych różnic genetycznych. Jednocześnie zaobserwowaliśmy garstkę osób Asyryjskich, Tureckich i Syryjskich w klastrze ormiańskim, co raczej sugeruje pewną podstrukturę genetyczną w obrębie tych populacji i/lub poziom domieszki z Ormianami. Nasza analiza PCA oparta na dzieleniu się haplotypami ( Rysunek 3 A) konsekwentnie wykazywała grupowanie się Ormian z sąsiednimi populacjami z Kaukazu, Anatolii, Iranu i Asyrii. Ponadto wyniki grupowania populacji Ormian potwierdzają nasz podział na grupy regionalne.
Aby formalnie sprawdzić, czy Sasunowie otrzymali dodatkowy przepływ genów z Asyrii w porównaniu z innymi grupami ormiańskimi, przeprowadziliśmy D-statystykę w formie D(Sasun, other_modern_Armenian; Assyrian, Mbuti). Nasze wyniki wykazały, że Sasunowie utworzyli klad z innymi populacjami ormiańskimi, który nie został zerwany przez Asyryjczyków ( Tabela S4 ). Na podstawie tych analiz wnioskujemy, że wszyscy współcześni Ormianie są stosunkowo jednorodni, jednocześnie wykazując duże podobieństwo do sąsiednich populacji, i nie ma dowodów na to, że Sasunowie mają niezwykle wysoki wkład ze strony Asyryjczyków.
Historia demograficzna i skala czasowa rozbieżności
Analizy MSMC wykazały dowody na zmniejszenie liczebności populacji po 10 000 lat temu w przypadku Sasun. Odkrycie to może leżeć u podstaw ich odrębnych cech genetycznych zaobserwowanych w poprzednich analizach i sugeruje zdarzenie wąskiego gardła i/lub brak zewnętrznego przepływu genów (co wyolbrzymiałoby liczebność populacji) w Sasun w porównaniu z resztą populacji ormiańskich. Co znamienne, liczebność populacji była nawet mniejsza niż u Sardyńczyków (jak przedstawiono na rysunku 3 C), u których wcześniej wykazano znaczny spadek liczebności populacji w podobnym okresie. 35 Pozostałe grupy ormiańskie wykazywały efektywne liczebności populacji typowe dla większości Europejczyków z kontynentu, tj. z silnym wąskim gardłem między 50 000 a 60 000 lat temu, związanym z ekspansją poza Afrykę i późniejszym okresem szybkiego wzrostu populacji. Niemniej jednak zauważyliśmy, że większość krzywych szybkości koalescencji krzyżowej była dość niestabilna, co mogło wynikać z bardzo niedawnego momentu rozbieżności i, co za tym idzie, niewystarczającej rozdzielczości analizy MSMC ( rysunek S11 ).Przeanalizowaliśmy dalej średni wskaźnik zaniku LD u Ormian, co wskazuje na dryf genetyczny i historię populacji. Odkryliśmy, że Ormianie wykazują większe LD niż populacje afrykańskie, bliskowschodnie, południowoazjatyckie, kaukaskie i zachodnio-południowoeuropejskie oraz niższe LD niż populacje wschodnioazjatyckie i wschodnio-środkowoeuropejskie ( Rysunek 3 D). Sprawdziliśmy również status inbredu populacji, mierząc średnią całkowitą liczbę ROH ( Rysunek S12 ). Ormianie wykazali stosunkowo niską liczbę ROH w kategoriach krótkiej długości ROH w porównaniu z innymi populacjami. Wykazali jednak stosunkowo wysoką liczbę długich ROH, co odzwierciedla pewien poziom małżeństw pokrewieństwa w ogólnej populacji Ormian. Kiedy przeprowadziliśmy osobną analizę dla grup Ormian ( Rysunek S13 ), odkryliśmy, że najwyższe wskazanie pokrewieństwa zaobserwowano w zachodniej populacji Ormian. Przeanalizowaliśmy również dzielenie się IBD w obrębie populacji i nie znaleźliśmy dowodów na długie dzielenie się IBD między osobnikami, co sugeruje brak zarówno bliskich, jak i dalekich krewnych w populacjach ( Rysunek S14 ). Na podstawie wzorców dzielenia się IBD, przetestowaliśmy następnie scenariusze demograficzne w ciągu ostatnich 100 pokoleń, co jest uważane za bardziej wrażliwą metodę dla ostatnich okresów czasu niż MSMC. Chociaż istnieje niewiele sygnałów dla zmian populacji w ostatniej skali czasu, na podstawie wnioskowanego przedziału ufności możemy wnioskować, że populacja Sasun miała najniższą efektywną wielkość populacji w porównaniu z innymi grupami, co jest zgodne z naszymi poprzednimi wynikami ( Rysunek S15 ).
Dystrybucja haplogrup mitochondrialnych i chromosomu Y
Analiza spektrum haplogrup chromosomu Y i mtDNA u Ormian wykazała przewagę linii specyficznych dla regionu ( rysunki S16 i S17 ; tabela S1 ). W szczególności najczęstszymi haplogrupami chromosomu Y były R1b (23%), J2a (26%) i J1a (16%). W naszym zestawie danych wszyscy Ormianie z haplogrupą R1b należą do linii R-Z2103 związanej z Jamną. 7 Co ciekawe, największą różnorodność genetyczną zaobserwowano na wyżynach ormiańskich. 24 Haplogrupy J2a i J1a są uważane za bliskowschodnie ze względu na swoje pochodzenie, ale mają również głębokie korzenie na Kaukazie, ponieważ znaleziono je w próbkach paleolitycznych z Gruzji. 76 Pula genów matrylinearnych Ormian jest reprezentowana głównie przez haplogrupy H (28%), J (17%), U (14%) i N (11%). Współczesny skład haplogrupy mtDNA był typowy dla starożytnych osobników z wyżyn Armenii, z wyjątkiem tej ostatniej linii, która nie występowała w próbkach od czasów neolitu do średniowiecza. 14 Ogólnie rzecz biorąc, nasze obserwacje patrylinearnych i matrylinearnych puli genetycznych Ormian były zgodne z poprzednimi wynikami. 14 , 24 , 25 , 26
Ormianie w relacji do innych współczesnych i starożytnych populacji: testowanie teorii bałkańskiej
Wgląd w ciągłość regionalną
Określanie źródła, zakresu i czasu przepływu genów
Przypisanie
Dyskusja
Przeprowadziliśmy kompleksową analizę WGS Ormian, wykorzystując pokaźny zbiór danych genomów o dużym pokryciu. Zgodnie z wcześniejszymi badaniami nad matrylinearnym składem genetycznym26 odkryliśmy, że Ormianie charakteryzują się niewielką podstrukturą wewnątrzpopulacyjną. Jedyną populacją, która subtelnie różni się od innych grup Ormian, jest Sasun, o której wcześniej informowano jako o odrębnej na podstawie analizy linii patrylinearnych.24 Wykazaliśmy, że populacja Sasun przeszła przez wyraźne wąskie gardło demograficzne, co jest główną przyczyną obserwowanych różnic genetycznych w stosunku do innych Ormian. Należy zauważyć, że wszystkie populacje Ormian miały duże podobieństwa genetyczne do populacji w bliskiej odległości geograficznej, w tym Asyryjczyków, a Sasun nie otrzymywali znacząco większego przepływu genów od tych ostatnich, co mogłoby wyjaśniać ich niewielką dywergencję genetyczną od innych populacji Ormian.
Opisaliśmy architekturę wariantów w genomach ormiańskich i odkryliśmy ponad 500 000 wariantów, które wcześniej nie zostały zgłoszone w bazie danych wariantów dbSNP. Jako osobne pytanie zbadaliśmy moc imputacji, gdy do panelu referencyjnego fazy 3 1000 GP dodano odniesienie specyficzne dla populacji, dostosowane do zespołu GRCh38. Biorąc pod uwagę przeważnie rzadką częstotliwość występowania wariantów w genomach, uwzględnienie stosunkowo niewielkiej liczby genomów specyficznych dla populacji obok zestawu danych 1000 GP spowodowało jedynie marginalne ulepszenia w naszej zdolności imputacji. W związku z tym, aby znacząco zwiększyć moc imputacji, wymagany jest znacznie większy zestaw danych specyficznych dla populacji.
Skupiliśmy się na rozwiązaniu długotrwałej zagadki dotyczącej genetycznych korzeni Ormian. Chociaż hipoteza bałkańska od dawna jest uważana za najbardziej prawdopodobną narrację na temat pochodzenia Ormian, nasze wyniki wykazały, że współcześni Ormianie różnią się genetycznie zarówno od starożytnej, jak i współczesnej populacji Bałkanów. Podczas gdy niedawne badanie7 spekuluje , że rozcieńczenie przodków EHG po epoce żelaza może sugerować przepływ genów powiązany z Bałkanami, nasze wyniki ujawniają inne źródło tego wkładu genetycznego. Jednocześnie Lazaridis i in.7 potwierdzają brak bałkańskiego komponentu genetycznego w starożytnych próbkach z Armenii.
Wręcz przeciwnie, ujawniliśmy wysoki poziom regionalnej ciągłości genetycznej we wschodnich częściach wyżyn Armenii przez ponad 6000 lat, potwierdzając analizy z poprzednich badań. 14 , 15 Niedawne badanie sugeruje również podobny poziom stabilności aż do epoki brązu na Południowym Kaukazie (nie było testu na późniejsze wkłady, ponieważ w tym badaniu wykorzystano tylko aDNA). 6 Ten wzór stoi w kontraście do większości innych populacji zachodniej Eurazji, które przeszły przez wielokrotne duże napływy i wymiany. 9 , 41 Względnie podobny przykład stanowią Sardyńczycy, którzy od dawna byli uważani za genetyczny izolat w regionie od neolitu, ale niedawne badania wykazały, że wyspa otrzymała liczne wkłady genetyczne po epoce brązu, 81 stanowiące 38%–44% ich przodków.
Chociaż zachodnie i centralne regiony wyżyn Armenii nie są obecnie gęsto badane pod kątem starożytnego DNA, udało nam się jednak dostrzec różnice w czasie penetracji przodków spokrewnionych z Lewantyńczykami do różnych części wyżyn. Podczas gdy odkryliśmy, że te ostatnie były już obecne w zachodnich częściach wyżyn w chalkolicie (późniejszy przepływ genów podobny do Levantine-Early-Farmers mógł wzmocnić ten sygnał), udokumentowaliśmy, że wschodnie części otrzymały go poprzez zdarzenie domieszki, które prawdopodobnie miało miejsce w pewnym momencie po wczesnej epoce brązu, zakłócając tym samym ciągłość genetyczną w regionie. Uznajemy ograniczenia wielkości próby w populacjach sprzed późnej epoki brązu z wyżyn Armenii i uznajemy, że przepływ genów mógł być stopniowym procesem, który osiągnął szczytową intensywność pod koniec późnej epoki brązu, ale prawdopodobnie rozpoczął się znacznie wcześniej (zgodnie z wynikami ALDER i DATES). Tak więc pierwsza migracja na wschodnie wyżyny ormiańskie po neolicie wprowadziła pochodzenie związane ze stepem w regionie, podczas gdy druga zwiększyła proporcję pochodzenia związanego z Lewantynami, szczególnie u mieszkańców wyżyn ormiańskich po późnej epoce brązu. Nasze wyniki dotyczące populacji źródłowej i daty dla mieszanki są mniej więcej porównywalne z badaniami genetycznymi nad Ormianami przeprowadzonymi do tej pory. Podwyższone pochodzenie podobne do neolitycznych-europejskich-rolników u Ormian zostało wcześniej wykryte na podstawie samych współczesnych genomów, 15 a szybkość przepływu genów została oszacowana na 29%. W naszym badaniu zauważyliśmy klin dla napływu genetycznego podobnego do neolitycznych-lewantyńskich-rolników w obrębie ormiańskich grup geograficznych; najbardziej odizolowaną populacją byli wschodni Ormianie (28% wkładu genetycznego związanego z epoką żelaza w Libanie, wnioskowanego przez qpGraph), co zgadza się z ich geografią i w ten sposób pokazuje wpływ gór jako barier dla wymiany genetycznej. Jednocześnie uznajemy, że w przypadku modelowania przodków i obliczeń wkładu genetycznego nie było wykonalne uniknięcie mieszania różnych technologii sekwencjonowania, co mogłoby potencjalnie wpłynąć na wyniki. Jako przestrogę należy wziąć pod uwagę, że w statystykach D powinowactwa współczesne-współczesne lub starożytne-starożytne mogą wynikać nie tylko z uszkodzeń pośmiertnych, ale również z błędu odniesienia, 82 którego nie można wyeliminować wyłącznie za pomocą transwersji. Dlatego w naszym badaniu zastosowaliśmy dodatkowe metody, wyciągając wnioski ze wszystkich z nich.
Nasze badanie obejmujące próbki aDNA zwiększa siłę testów domieszek, dostarczając właściwych źródeł przodków populacji. W związku z tym nie mogliśmy znaleźć dowodów na mieszanki wielu populacji w okresie 3000–2000 p.n.e. 15 Z kolei znaleźliśmy sygnał na pojedyncze zdarzenie domieszki ze źródła podobnego do Levantine-Early-Farmers, które stale występowało w trakcie/po zakończeniu późnej epoki brązu. Przyznajemy, że zdarzenie domieszki mogło mieć miejsce wcześniej, co dobrze pasowałoby do naszych szacunkowych dat (wywnioskowanych przez ALDER i DATES) oraz ostatnich badań nad historią demograficzną w sąsiednim regionie Kaukazu. 83 Co ciekawe, dowody archeologiczne wskazują, że okresy środkowej i późnej epoki brązu na wyżynach ormiańskich charakteryzowały się znaczącymi transformacjami. 10 W środkowej epoce brązu pojawiły się różne kultury, dominujący koczowniczy tryb życia i aktywne relacje z Anatolią i Morzem Egejskim. Z kolei późna epoka brązu charakteryzowała się intensywnymi interakcjami kulturowymi z sąsiednimi ludami, w tym Hurytami, Hetytami i Mezopotamczykami.
Podsumowując, dochodzimy do wniosku, że w pewnym momencie po wczesnej epoce brązu nastąpił ruch na dużą skalę przez Bliski Wschód. Z genetycznego punktu widzenia ruch ten doprowadził do znacznego wkładu przodków neolitycznych w populacjach zamieszkujących ten region. W szczególności ruch ten dotarł do górzystych regionów wschodnich części wyżyn ormiańskich, co spowodowało genetyczne rozbieżności współczesnych populacji od ich regionalnych przodków. Pytania o to, skąd dokładnie i kiedy przybyli ci imigranci, a także co było przyczyną tak rozległej fali migracji, pozostają bez odpowiedzi. Konieczne są dalsze badania złożonych procesów demograficznych regionu wraz z włączeniem dodatkowych starożytnych i współczesnych danych z wyżyn ormiańskich, Anatolii i Lewantu.
Dostępność danych i kodu
Wygenerowane w tym badaniu nieprzetworzone pliki Fastq są dostępne w Europejskim Archiwum Nukleotydów pod numerem ENA: PRJEB78867. Dane genotypowe wygenerowane przez HaplotypeCaller i dane genotypowania Illumina są dostępne za pośrednictwem FigShare: https://doi.org/10.6084/m9.figshare.27277578 .
Podziękowanie
LY, A. Hovhannisyan, MA i ZK otrzymali wsparcie od Komitetu Naukowego Ministerstwa Edukacji i Nauki Armenii (projekt badawczy nr 21AG-1F025 ). A. Hovhannisyan potwierdza finansowanie przez EU MSCA-IF na mocy umowy o dotację 101063265 , ACTIVITY 5 programu ESF DoRa , Calouste Gulbenkian Foundation i Foundation for Armenian Science and Technology (FAST). A. Hovhannisyan jest wdzięczny Mait Metspalu i Richardowi Villiemsowi za pomoc i nadzór nad badaniami programu ESF DoRa na Uniwersytecie w Tartu. A. Manica, PMD i ERJ otrzymali wsparcie od ERC Consolidator grant 647797 „LocalAdaptation”. Dziękujemy Centrum Obliczeń Wysokiej Wydajności Uniwersytetu w Tartu za udostępnienie zaplecza obliczeniowego. Jesteśmy wdzięczni Hovann Simonian za wsparcie projektu mającego na celu stworzenie Genetic Atlas of Armenia. Dziękujemy Danielowi Bradleyowi i Larze Cassidy za konstruktywne dyskusje i komentarze.
Wkład autorów
A. Manica, LY i A. Hovhannisyan wymyślili i zaprojektowali badanie. Próbkowanie przeprowadzili LY, MA i ZK. Fundusze na nowoczesną generację całego genomu zostały pozyskane przez LY, a PHA Hovhannisyan przeprowadził odpowiednie analizy genetyczne populacji i medycyny pod nadzorem A. Manica. PMD, ERJ, A. Hakobyan, JGS, LS, HS, A. Margaryan, ZX, SJ i JB przyczynili się do analizy danych. A. Hovhannisyan i A. Manica zaprojektowali rysunki i napisali manuskrypt. Wszyscy autorzy przyczynili się do ostatecznej wersji manuskryptu.
Deklaracja interesów
Informacje uzupełniające
Tabela S1. Zbiór danych ormiańskich wykorzystany w badaniu .
Tabela S2. Zbiór danych wykorzystany w badaniu .
Tabela S3. Warianty genu MEFV w zbiorze danych ormiańskich .
Tabela S4. Statystyki D.
Tabela S5 . Statystyki D.
Tabela S6 . Statystyki D.
Tabela S7 . Statystyki D.
Tabela S8 . Statystyki D.
Tabela S9. Test największego prawdopodobieństwa .
Tabela S10 . Statystyki D.
Tabela S11. Statystyki D.
Tabela S12. Statystyki D.
Tabela S13. Statystyki D.
Tabela S14. Statystyki D.
Dokument S2. Artykuł plus informacje uzupełniające .
Odniesienia
- 1
Ormianie: Naród na wygnaniuRoutledge ( 1981 )
- 2
Miejsca prehistoryczne w północnej ArmeniiStarożytność , 78 ( 2004 ) , artykuł 301
- 3
Identyfikacja pochodzenia artefaktów obsydianowych na równinie Deh Luran (południowo-zachodni Iran) podkreśla powiązania społecznościowe w neolitycznym Zagrosie
- 4
Pierwszy bezpośredni dowód na istnienie obuwia chalkolitycznego na wyżynach Bliskiego Wschodu
- 5
Podwójne udomowienia i pochodzenie cech w ewolucji winorośli
- 6
Historia genomiczna Anatolii, północnego Lewantu i południowego Kaukazu od epoki neolitu do brązu
- 7
Genetyczna historia Łuku Południowego: Most między Azją Zachodnią a Europą
- 8
Dane dotyczące całego starożytnego genomu ludzkiego z 3000-letniego okresu na Kaukazie odpowiadają regionom ekogeograficznym
- 9
Masowa migracja ze stepów była źródłem języków indoeuropejskich w Europie
- 10
Społeczeństwo i metal w epoce brązu w ArmeniiE. Rova , M. Tonussi (red.) , Na północnej granicy archeologii bliskowschodniej: najnowsze badania nad Kaukazem i Anatolią w epoce brązu. Prace Międzynarodowego Humboldt-Kolleg Venice , Brepols ( 2017 ) , s. 501 – 525
- 11
Drzewa językowe z wybranymi przodkami wspierają hybrydowy model pochodzenia języków indoeuropejskich
- 12
Staroperski: Gramatyka. Teksty. Leksykon , 33 , American Oriental Society ( 1953 )
- 13
Staroperski tekst inskrypcji BisitunJ. Cuneif. Stud. , 5 ( 1951 ) , s. 47 – 54
- 14
Osiem tysięcy lat matrylinearnej ciągłości genetycznej na południowym Kaukazie
- 15
Dowody genetyczne na pochodzenie Ormian z epoki brązu, mieszanie się wielu populacji
- 16
Atlas genetyczny historii domieszek ludzkich
- 17
Z tłumaczeniem na język angielski autorstwa Godleya, ADWydawnictwo Uniwersytetu Harvarda ( 1920 )
- 18
Prehistoria narodu ormiańskiego (Caravan Books, Delmar, NY)( 1984 )
- 19
Historia OrmianWydawnictwo Uniwersytetu Harvarda ( 1978 )
- 20
OrmianieOksford: Blackwell ( 2000 )
- 21
Hay barbaragitutyan neratsutyun (Wprowadzenie do dialektologii ormiańskiej) (Akademia Nauk, Erywań)( 1972 )
- 22
Ormiańska tradycja epicka i kurdyjski folklorIran Cauc. , 1 ( 1997 ) , s. 85 – 92
- 23
Biblia, 2 Królów 19:37.
- 24
Różne fale i kierunki migracji neolitycznych na wyżynach Armenii
- 25
Neolityczne sygnały patrylinearne wskazują, że płaskowyż ormiański został ponownie zasiedlony przez rolników
- 26
Wgląd w strukturę genetyczną matrilinearną, różnicowanie i pochodzenie Ormian w oparciu o kompletne dane mitogenomowe
- 27
Projekt różnorodności genomu Simonsa: 300 genomów ze 142 różnych populacji
- 28
Analizy genomiczne dostarczają informacji o wydarzeniach migracyjnych podczas zaludniania Eurazji
- 29
Wgląd w genomikę pochodzenia rolnictwa na starożytnym Bliskim Wschodzie
- 30
Genomika populacji epoki brązu w Eurazji
- 31
137 starożytnych genomów ludzkich z stepów euroazjatyckich
- 32
Prosta procedura wysolania służąca do ekstrakcji DNA z ludzkich komórek jądrzastych
- 33
- 34
Szybkie i dokładne dopasowanie odczytu krótkiego z transformacją Burrowsa–Wheelera
- 35
SAMBLASTER: szybkie oznaczanie duplikatów i ekstrakcja odczytu wariantów strukturalnych
- 36
Zestaw narzędzi Picarda( 2019 )
- 37
Zestaw narzędzi do analizy genomu: struktura MapReduce do analizy danych sekwencjonowania DNA nowej generacji
- 38
Dwanaście lat SAMtools i BCFtools
- 39
Solidne wnioskowanie o relacjach w badaniach asocjacyjnych w całym genomie
- 40
Tidypopgen: Tidy Population Genetics. Wersja pakietu R 0.0.0.9016( 2024 )
- 41
Starożytne genomy ludzkie sugerują istnienie trzech populacji przodków współczesnych Europejczyków
- 42
Odchylenie alleliczne podczas wzbogacania w roztworze starożytnego ludzkiego DNA
- 43
Struktura populacji i analiza własna
- 44
Starożytna domieszka w historii ludzkości
- 45
Ocena wpływu uszkodzeń pośmiertnych w starożytnym DNA: podejście teoretyczne
- 46
Historia genomiczna populacji Sardynii
- 47
Harmonizator genotypów: automatyczne dopasowanie nici i konwersja formatu w celu integracji danych genotypowych
- 48
Szybka, oparta na modelu ocena pochodzenia u osób niespokrewnionych
- 49
PLINK: zestaw narzędzi do analizy powiązań całego genomu i sprzężeń populacyjnych
- 50
CLUMPP: program do dopasowywania i permutacji klastrów do radzenia sobie z przełączaniem etykiet i multimodalnością w analizie struktury populacjiBioinformatyka , 23 ( 2007 ) , s. 1801 – 1806
- 51
Wnioskowanie o strukturze populacji przy użyciu gęstych danych haplotypowych
- 52
Dokładne określanie faz rzadkich wariantów danych sekwencjonowania całego genomu i całego eksomu w brytyjskim biobanku
- 53
Globalne odniesienie do zmienności genetycznej człowieka
- 54
Wnioskowanie o wielkości populacji ludzkiej i historii separacji na podstawie wielu sekwencji genomu
- 55
Wgląd w zmienność genetyczną człowieka i historię populacji na podstawie 929 różnych genomów
- 56
Całkowite sekwencjonowanie genomów tureckich ujawnia funkcjonalne allele prywatne i wpływ interakcji genetycznych z Europą, Azją i Afryką
- 57
Historia genomiczna Bliskiego Wschodu
- 58
- 59
O granicach dopasowania złożonych modeli historii populacji do statystyki f
- 60
Szybka i prosta metoda wykrywania segmentów tożsamości według pochodzenia w danych na dużą skalę
- 61
Wnioskowanie na podstawie haplotypu o niedawnej efektywnej wielkości populacji w próbkach współczesnego i starożytnego DNA
- 62
Identyfikacja haplogrup chromosomu Y w dowolnie dużych próbkach zsekwencjonowanych lub genotypowanych mężczyznWydruk wstępny w
- 63
HaploGrep 2: klasyfikacja haplogrup mitochondrialnych w erze sekwencjonowania o wysokiej przepustowości
- 64
Ocena relacji między populacjami starożytnymi i współczesnymi
- 65
- 66
Wnioskowanie o historii domieszek w populacjach ludzkich przy użyciu nierównowagi sprzężeniowej
- 67
Przestrzenno-czasowe wzorce głównych wydarzeń związanych z domieszką człowieka w europejskim holocenie
- 68
Wersja vcf2maf 1.6.19
- 69
Predyktor efektu wariantu zespołu
- 70
Maftools: wydajna i kompleksowa analiza wariantów somatycznych w nowotworach
- 71
Sekwencjonowanie całego genomu o dużym zasięgu rozszerzonej kohorty projektu 1000 genomów obejmującej 602 tria
- 72
Imputacja genotypu przy użyciu transformacji pozycyjnej Burrowsa Wheelera
- 73
Rodzinna gorączka śródziemnomorska w populacji ormiańskiejGeorgian Med. News , 156 ( 2008 ) , s. 105 – 111
- 74
Pyryna wiąże białko PSTPIP1/CD2BP1, co oznacza, że rodzinna gorączka śródziemnomorska i zespół PAPA są zaburzeniami na tej samej drodze
- 75
Samouczek na temat tego, jak nie nadinterpretować wykresów słupkowych STRUCTURE i ADMIXTURE
- 76
Genomy górnego paleolitu ujawniają głębokie korzenie współczesnych Euroazjatów
- 77
Klimat i góry ukształtowały linie genetyczne przodków człowiekaWydruk wstępny w
- 78
Niektóre skutki działalności ludu Hurro-Urartu i jego języków na najwcześniejszych OrmianachJ. Am. Orient. Soc. , 111 ( 1991 ) , s. 720 – 730
- 79
Armenia Maritima: Historyczna geografia CylicjiOrmiańska Cylicja , Wydawnictwo Mazda ( 2008 ) , str. 27 – 66
- 80
Przejściowy impuls domieszki genetycznej krzyżowców z Bliskiego Wschodu zidentyfikowany na podstawie starożytnych sekwencji genomu
- 81
Rozprzestrzenianie się przodków stepowych i irańskich na wyspach zachodniej części Morza Śródziemnego
- 82
Obecność i wpływ błędu referencyjnego na badania genomiczne populacji prehistorycznych populacji ludzkich
- 83
Historia genetyczna Południowego Kaukazu od epoki brązu do wczesnego średniowiecza: 5000 lat ciągłości genetycznej pomimo dużej mobilnościWydruk wstępny w
Autor:
Anahit Hovhannisyan, Pierpaolo Maisano Delser, Anna Hakobyan, Eppie R. Jones, Joshua G. Schraiber, Mariya Antonosyan, Ashot Margaryan, Zhe Xue, Sungwon Jeon, Jong Bhak, Peter Hrechdakian, Hovhannes Sahakyan, Lehti Saag, Zaruhi Khachatryan, Levon Yepiskoposyan i in.
, , , , , , , , , , , , , , ,
Historia demograficzna i zmienność genetyczna populacji ormiańskiej
Publikacja:
Amerykańskie czasopismo genetyki człowieka
Wydawca:
Elsevier
Data:
Dostępne online 25 listopada 2024 r.
© 2024 Autorzy. Opublikowane przez Elsevier Inc. w imieniu American Society of Human Genetics.
Opublikowano: 25 listopada 2024 r.
https://doi.org/10.1016/j.ajhg.2024.10.022Get rights and content
Niniejszy artykuł jest dostępny na licencji Creative Commons CC-BY-NC-ND i zezwala na niekomercyjne wykorzystanie dzieła w opublikowanej formie, bez adaptacji lub zmian, pod warunkiem, że dzieło jest w pełni przypisane.
Link do artykułu: https://www.sciencedirect.com/science/article/pii/S0002929724003914