Przyspieszenie odkrywania nowych geoglifów Nasca przy użyciu głębokiego uczenia / Masato Sakai, Yiru Lai, Jorge Olano Canales, Masao Hayashi, Kohhei Nomu

0
81
Małpa z Nazca.  Domena publiczna, https://commons.wikimedia.org/w/index.php?curid=3037995

Streszczenie

Omawiamy badania archeologiczne wykorzystujące detekcję obiektów opartą na uczeniu głębokim (DL) na zdjęciach lotniczych o wysokiej rozdzielczości w celu odkrycia geoglifów Nasca, które zostały wpisane na listę światowego dziedzictwa UNESCO. Ze względu na niezwykle ograniczone dane archeologiczne i ich różnice w skali i projekcie, trudno jest wykryć nowe geoglify jedynie trenując DL na znanych geoglifach. Dlatego opracowaliśmy kanał DL do wydobywania takich danych i rozwiązywania wyzwań unikalnych dla archeologii. Dzięki temu podejściu zidentyfikowaliśmy cztery nowe geoglify w północnej części Nasca Pampa, a mianowicie: humanoida, parę nóg, rybę i ptaka. Geoglify zostały zweryfikowane za pomocą badań na miejscu. Mogliśmy zidentyfikować kandydatów na nowe geoglify około 21 razy szybciej niż samym gołym okiem. Podejście to byłoby korzystne dla przyszłości archeologii w nowym paradygmacie łączenia badań terenowych i sztucznej inteligencji.

Słowa kluczowe: Nasca, Geoglif, Zdjęcie lotnicze o wysokiej rozdzielczości,Teledetekcja, Głębokie uczenie się, Wykrywanie obiektów.

1. Wprowadzenie

Archeologia to dyscyplina badająca przeszłość. Jednak społeczność archeologiczna również rozwijała się, adaptując najnowocześniejsze osiągnięcia nauki i technologii. Ostatnie postępy w dziedzinie zautomatyzowanego wykrywania, umożliwione przez rozpowszechnienie dronów, robotyki i technologii detekcji światła i pomiaru odległości (LiDAR), dużych zbiorów danych (Big Data) oraz sztucznej inteligencji, mogą napędzać kolejną falę odkryć archeologicznych. Technologie te są na przykład wykorzystywane do wykrywania i analizy trudno dostępnych stanowisk archeologicznych na lądzie lub na morzu, lub do analizy kształtu i ikonografii fragmentów, dokumentów i inskrypcji znalezionych podczas wykopalisk archeologicznych ( Mantovan i Nanni, 2020 ; Pecci, 2020 ). Uniwersytet Yamagata kierował zakrojonym na szeroką skalę projektem mającym na celu przetestowanie tych technologii w celu zidentyfikowania luk oraz wyciągnięcia wniosków i zapoznania się z najlepszymi praktykami na potrzeby przyszłych projektów o podobnym charakterze. Częścią projektu było studium wykonalności z wykorzystaniem DL.

1.1 Odkrycie geoglifów Nazca

Odkrycia geoglifów na pampie Nasca rozpoczęły się w latach dwudziestych XX wieku, początkowo były to geoglify liniowe ( Mejía Xesspe, 1942 ; Kroeber i Collier, 1998 ). Później, w latach czterdziestych XX wieku, odkryto różne geoglify figuralne, przedstawiające między innymi kolibry, małpy, kwiaty i narzędzia ( Reiche, 1993 ). W latach osiemdziesiątych XX wieku przeprowadzono interdyscyplinarne badania terenowe geoglifów, wykorzystując zdjęcia wykonane z balonów i samolotów manewrujących nad pampą Nasca ( Aveni, 1990 ).
Cel tworzenia geoglifów był omawiany w kontekście wydarzenia astronomicznego ( Kosok, 1965 ; Reiche, 1993 ). Jednakże teoria ta nie jest obecnie jednoznacznie akceptowana. Bardziej prawdopodobne jest, że były one tworzone w celu obrzędowego chodzenia ( Aveni, 1990 ; Lambers, 2006 , 2020 ; Mejía Xesspe, 1942 ), podczas gdy obecność fragmentów ceramiki ( Clarkson, 1990 ), kukurydzy i spondylusa ( Reindel i in., 2006 ) znalezionych na geoglifach sugeruje, że były one miejscem aktywności obrzędowej.
W 1993 roku geoglify z Nazca zostały wpisane na Listę Światowego Dziedzictwa Kulturowego UNESCO, a następnie rząd peruwiański opracował plany ich ochrony ( Lumbreras, LG, 2000 ). Jednak w tamtych czasach podejmowano ograniczone wysiłki w celu udokumentowania rozmieszczenia geoglifów na pampie Nazca. W rezultacie nielegalne działania budowlane często prowadziły do ​​niszczenia geoglifów, stanowiąc problem społeczny ( Specia, 2018 ). Dlatego zrozumienie rozmieszczenia geoglifów z Nazca jest kluczowe dla zachowania tych ważnych zabytków archeologicznych.
Od 2004 roku Uniwersytet Yamagata prowadzi badania rozmieszczenia geoglifów z wykorzystaniem obrazów satelitarnych, fotografii lotniczych , lotniczego skanowania LiDAR i fotografii z dronów, aby skutecznie badać rozległy obszar Nasca Pampa obejmujący ponad 390 km2 ( Sakai i in., 2014 , 2019 , 2021 ; Sakai i Olano, 2017 ).
Geoglify można podzielić na trzy główne typy: figuralne, geometryczne i liniowe ( Aveni, 1990 ). Geoglify figuralne, które obejmują zwierzęta, ludzi, rośliny i narzędzia, są dalej klasyfikowane na liniowe i reliefowe według metody ich tworzenia ( Rys. 1 ). Wiele geoglifów liniowych zostało narysowanych jednym pociągnięciem jako biała linia. Natomiast geoglify reliefowe zostały narysowane jako kombinacja białych i czarnych części geoglifów figuralnych. Ze względu na różnice w kombinacji, geoglify reliefowe można podzielić na cztery podtypy ( Rys. 1 B–E ).
Rys. 1

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (509 KB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze
Rys. 1. Rodzaje geoglifów figuratywnych. Istnieją dwa główne rodzaje geoglifów figuratywnych: liniowe i reliefowe. Oba powstały na Nasca Pampa pokrytej czarnymi kamieniami na białej warstwie piasku. (A) „Figuratywne geoglify liniowe” wykonano poprzez usunięcie czarnych kamieni w liniowym wzorze odsłaniając biały piasek znajdujący się pod spodem. (B do E) „Figuratywne geoglify reliefowe” często znajdują się na zboczach i składają się z połączenia czarnych kamieni i powierzchni białego piasku. Ten rodzaj geoglifu można podzielić na podtypy 1–4 w następujący sposób: (B) „Reliefowy typ 1” wykonano poprzez usunięcie czarnych kamieni w celu odsłonięcia białego piasku przy motywie. Niektóre z usuniętych kamieni zostały ponownie wykorzystane do przedstawienia szczegółów motywu. (C) „Reliefowy typ 2” wykonano poprzez usunięcie czarnych kamieni wokół motywu. Niektóre z usuniętych kamieni ułożono na motywie, aby go bardziej uwydatnić. (D) „Relief-typ 3” został wykonany poprzez usunięcie czarnych kamieni wzdłuż konturu motywu i ułożenie usuniętych kamieni na wierzchu motywu. (E) „Relief-typ 4” jest biały, ponieważ został wykonany poprzez usunięcie wszystkich czarnych kamieni z wnętrza motywu.
Uważa się, że ten typ linii powstał w okresie Nazca (100–650 n.e.) ze względu na podobieństwo do ikonografii ceramiki nascańskiej ( Isbell, 1978 ). Z kolei typ reliefowy uważa się za pochodzący z późnego okresu formacyjnego (400–200 p.n.e.). Wynika to z podobieństwa ikonografii tego typu geoglifów do ikonografii petroglifów formacyjnych i uważa się, że ikonografia pierwotnie znajdująca się na skale została również przedstawiona na geoglifach ( Reindel i in., 1999 ).
W 2016 roku wykonaliśmy zdjęcia lotnicze o rozdzielczości terenowej 0,1 m/piksel, wykorzystując cyfrową kamerę do pomiarów lotniczych , rasteryzując cały obszar Nasca Pampa. Dodatkowo, pozyskaliśmy szczegółowe dane topograficzne z lotniczych skanów LiDAR. Analiza tych zdjęć ujawniła kilka małych geoglifów o charakterze reliefowym. Dlatego przeprowadziliśmy badania terenowe w celu ich identyfikacji. Zdjęcia lotnicze są przydatne do mapowania rozmieszczenia geoglifów, ponieważ ich rozdzielczość jest znacznie wyższa niż rozdzielczość dostępnych zdjęć satelitarnych, których rozdzielczość terenowa wynosi 0,61 m/piksel.
Pampa Nasca jest bardzo rozległa i wyszukiwanie geoglifów na zdjęciach o wysokiej rozdzielczości gołym okiem zajęłoby sporo czasu. Przy takim nakładzie pracy ludzkiej, analiza danych satelitarnych zajęła naszemu zespołowi około pięciu lat. Dlatego możemy oszacować, że analiza zdjęć lotniczych o bardzo wysokiej rozdzielczości (VHR) będzie wymagała więcej czasu i wysiłku. Aby skutecznie wykrywać lokalizację nowych geoglifów na zdjęciach lotniczych, zdecydowaliśmy się wprowadzić detekcję obiektów za pomocą DL ( Goodfellow i in., 2016 ) trenowanego na danych znanych geoglifów. Celem jest znaczne przyspieszenie odkrywania nowych geoglifów za pomocą DL.
Północny obszar Nasca Pampa (szerokość geograficzna 14°40′11″–14°42′47″S i długość geograficzna 75°5′44″–75°8′52″W) został wybrany jako obszar testowy, gdzie skoncentrowane są dobrze znane duże geoglify zwierząt i roślin (2) ( Rys. 2 ). Za cel detekcji wybraliśmy figuratywne geoglify typu liniowego. Wybrany obszar stanowi około 9% całkowitego obszaru Nasca Pampa. Dwa kryteria kierowały nami przy wyborze tego obszaru: (a) na obszarze tym występuje duża koncentracja figuratywnych geoglifów typu liniowego, co zapewnia więcej danych treningowych dla DL w porównaniu z innymi obszarami; (b) lokalizacja ta została intensywniej zbadana niż inne obszary Nasca Pampa i obejmuje większość znanych geoglifów. Jeśli więc w tym rejonie przy pomocy DL zostaną odkryte nowe geoglify, będziemy mogli z powodzeniem wykazać wartość DL w odkrywaniu geoglifów z Nazca.

Rys. 2

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (2 MB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze
Rys. 2. Obszar objęty badaniem. Północny obszar Nasca Pampa, obszar ograniczony kwadratem jest obszarem objętym badaniem (szerokość geograficzna 14°40′11″–14°42′47″S i długość geograficzna 75°5′44″–75°8′52″W).

1.2 Głębokie uczenie

DL to szczególny rodzaj uczenia maszynowego, który osiąga dużą moc i elastyczność w analizie wzorców obrazów, mowy, języka i nie tylko. W archeologii DL jest wykorzystywane do analizy ikonografii, tekstu i pisma wykopanych obiektów ( Barucci i in., 2021 , 2022 ; Clanuwat i in., 2019 ; Lamb i in., 2020 ; Roman-Rangel i Marchand-Maillet, 2016 ). Inne obszary zastosowania DL to teledetekcja ( Zhu i in., 2017 ). Podczas gdy tradycyjne metodologie przetwarzania obrazu wymagają wyraźnych reguł wykrywania cech docelowych, DL jest w stanie uczyć się reprezentacji z dużych ilości danych treningowych. W archeologii, aby odkryć struktury naziemne za pomocą LiDAR ( Lidar 101, 2012 ; Albrecht i in., 2019 ) lub badań fotografii lotniczych z wykorzystaniem DL zastosowano klasyfikację obrazów ( Caspari i Crespo, 2019 ; Kazimi i in., 2018 ; Soroush i in., 2020 ), wykrywanie obiektów ( Character i in., 2021 ; Trier i in., 2021 ; Vaart i Lambers, 2019 ) oraz kombinacje wykrywania obiektów i segmentacji ( Guyot i in., 2021a , 2021b ; Bonhage i in., 2021 ; Davis i in., 2021 ). W porównaniu z tymi badaniami, nasze prace badawcze stoją przed wyzwaniami pod względem małej liczby danych szkoleniowych i różnorodności projektu obiektu, który chcemy wykryć.
W 2018 roku przeprowadziliśmy badanie typu proof-of-concept (PoC) z wykorzystaniem „Single Shot MultiBox Detector” ( Liu i in., 2016 ), jednego z popularnych algorytmów detekcji obiektów ( Liu i in., 2020 ) opartego na paradygmacie DL. Detekcja obiektów polega na identyfikacji i lokalizacji obiektów określonych klas na obrazie. Naszym celem było efektywne wyszukiwanie kandydatów na nowe geoglify na podstawie szeroko zakrojonych zdjęć lotniczych. Po zakończeniu badania typu proof-of-concept (PoC), do lutego 2020 roku, prowadzono badania terenowe w celu weryfikacji wyników.

2. Materiał i metody

2.1 Zbiór danych zdjęć lotniczych

Zbiór danych obrazowych obejmuje obszar 27 km wzdłuż doliny Ingenio w północno-zachodniej części Nasca Pampa. Aby zbudować model DL, musimy podzielić dane na trzy odrębne zbiory danych. Zbiór danych użyty do trenowania modelu nazywa się danymi treningowymi. Zbiór danych użyty do walidacji wydajności modelu podczas trenowania nazywa się danymi walidacyjnymi. Dane testowe to zbiór danych służący do sprawdzania wydajności modelu po zakończeniu trenowania. Podział tych trzech zbiorów jest ważny przy budowaniu modelu o wysokiej wydajności generalizacji. Jako dane treningowe dla DL wykorzystaliśmy 21 figuratywnych geoglifów typu liniowego odkrytych przed 2018 rokiem (nr 1-21 w Tabeli 1 ). Są to geoglify reprezentujące zwierzęta narysowane na płaskich obszarach Nasca Pampa. Większość tych geoglifów przekracza 50 m. Użyliśmy czterech geoglifów tego samego typu jako danych walidacyjnych (dane Val) dla DL (nr 22-25 w Tabeli 1 ). Jako oddzielny zestaw danych testowych oceniających wydajność uczenia, użyliśmy siedmiu figuratywnych geoglifów typu liniowego odkrytych przed 2018 rokiem (nr 26-32 w Tabeli 1 ). Zestaw danych został wybrany przez archeologów. Dane treningowe wybrano z dobrze znanych geoglifów naziemnych, natomiast dane testowe z mniej znanych. Aby uniknąć arbitralności w tworzeniu modelu DL ze względu na wcześniejszą znajomość danych testowych, dane testowe udostępniono deweloperowi modelu DL pracującemu nad PoC po utworzeniu modelu DL.
Tabela 1. Informacje o nowo odkrytych geoglifach i geoglifach wykorzystywanych w PoC.
NIE. Dane treningowe Dane Val Dane testowe Nowy geoglif Projekt Typ Rozmiar (metr) Postać
1 Geometryczny typ linii 31
2 Orka typ linii 28
3 Nogi typ linii 51
4 Zakład typ linii 49
5 Ptak typ linii 60
6 Pająk typ linii 47
7 Lis typ linii 50
8 Ryba typ linii 65
9 Geometryczny typ linii 79
10 Ptak typ linii 216
11 Zakład typ linii 85
12 Delta typ linii 116
13 Ptak typ linii 98
14 Ptak typ linii 110
15 Jaszczurka typ linii 188
16 Wentylator typ linii 127
17 Małpa typ linii 94
18 Ptak typ linii 218
19 Ptak typ linii 237
20 Ptak typ linii 303
21 Ptak typ linii 382
22 Szpilka typ linii 46
23 Zakład typ linii 53
24 Ptak typ linii 52
25 Ptak typ linii 129
26 Zwierzę typ linii 16 Rys. 5 G
27 Ptak typ linii 9 Rys. 5 E
28 Geometryczny typ linii 37 Rys. 5 F
29 Ryba typ linii 30 Rys. 5 C
30 Orka typ linii 41 Rys. 5D
31 Szpilka typ linii 43 Rys. 5B
32 Zwierzę typ linii 87 Rys. 5 H
33 Humanoidalny typu reliefowego 5 Rys. 6A
34 Ryba typu reliefowego 19 Rys. 6 C
35 Ptak typ linii 17 Rys. 6 D
36 Para nóg typ linii 78 Rys. 6B

2.2 Podejście do danych treningowych

Aby zidentyfikować kandydatów na nowe geoglify na fotografiach lotniczych, opracowaliśmy metodę wykrywania obiektów opartą na DL. Zbadaliśmy strategie radzenia sobie z następującymi specyficznymi problemami, charakterystycznymi dla archeologii:
  • I. Projekt każdego geoglifu jest unikatowy. Założyliśmy, że nowe geoglify nie mają takiego samego projektu jak istniejące. DL nie nadaje się do wyszukiwania obiektów, które nie występują w danych treningowych wybranych ze znanych geoglifów. Dlatego znalezienie nowych geoglifów jest trudnym zadaniem dla DL.
  • ii. Ilość danych treningowych jest niewielka. Do trenowania algorytmów DL dostępnych było dwadzieścia jeden geoglifów. Jednak typowe modele wykrywania obiektów DL są trenowane przy użyciu zestawów danych zawierających od tysięcy do milionów adnotowanych obiektów ( Mogelmose i in., 2012Lin i in., 2014 ).
  • iii. Figuratywne geoglify o kształcie linii występują w różnych rozmiarach: od mniej niż 10 m do ponad 300 m.
Opracowaliśmy podejście do etykietowania danych treningowych. Etykietowanie to proces otaczania całego obiektu w celu uchwycenia go przez prostokątną ramkę zwaną „Bounding Box (BBox)” ( He i in., 2019 ) z pewnym atrybutem nazwy klasy. Aby rozwiązać problem (i) i (ii), wdrożyliśmy etykietowanie w celu wykrywania nowych geoglifów na podstawie podobieństw w pewnych częściach, a nie całego geoglifu. Założyliśmy, że istnieje podobny częściowy wzór między znanymi i nowymi geoglifami. Uproszczając wzór w BBox, staraliśmy się wykryć nawet małą część nowego geoglifu. Konkretnie zdefiniowaliśmy jednostkę o nazwie „element” jako nazwę klasy. „Element” jest częścią geoglifu, która ma minimalne niezbędne cechy potrzebne do rozpoznania obszaru zamkniętego przez BBox jako geoglif. Na przykład, oznaczyliśmy części takie jak głowy, torsy, ramiona, nogi i ogony jako „elementy” dla geoglifów zwierząt ( rys. 3A ). Ponieważ pole BBox jest prostokątne, możliwe jest uwzględnienie innych części, gdy obszar pola BBox jest duży. W takich przypadkach dalszy podział na mniejsze elementy eliminuje inne części. Na przykład ramię można podzielić na ramię, przedramię, dłoń itd. ( rys. 3B ). Taki podział wyklucza wszelkie inne geoglify z pola BBox. Dodatkowo, mogliśmy zwiększyć ilość danych treningowych, definiując „element”. W wyniku etykietowania geoglifów na podstawie wytycznych „element”, 21 geoglifów przekształciło się w 95 „elementów” o niezależnych kształtach. Wykorzystaliśmy te elementy jako dane treningowe do wykrywania obiektów ( rys. 4B ) .
Rys. 3
  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (605 KB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze

Rys. 3. Przykłady etykietowania BBox oparte na regułach „elementów”. ( A ) W przypadku geoglifów pająków głowa, nogi i ciało liczone są jako jeden element. ( B ) W przypadku nóg i ramion geoglifów małp ramię i obszar za nadgarstkiem oraz noga i obszar za kostką liczone są jako oddzielne elementy.

Rys. 4

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (397 KB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze
Rys. 4. Zunifikowany proces wykrywania geoglifów Nasca na podstawie zdjęć lotniczych w fazie treningu i wnioskowania. ( A ) Zdjęcia lotnicze zawierające geoglify Nasca jako dane treningowe. ( B ) Etykietowanie geoglifów w oparciu o reguły „elementów”. ( C ) Kadrowanie zdjęć lotniczych do różnych rozmiarów. ( D ) Trening z wykorzystaniem przyciętych obrazów jako danych wejściowych dla DL. ( E ) Zdjęcia lotnicze zawierające geoglify Nasca jako dane testowe. ( F ) Stosowanie wykrywania obiektów przy użyciu wytrenowanego modelu DL. ( G ) Wynikiem są obrazy z BBoxami, które są kandydatami na geoglify.
Rys. 5

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (2 MB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze
Rys. 5. Wyniki wnioskowania na podstawie zdjęć lotniczych. ( A ) Przykłady wyników wnioskowania na podstawie zdjęć lotniczych. To część zdjęć lotniczych użytych do testów, które znajdują się w północnej części Nasca Pampa (400 m × 800 m). ( B do L ) Wyniki wnioskowania modelu DL. ( B do F ) Wykryte dane testowe. ( G do H ) Niewykryte dane testowe. ( I do L ) Nadmiernie wykryte elementy.
Do celów szkoleniowych wykorzystaliśmy wstępnie wytrenowany model z zestawu danych COCO ( Lin i in., 2014 ) jako model początkowy, aby uzyskać większą dokładność i skrócić czas szkolenia ( ryc. 4 D) .
Rys. 6

  1. Pobierz: Pobierz obraz w wysokiej rozdzielczości (1 MB)
  2. Pobierz: Pobierz obraz w pełnym rozmiarze
Rys. 6. Cztery nowe geoglify Nasca zidentyfikowane przez Deep Learning. ( A ) Humanoidalny, typ reliefowy (nr 33 w tabeli 1 ). ( B ) Para nóg, typ liniowy (nr 36 w tabeli 1 ). ( C ) Ryba, typ reliefowy (nr 34 w tabeli 1 ). ( D ) Ptak, typ liniowy (nr 35 w tabeli 1 ). (B do D) są prezentowane publicznie po raz pierwszy w tym artykule.
W odniesieniu do problemu (iii), poprzez kadrowanie oryginalnych obrazów w trybie wieloskalowym, wygenerowano wiele wariantów obrazów wejściowych o różnych proporcjach między szerokością kadrowanego obrazu a szerokością geoglifu dla tego samego geoglifu (i elementu). Dzięki tej technice wsparliśmy detekcję geoglifów o różnych rozmiarach ( rys. 4C ).
2.3 Zasady dotyczące progu wykrywania
Dostosowaliśmy liczbę kandydatów do wykrycia, zmieniając próg wyniku ufności dla wykrywania obiektów ( rys. 4F ). W przypadku wykrywania obiektów, poszczególne wyniki wykrycia to pole BBox wokół zidentyfikowanego obiektu wraz z jego wynikiem ufności. Zasadniczo próg jest ustawiony wystarczająco wysoko, aby ograniczyć nadmierną detekcję. W niniejszym badaniu celowo kontrolowaliśmy próg, aby uzyskać określoną liczbę kandydatów. Innymi słowy, chcieliśmy uniknąć przeoczenia wyników prawdziwie pozytywnych kosztem stosunkowo dużej liczby wyników fałszywie pozytywnych. Wyniki prawdziwie pozytywne odnoszą się do geoglifów, które model DL wykrył poprawnie, natomiast wyniki fałszywie pozytywne odnoszą się do geoglifów, które model DL wykrył nieprawidłowo za pomocą pola BBox.

3. Wyniki

3.1 Wyniki wykrywania danych testowych

Przeprowadziliśmy wnioskowanie z wykorzystaniem wytrenowanego modelu DL do wykrywania obiektów, porównując zdjęcia lotnicze z wynikami kandydatów na geoglify. Przy progu ufności 0,9, wykryto 1954 „elementy” ( rys. 5A ). Podczas weryfikacji z siedmioma geoglifami testowymi, model wykrył pięć z nich ( rys. 5B–F). Natomiast gdy początkowo oznaczyliśmy cały geoglif jednym polem BBox zamiast podejścia „element”, model nie mógł wykryć żadnego geoglifu testowego. Zatem wynik ten wskazuje, że definiowanie i trenowanie modelu DL z użyciem etykiet „element” jest skuteczne w wykrywaniu geoglifów.
Pięć wykrytych geoglifów przedstawiało ptaka, orkę, rybę, dłoń i szpilkę o długości od 10 do 70 m. Trzy z nich znajdowały się na płaskim terenie Nasca Pampa ( ryc. 5 B–D). Pozostałe dwa znajdowały się w Ventilli (Dolinie Ingenio) w pochyłej części północnej części Nasca Pampa ( ryc. 5 E i F). Wspólną cechą pięciu geoglifów jest to, że znajdują się one na podobnej piaszczystej powierzchni gruntu, co dane treningowe, a linie wystają z otaczającej powierzchni gruntu.
Nie udało się wykryć dwóch geoglifów testowych. Jeden z nich to 16-metrowy liniowy symbol zwierzęcia, utworzony w płaskiej części Nasca Pampa ( ryc. 5G ). Obszar, w którym został narysowany, ma białawą powierzchnię gruntu z powodu przepływu cieczy w przeszłości. Zatem, nawet gdyby usunąć kamyki z powierzchni gruntu, z których powstał geoglif, jego widoczność była niezwykle mało prawdopodobna, ponieważ różnica w kolorze powierzchni gruntu i odsłoniętej powierzchni była bardzo niewielka. Drugim jest 87-metrowy liniowy symbol zwierzęcia, utworzony w pochyłej części północnego krańca Nasca Pampa ( ryc. 5H ), zwanego regionem San Miguel de la Pascana. Jest on mniej widoczny niż geoglify narysowane na płaskich obszarach. Geoglify narysowane w tym obszarze nie zostały uwzględnione w danych treningowych. Co więcej, dane treningowe i testowe zostały wybrane przez archeologa, a dane testowe nie zostały udostępnione z wyprzedzeniem, co uniemożliwiło projektantowi DL uwzględnienie tych warunków regionalnych podczas tworzenia modelu DL. W związku z tym model DL może nie być w stanie rozpoznać cech powierzchni gruntu na tym obszarze.
Na obszarze Nasca Pampa występuje kilka wzorów geometrycznych, takich jak proste geoglify, współczesne drogi i koleiny. Nie zamierzamy wykrywać tych obiektów docelowych. Ze względu na ograniczoną ilość danych treningowych, wytrenowany model wykazuje niewielką zdolność rozróżniania, umożliwiającą oddzielenie geoglifów od tego typu niejednoznacznych wzorów. W związku z tym, wzory geometryczne inne niż obiekty docelowe zostały wykryte w nadmiarze ( rys. 5 , od I do L).
3.2 Wykrywanie kandydatów na nowe geoglify
Zachęcające jest to, że wytrenowane modele wykryły pięć z siedmiu geoglifów danych testowych. Dlatego też, za pomocą tego modelu, poszukiwaliśmy kandydatów na nowe geoglify. W rezultacie odkryliśmy cztery nowe geoglify. Trzy z nich ( rys. 6 B–D) to geoglify opisane po raz pierwszy w tym artykule. Gdy próg wyniku ufności został ustawiony na 0,9, wykryto 1954 „elementy”. Najpierw wybraliśmy jednego kandydata na nowy geoglif spośród nich ( rys. 6 A). Po badaniu na miejscu potwierdziliśmy, że był to rzeczywiście nieodkryty geoglif. Z tego powodu przeprowadzono dalsze badania wszystkich wyników wykrycia progu 0,9 i znaleźliśmy kolejnego kandydata ( rys. 6 B). Następnie ustawiliśmy próg na 0,7. Liczba „elementów” wzrosła do 4587. Z dodanych wyników wykrycia mogliśmy wyodrębnić dwóch dodatkowych kandydatów ( rys. 6 C i D). Badania przeprowadzone na miejscu potwierdziły również, że są to nowe geoglify.
Na tych nowo odkrytych geoglifach narysowano humanoida ( rys. 6A ), parę nóg (lub rąk) ( rys. 6B ), rybę ( rys. 6C ) i ptaka ( rys. 6D ). Chociaż podobne wzory można znaleźć w wcześniej odkrytych geoglifach, cztery nowe są dość unikalne. Spośród nich, humanoidalny geoglif trzymający maczugę w prawej ręce jest mieszanką podtypów 1 i 2 typu reliefowego o długości 5 m. Geoglif pary nóg jest typem liniowym o długości 78 m. Geoglif ryby z szeroko otwartymi ustami jest mieszanką podtypów 2 i 3 typów reliefowych o długości 19 m. Geoglif ptaka jest typem liniowym o długości 17 m. Zamiast być po prostu prostą formą ptaka, jest to wzór łączący proste linie i krzywe, tworzący ptaka.
Typ reliefu różni się od typu liniowego sposobem wykonania, ale niektóre geoglify typu reliefu mają cechę przypominającą linię, która odróżnia je od otoczenia na fotografiach. Dlatego geoglify typu reliefu czasami wyglądają jak geoglify typu liniowego. Na przykład, geoglif humanoidalny składa się z prostokątnej części odpowiadającej twarzy , podczas gdy zdobienia na głowie i maczudze w dłoni składają się z wielu linii. Geoglif ryby ma zarys cech przypominających linie i nakłada się na geoglify liniowe. Zatem, chociaż oba geoglify są typu reliefu, zostały wykryte, ponieważ ich pola BBox mają cechy przypominające linie podobne do wytrenowanego „elementu”, a zatem wynik ten dobrze zgadza się z naszym podejściem do wykrywania.

4. Dyskusja

4.1 Strategie redukcji wyników fałszywie negatywnych

W danych testowych wystąpiły dwa wyniki fałszywie ujemne. Wyniki fałszywie ujemne odnoszą się do celów, które w idealnym przypadku chcielibyśmy wykryć za pomocą analizy pośredniej, ale są pomijane. W tej sekcji omawiamy przyczyny i możliwe usprawnienia w zakresie wyników fałszywie ujemnych oraz podkreślamy znaczenie naszej proponowanej metody.
Zakładamy, że przyczyną wyników fałszywie negatywnych jest brak danych treningowych dla modelu DL. W projektach DL często początkowo brakuje wystarczających danych treningowych, dlatego ogólne podejście polega na kilku cyklach gromadzenia danych i budowania modeli w celu stopniowej poprawy dokładności. Model wykorzystany w niniejszym badaniu znajdował się na etapie PoC (PoC), a głównym celem była wstępna ocena skuteczności metody. Model DL wykorzystuje jako dane treningowe jedynie znane geoglify przedstawione w tabeli 1. W związku z tym model nie uwzględniał szerokiej gamy wzorów geoglifów i cech powierzchni gruntu, co stwarzało podatność na wyniki fałszywie negatywne.
Chociaż całkowite wyeliminowanie wyników fałszywie ujemnych w procesie DL jest trudne, dokładność wykrywania można poprawić poprzez dodanie danych treningowych. Na przykład, model DL stworzony w tym badaniu nauczył się geoglifów tylko z fragmentu Nasca Pampa. Ucząc się geoglifów również z innych części Nasca Pampa, poprawią się wzorce rozpoznawalnych obiektów, co potencjalnie przełoży się na poprawę dokładności. Skuteczne jest również dodanie danych fałszywie ujemnych jako danych treningowych.
W tym badaniu oceniliśmy metodę wykorzystania DL w badaniach geoglifów przy użyciu modelu wykrywania obiektów SSD i wyjaśniliśmy jej skuteczność. Wykrywanie obiektów w DL obejmuje różne algorytmy inne niż SSD, takie jak detektor jednoetapowy, reprezentowany przez YOLO itp., który jednocześnie wykonuje ekstrakcję regionu obiektu i identyfikację kategorii, oraz detektor dwuetapowy, reprezentowany przez R-CNN itp., który wykonuje te procesy szeregowo ( Zou i in., 2023 ). Każdy z tych algorytmów ma inne cechy przetwarzania obrazu, szybkości wnioskowania i dokładności. W ostatnich latach podejmowano próby zastosowania Transformerów, używanych w generatywnej sztucznej inteligencji, do wykrywania obiektów ( Han i in., 2023 ). Dlatego oprócz wzbogacania danych treningowych, poniższe podejścia są również uważane za skuteczne w celu dalszej poprawy dokładności.
  • Ocena i porównanie każdego algorytmu pod kątem przydatności i poprawy dokładności wykrywania geoglifów.
  • Badanie metody zespołowej ( Ganaie i in., 2022 ), która wykorzystuje wiele algorytmów i kompensuje różnice w ich cechach w celu zwiększenia ogólnej dokładności.
Wierzymy, że te pomysły na udoskonalenia zmniejszą nie tylko liczbę wyników fałszywie ujemnych, ale także fałszywie dodatnich spowodowanych podobnymi czynnikami. Innymi słowy, możemy zminimalizować pomijanie celów, jednocześnie zmniejszając liczbę fałszywych wykryć, co przełoży się na dokładniejsze wyniki.

4.2 Znaczenie proponowanej metody

Znaczenie naszej metody polega na tym, że DL może być wykorzystywane jako narzędzie wspomagające badaczy. Nawet przy inspekcji wzrokowej człowieka zdarzają się przypadki pominięcia lub nierozpoznania geoglifów. Na przykład, nowo odkryty ludzki geoglif ( rys. 6A ) znajdował się w pobliżu słynnego geoglifu kolibra, ale nigdy wcześniej go nie odnaleziono. Z pomocą DL można odkryć więcej geoglifów. Chociaż DL nie gwarantuje 100% wykrycia, jego dokładność można poprawić, dodając dane treningowe, a w niektórych przypadkach przewyższa ona dokładność człowieka. Ponadto, w przypadku problemów (ii) i (iii) charakterystycznych dla geoglifów, dokładność jest zwiększona dzięki wykorzystaniu elementów i upraw wieloskalowych zaproponowanych w niniejszym artykule. Zwiększenie dokładności zwiększa poziom wsparcia i pozwala oczekiwać odkrycia większej liczby geoglifów.
Co więcej, geoglify są obecnie narażone na zniszczenie, dlatego niezwykle ważne jest zidentyfikowanie i ochrona jak największej ich liczby. Postęp w technologii fotograficznej umożliwił odkrycie małych geoglifów, których wcześniej nie można było znaleźć, ale ilość danych obrazowych do zbadania jest ogromna. Ręczne sprawdzenie wszystkich tych obrazów wymaga znacznego nakładu pracy. DL może przetwarzać duże ilości danych, o ile dostępne są zasoby obliczeniowe, przyspieszając tym samym badania. Konkretny pomiar skuteczności tej metody omówiono w następnym rozdziale. W ten sposób proponowana metoda ma przyczynić się do odkrywania i ochrony geoglifów.

4.3 Przyspieszenie badań

Dzięki temu podejściu DL udało nam się znacząco skrócić czas potrzebny na zbadanie rozmieszczenia nowych geoglifów. Pięć lat zajęło nam zidentyfikowanie i zmapowanie nie tylko geoglifów figuratywnych, ale także liniowych i geometrycznych z obrazów satelitarnych całej Nasca Pampa. Rozdzielczość terenowa tych obrazów satelitarnych wynosi 0,61 m na piksel. Z drugiej strony, w tym badaniu wykorzystaliśmy zdjęcia lotnicze o wysokiej rozdzielczości, o rozdzielczości terenowej 0,1 m na piksel. W związku z tym oczekiwano, że wykonanie tej samej pracy zajmie znacznie więcej czasu niż w przypadku zdjęć satelitarnych. Wprowadzając model DL, byliśmy w stanie drastycznie skrócić ten czas pracy i efektywnie wykorzystać zdjęcia lotnicze o wysokiej rozdzielczości do wykrywania geoglifów. Dokładniej, podejście DL zostało obliczone tak, aby zadanie badania zdjęć lotniczych było około 21 razy szybsze. Oszacowaliśmy czas potrzebny doświadczonemu i kompetentnemu archeologowi na wizualną identyfikację geoglifów. Zdjęcie lotnicze obszaru docelowego składało się z 42 zdjęć o wysokiej rozdzielczości, obejmujących około 9% całkowitego obszaru Nasca Pampa. Archeologowi zajęło 3,5 godziny zidentyfikowanie gołym okiem tylko figuralnych geoglifów na jednym zdjęciu. Gdyby to samo zadanie zostało wykonane dla całej Nasca Pampa, zajęłoby to około 1633 godzin, zgodnie z obliczeniami. Szacujemy jednak, że korzystając z modelu DL dla Nasca Pampa, archeologowi zajmie tylko około 78 godzin wizualna weryfikacja wykrytych kandydatów na geoglify. Dzieje się tak, ponieważ podejście DL upraszcza to zadanie dla archeologa, sprowadzając je do klasyfikowania wykrytych pól BBox na prawdziwie pozytywne i fałszywie pozytywne. Oznacza to, że wprowadzenie DL znacznie skróciło czas i wysiłek archeologów.

4.4 Rozszerzenie do typu reliefowego

Do dalszych zaawansowanych badań geoglifów figuratywnych konieczne jest również zdefiniowanie nowych „elementów” do rozpoznawania geoglifów typu reliefowego. Geoglify typu reliefowego mają cztery podtypy w zależności od różnych metod, za pomocą których zostały utworzone ( rys. 1 ), i różnią się wyglądem w zależności od tekstury gleby, na której są przedstawione. Ważne jest zbadanie, jak te różnice znajdują odzwierciedlenie w cechach danych obrazowych. Wiele geoglifów typu reliefowego znajduje się na zboczach, dlatego zdjęcia lotnicze wykonane z góry nie zawsze są przydatne do wykrywania geoglifów. Oczekuje się, że integracja danych obrazowych geoglifów z danymi topograficznymi uzyskanymi za pomocą LiDAR-u zwiększy wskaźnik wykrywania geoglifów typu reliefowego. Model DL wytrenowany na geoglifach typu liniowego pozwolił nam odkryć dwa geoglify typu reliefowego. Powodem określenia geoglifów typu reliefowego jest fakt, że linie i krzywe w typie reliefowym zostały uznane za „element” typu liniowego w warstwie dosłownej (DL). Potwierdza to, że analiza DL niekoniecznie odpowiada klasyfikacji geoglifów dokonanej przez archeologów i wskazuje na możliwość dalszej klasyfikacji archeologicznej geoglifów typu reliefowego.

4.5 Wnioski

Opracowaliśmy proces DL, który rozwiązuje problemy często pojawiające się w procesie wykrywania obiektów na obrazach archeologicznych. Nasze podejście pozwala DL uczyć się reprezentacji obrazów z lepszą wydajnością generalizacji, umożliwiając odkrycie obiektów, które w przeszłości były trudne do znalezienia. Co więcej, przyspieszając proces badawczy, nasza metoda przyczynia się do rozwoju archeologii, ustanawiając nowy paradygmat, który łączy badania terenowe i sztuczną inteligencję, prowadząc do bardziej efektywnych i skutecznych badań.

Wkład autorów

Konceptualizacja: MS, YL, MH, KN; Analiza formalna: YL, MH; Pozyskiwanie funduszy: MS; Badania: MS, JO; Metodologia: MS, YL, MH, KN; Zarządzanie projektem: MS, TL, MH; Zasoby: MS, YL, JO, MH, KN; Oprogramowanie: KN; Nadzór: MS; Wizualizacja: MS, YL, JO; Pisanie – wersja robocza: MS, YL, MH, KN; Pisanie – recenzja i edycja: MS, YL, JO, MH, KN.

Finansowanie

Badania te zostały dofinansowane przez granty badawcze Japońskiego Towarzystwa Popierania Nauki KAKENHI (nr grantu 20H00041 ) i Uniwersytetu Yamagata YU-COE(S)(S-4) .

Oświadczenie o konflikcie interesów

Autorzy oświadczają, że nie mają żadnych znanych im konkurencyjnych interesów finansowych ani powiązań osobistych, które mogłyby mieć wpływ na pracę przedstawioną w niniejszym artykule.

Podziękowanie

Niniejsze badanie powstało w wyniku współpracy Uniwersytetu Yamagata i IBM Japan. Dziękujemy Masato Abukawie i Taketoshiemu Miyamie za koordynację; Akihisa Sakurai, Hendrik Hamann, Siyuan Lu, Marcus Freitag, Conrad Albrecht, Muneki Yasuda, Atsushi Tanaka, Kevin Vaughn, Kaoru Honda za pomocne sugestie; Yoshimitsu Ccoyllo, Yuichi Matsumoto, Atsushi Yamamoto, Yuko Ito za badania geoglifów.

Załącznik A. Dane uzupełniające

Poniżej przedstawiono dane uzupełniające do tego artykułu:Pobierz: Pobierz dokument Word (273 KB)Komponent multimedialny 1 .

Odniesienia

Wszyscy autorzy wnieśli równy wkład w tę pracę.

 

Masato Sakai, Yiru Lai, Jorge Olano Canales, Masao Hayashi, Kohhei Nomura

https://doi.org/10.1016/j.jas.2023.105777Uzyskaj prawa i treści
Na podstawie licencji Creative Commons
Otwarty dostęp