Wstęp

Zaburzenia ze spektrum autyzmu (ASD) to zaburzenie neurorozwojowe charakteryzujące się deficytami w zakresie komunikacji społecznej, które są związane z ograniczonymi i powtarzalnymi wzorcami zachowań i zainteresowań, które zakłócają jakość życia [ 1 ]. Zaprojektowano wiele interwencji, aby pomóc osobom z ASD i ich rodzinom [ 2 , 3 , 4 ]. Jednakże szeroki zakres interwencji psychospołecznych utrudnia zestawienie i hierarchizację dowodów naukowych potwierdzających skuteczność tych interwencji, co skutkuje niewystarczającym rozpowszechnieniem dowodów naukowych potwierdzających ich skuteczność [ 5 ]. Osoby z ASD są czasami poddawane leczeniu, na które nie ma słabych dowodów empirycznych lub, co jest bardziej dramatyczne, które może skutkować szkodliwymi konsekwencjami [ 6 , 7 ]. Celem niniejszego przeglądu zbiorczego jest przedstawienie wyraźniejszego obrazu skuteczności interwencji psychospołecznych zarówno w przypadku podstawowych, jak i powiązanych objawów ASD.
Opracowano szeroką gamę interwencji psychospołecznych w celu złagodzenia objawów ASD na przestrzeni całego życia i przeprowadzono liczne badania kliniczne w celu sprawdzenia ich skuteczności [ 8 , 9 ]. Pierwszym podejściem interwencyjnym, które zbadano w badaniach klinicznych, były interwencje behawioralne, które opierają się na teoriach uczenia się operanta [ 10 ]. Obiecujące wyniki wstępnych badań klinicznych, w których zastosowano te techniki behawioralne z bardzo dużą intensywnością (określane jako wczesne intensywne interwencje behawioralne; EIBI), doprowadziły do ​​ich szerokiego zastosowania w praktyce klinicznej [ 11 , 12 , 13 ]. W przeciwieństwie do interwencji behawioralnych, interwencje rozwojowe (DEV) opierają się na modelach konstruktywistycznych [ 14 ]. DEV koncentruje się na wspieraniu interakcji społecznych dzieci z innymi podczas codziennych czynności, np. zabawy [ 15 ]. Niedawno pojawiła się nowa kategoria naturalistycznych interwencji behawioralnych (NDBI), która opisuje praktyki zakorzenione zarówno w teorii behawioralnej, jak i rozwojowej [ 16 ]. NDBI wykorzystuje różnorodne techniki behawioralne, które promują pojawianie się umiejętności odpowiednich pod względem rozwojowym w naturalnym środowisku [ 17 ]. Grupy umiejętności społecznych (SSG) to kolejna interwencja psychospołeczna, która otrzymała znaczne wsparcie eksperymentalne [ 18 ]. Prowadzone w grupie, SSG mają na celu poprawę umiejętności społecznych poprzez połączenie zorganizowanego uczenia się zachowań prospołecznych z ćwiczeniami i ćwiczeniami praktycznymi w trakcie sesji i pomiędzy nimi. Poza tym terapię poznawczo-behawioralną (CBT), która wykazała dużą skuteczność w leczeniu objawów różnych schorzeń psychicznych [ 19 ], stosowano również u osób z ASD [ 20 ]. Opierając się na połączeniu zasad nauk behawioralnych i kognitywnych, terapia poznawczo-behawioralna koncentruje się na umiejętnościach radzenia sobie, aby umożliwić jednostkom modyfikację nieprzystosowawczych myśli, emocji i zachowań. W przeciwieństwie do podejść wspomnianych powyżej, Terapia i edukacja dzieci autystycznych i dzieci z zaburzeniami komunikacyjnymi z pokrewnymi zaburzeniami komunikacyjnymi (TEACCH) koncentruje się na kształtowaniu środowiska osób z ASD [ 21 , 22 ]. Program ten został opracowany w celu stworzenia wysoce ustrukturyzowanego środowiska uczenia się, które wykorzystuje względne mocne strony osób z ASD, np. ich umiejętności wizualne. Wreszcie, zamiast treści interwencji, przedmiotem oceny klinicznej u osób z ASD był także sposób porodu. W szczególności w wielu badaniach analizowano skuteczność interwencji za pośrednictwem rodziców (PMI) [ 23 ] i interwencji za pośrednictwem technologii (TECH) [ 24 ].
Jeśli chodzi o ocenę skuteczności leku lub interwencji nielekowej, systematyczne przeglądy i metaanalizy są solidnymi narzędziami usprawniającymi podejmowanie decyzji klinicznych [ 25 ]. Jednakże, jak w przypadku każdego badania eksperymentalnego, badania te również są podatne na niespójności i błędy metodologiczne, co może prowadzić do rozbieżnych wniosków na podstawie kilku przeglądów lub metaanaliz na ten sam temat [ 26 ]. Na przykład dwie metaanalizy dotyczące ASD opublikowane w 2009 r., w których badano skuteczność EIBI w odniesieniu do ilorazu inteligencji, wykazały albo dużą i statystycznie istotną wielkość efektu zbiorczego na korzyść EIBI [ 27 ], albo małą i nieistotną wielkość efektu zbiorczego łączna wielkość efektu [ 28 ]. Te rozbieżności silnie pogłębiają niepewność świadczeniodawców i pacjentów w zakresie wyboru optymalnej strategii terapeutycznej. Przeglądy parasolowe to dodatkowe narzędzia syntezy dowodów, które pojawiły się w ostatnich latach w celu przezwyciężenia ograniczeń metodologicznych metaanaliz [ 29 , 30 ]. Przeglądy parasolowe gromadzą dowody na podstawie dużej ilości informacji, oceniając wiarygodność wielu wyników metaanaliz w spójnych, przejrzystych i powtarzalnych ramach [ 31 ]. W szczególności przeglądy parasolowe mają na celu skierowanie decydentów klinicznych do aktualnych najlepszych dowodów istotnych dla konkretnej decyzji [ 32 ].
Celem niniejszego badania było przeprowadzenie ogólnego przeglądu, który dostarczył dodatkowych dowodów na skuteczność interwencji psychospołecznych zarówno w przypadku podstawowych, jak i powiązanych objawów ASD. Przeprowadziliśmy algorytmiczną ocenę wiarygodności dowodów potwierdzających skuteczność różnych interwencji psychospołecznych, stosując obiektywne, przejrzyste i powtarzalne kryteria. Krytycznie oceniliśmy także metodologię zastosowaną w metaanalizach, aby skierować czytelników do najlepszych dowodów. Równolegle stworzyliśmy interaktywny zasób online o otwartym dostępie, który zawiera wszystkie zebrane przez nas informacje i wszystkie wyniki wygenerowane na potrzeby tego ogólnego przeglądu (baza danych Interwencje oparte na faktach w przypadku autyzmu: badania kliniczne [EBIA-CT]: https: //www.ebiact-database.com ). Podsumowując, celem niniejszej pracy było zapewnienie bardziej wiarygodnego i dostępnego źródła informacji opartych na dowodach na temat skuteczności interwencji psychospołecznych u osób z ASD [ 33 , 34 ].

Metody

Strategia wyszukiwania i kryteria kwalifikowalności

Zgłaszanie tego przeglądu zbiorczego było zgodne z wytycznymi Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA) [ 35 ], a jego zakończenie było zgodne z najnowszymi wytycznymi dotyczącymi przeglądów parasolowych [ 36 , 37 ]. Ta recenzja zbiorcza została wcześniej zarejestrowana w PROSPERO (ID CRD42020212630). Pełna lista kontrolna PRISMA i odstępstwa od protokołu są dostępne online (odpowiednio tabele uzupełniające  S1 i S2 ).
Dwóch autorów (CJG i AC) przeszukało pięć baz danych (Medline, EMBASE, CENTRAL, CINAHL i PsycINFO) do 1 października 2021 r., używając terminów wyszukiwania związanych z dwoma konstruktami: ASD i przeglądem systematycznym. Zastosowano adaptacje wcześniej zatwierdzonych filtrów wyszukiwania opracowanych przez zespoły Hedges w celu wyszukiwania przeglądów systematycznych i metaanaliz (patrz pełne strategie w tekście uzupełniającym S 3 ) [ 38 , 39 , 40 , 41 ]. Nie wprowadzono żadnych ograniczeń ze względu na język lub datę publikacji. Tytuły i streszczenia sprawdzano niezależnie, a w przypadku artykułów uznanych za kwalifikujące się pobierano pełne teksty i niezależnie oceniano je pod kątem uwzględnienia w analizach końcowych. Starszy autor (RD) rozwiązał konflikty między CJG i AC. Przeszukano także odniesienia w zawartych artykułach.
Do przeglądu uwzględniliśmy przeglądy systematyczne połączone z metaanalizą co najmniej dwóch kontrolowanych badań klinicznych (CCT), w których oceniano skuteczność interwencji psychospołecznych w leczeniu objawów ASD u uczestników z ASD. Przegląd uznawano za systematyczny, jeśli został oznaczony jako taki lub jeśli przeszukiwanie naukowych baz danych przeprowadzono w połączeniu z wyraźnymi kryteriami włączenia/wyłączenia. Definicja ASD była zgodna z definicją używaną przez głównych autorów i była zgodna z Podręcznikiem Diagnostic and Statistical of Mental Disorders (DSM)-III, DSM-IV, DSM-IV-TR, DSM-5, International Classification of Diseases (ICD)− 9 lub ICD-10. Nie istniały żadne kryteria wykluczające dotyczące wieku uczestników. Metaanalizy skupiające się na tym samym rodzaju interwencji i tym samym wyniku, ale w różnych grupach wiekowych (dzieci w wieku przedszkolnym: średni wiek od 0 do 5 lat; dzieci w wieku szkolnym: średni wiek od 6 do 12 lat) lat; młodzież: średni wiek od 13 do 19 lat; dorośli: średni wiek > = 20 lat). Uwzględniliśmy metaanalizy zarówno randomizowanych, jak i nierandomizowanych badań kontrolowanych (odpowiednio RCT i NRCT), ponieważ przewidywaliśmy, że wiele interwencji nie zostało ocenionych w RCT. Obawialiśmy się, że synteza dowodów wyłącznie z RCT może prowadzić do niepełnego obrazu skuteczności interwencji psychospołecznych u osób z ASD. Przeprowadzono jednak analizę wrażliwości ograniczoną do RCT (patrz wyniki uzupełniające S 2.A ).
Na podstawie kilku przełomowych podręczników [ 3 , 4 , 42 , 43 ] sklasyfikowaliśmy interwencję jako psychospołeczną, jeśli oceniamy skuteczność: (i) EIBI, (ii) NDBI, (iii) DEV, (iv) SSG, (v) PMI, (vi) CBT, (vii) TECH i (viii) TEACCH. Opis każdej z tych interwencji można znaleźć na stronie https://ebiact-database.com/interventions.html . Wykluczono metaanalizy, w których połączono badania oceniające skuteczność co najmniej dwóch rodzajów interwencji. Wyjątek zrobiono dla PMI i TECH, ponieważ tego typu interwencje skupiały się bardziej na sposobach dostarczania niż na treści, a także dlatego, że czytelnicy mogą być szczególnie zainteresowani metodą zastosowaną do realizacji interwencji, niezależnie od konkretnego rodzaju zastosowanego podejścia. Czytelnicy powinni jednak mieć świadomość, że PMI i NDBI/DEV w znacznym stopniu pokrywają się, ponieważ rodzice są zazwyczaj w dużym stopniu zaangażowani w realizację interwencji w NDBI i DEV. W tym badaniu nie uwzględniono metaanaliz interwencji farmakologicznych, terapii zajęciowych, medycyny komplementarnej i alternatywnej ani interwencji związanych ze stylem życia.
Trzy z ośmiu wcześniej określonych wyników bezpośrednio dotyczyły podstawowych objawów ASD: (i) ogólne nasilenie objawów ASD, (ii) deficyt komunikacji społecznej oraz (iii) restrykcyjne/powtarzające się zachowania lub zainteresowania. Rozważaliśmy także pięć dodatkowych wyników związanych z głównymi cechami uderzająco powiązanymi z objawami ASD: (iv) globalne zdolności poznawcze (iloraz inteligencji, IQ), (v) zachowania adaptacyjne, (vi) ekspresyjne umiejętności językowe, (vii) receptywne umiejętności językowe, oraz (viii) destrukcyjne zachowania związane z ASD. Kompleksowo wyodrębniliśmy dane ze wszystkich metaanaliz, gdy w konkretnych artykułach podano kilka niezależnych metaanaliz oceniających skuteczność tej samej interwencji w odniesieniu do tego samego wyniku klinicznego. Wznowiliśmy te metaanalizy do unikalnej łącznej wielkości efektu, stosując standardowe procedury agregacji (opisane szerzej w sekcji dotyczącej analizy danych poniżej). Wyniki każdej indywidualnej metaanalizy przedstawiono w wynikach uzupełniających S 2.C.
Aby poradzić sobie z nakładającymi się metaanalizami, tj. dwoma niezależnymi raportami oceniającymi skuteczność podobnych interwencji na równoważnych próbach i wynikach, najpierw wybraliśmy wszystkie nakładające się metaanalizy, które zostały opublikowane po 1 stycznia 2016 r., a następnie wybraliśmy metaanalizę z najwyższa jakość metodologiczna (patrz ekstrakcja danych poniżej). Zgodność pomiędzy wszystkimi pokrywającymi się metaanalizami została oceniona w analizie wrażliwości (wyniki uzupełniające S 2.B ). Co więcej, znaleźliśmy kilka metaanaliz dotyczących marki lub konkretnej interwencji, np. metaanalizę modelu Early Start Denver Model, choć dostępne były także bardziej wszechstronne metaanalizy dotyczące tego samego rodzaju interwencji, np. metaanaliza połączenie kilku NDBI. W tych przypadkach faworyzowaliśmy bardziej wszechstronną metaanalizę, ale wyniki nazwy marki lub konkretnej interwencji opisaliśmy w wynikach uzupełniających S 2.B.

Ekstrakcja danych

W przypadku każdego badania zgłoszonego w metaanalizie dwie pary autorów (CJG i AC lub CJG i BCM) niezależnie wyodrębniły informacje dotyczące uczestników (liczba uczestników, ich średni wiek lub przedział wiekowy, ich średni całkowity IQ [werbalny i niewerbalny IQ lub iloraz rozwoju zastosowano jako wskaźniki zastępcze, gdy całkowity IQ nie był dostępny], całkowity zakres IQ i stosunek płci); interwencje (projekt badania, podtyp interwencji, wykorzystanie pomocy/mediacji podczas interwencji, miejsce interwencji [np. klinika], rodzaj lekarza przeprowadzającego interwencję [np. pedagog], średnia liczba godzin interwencji w tygodniu i średni czas trwania prób w miesiącach); wyniki (kategoria wyniku [np. poprawa całkowitego IQ], metoda zastosowana do oceny wyniku [np. kwestionariusz] i nazwa narzędzia); projektowanie badań (NRCT vs. RCT); rodzaj grupy kontrolnej (tradycyjne leczenie, eklektyczna, lista oczekujących/opóźniona lub aktywna kontrola); ryzyko stronniczości; oraz wielkość efektu (metryki wielkości efektu, wartość i 95% przedział ufności, błąd standardowy lub wariancja).
Do oceny jakości metodologicznej każdej metaanalizy zawartej w analizach pierwotnych wykorzystano narzędzie AMSTAR-2 [ 44 ]. Punktacja została dokonana niezależnie przez dwie pary autorów (CJG i AC lub CJG i BCM). Aby wybrać metaanalizę o najwyższej jakości metodologicznej w przypadku nakładania się, zastosowano pięć podstawowych kryteriów AMSTAR-2: obecność projektu badawczego apriorycznego, jakość cech wyszukiwania, niezależność w wyborze badań i ekstrakcji danych oraz ocena ryzyka stronniczości w poszczególnych badaniach.

Analiza danych

Wszystkie analizy przeprowadzono w środowisku R (wersja 4.1.1) z wykorzystaniem pakietu „metaumbrella” [ 45 ]. Ponownie przeanalizowaliśmy każdą metaanalizę, stosując model efektów losowych z ograniczonym estymatorem największej wiarygodności, który był zgodny z metodami stosowanymi w poprzednich przeglądach zbiorczych [ 46 , 47 ]. W oryginalnych badaniach podawano średnią różnicę (MD), surową standaryzowaną różnicę średnią lub skorygowaną o błędy systematyczne średnią różnicę (SMD). Systematycznie konwertowaliśmy MD i surową standaryzowaną średnią różnicę na SMD, tak aby wszystkie wyniki przedstawiono w podobnej metryce, aby ułatwić interpretację. Co więcej, w razie potrzeby odwracano kierunek efektu, tak aby pozytywny SMD systematycznie odzwierciedlał poprawę, tj. redukcję objawów lub poprawę kompetencji. Gdy badania CCT uwzględnione w metaanalizach zgłaszały wiele wyników lub wiele niezależnych podgrup, stosowaliśmy standardowe podejście agregujące [ 48 ]. Kiedy wyjątkową grupę porównano z dwiema różnymi grupami (np. dwie grupy eksperymentalne w porównaniu z jedną grupą kontrolną), konserwatywnie założono, że uzyskana wielkość efektu pochodzi od tych samych uczestników.
Niespójność oceniano za pomocą statystyki I². Obliczono 95% przedział przewidywania, aby określić prawdopodobny zakres, w którym spodziewana jest wielkość efektu przyszłych badań. Małe efekty badawcze, tj. tendencja najmniejszych badań do raportowania znacznie wyższych szacunków wielkości efektu w porównaniu z największymi badaniami, zbadano za pomocą testu asymetrii regresji Eggera [ 49 , 50 ].

Ocena wiarygodności materiału dowodowego

Zgodnie z poprzednimi przeglądami zbiorczymi [ 51 , 52 , 53 ], oceniliśmy wiarygodność dowodów dotyczących skuteczności każdej interwencji w odniesieniu do każdego wyniku, dzieląc je na pięć klas porządkowych, stosując podejście algorytmiczne: przekonująca (klasa I), wysoce sugestywna (klasa II) , sugestywne (klasa III), słabe (klasa IV) i nieistotne (klasa ns; tabela  1 ). Należy zauważyć, że celem tej analizy nie było stworzenie hierarchii prowadzącej do zaleceń dotyczących leczenia. Zamiast tego celem było podsumowanie wielu wyników statystycznych w jeden złożony wynik, który ujął kluczowe wnioski z każdej metaanalizy. Kryteria zaczerpnięto z dwóch systemów klasyfikacji, które zwykle są stosowane w przeglądach parasolowych i które zostały zaadaptowane do konkretnych celów tego badania (tabela  1 ) [ 31 , 54 ]. Obecność „małych efektów badania” wskazywano, jeśli wartość p testu regresji Eggera wynosiła ≤0,05. Badanie uznawano za obarczone niskim ryzykiem stronniczości, jeśli zastosowano projekt RCT, a ryzyko wykrycia wyniku było niskie. Ponownie przeprowadziliśmy ocenę wiarygodności dowodów, zachowując jedynie badania o niskim ryzyku stronniczości w analizie wrażliwości, aby ocenić solidność klas przypisanych w analizie pierwotnej.
Tabela 1 Kryteria stosowane do stratyfikacji dowodów.
Dostępność danych i kodów
Dodatkowe informacje na temat wyników, kod R wspierający analizę danych oraz surowe dane są udostępniane publicznie ( https://corentinjgosling.github.io/MP_2022_EBIACT_PSYCHOSOCIAL ).

Utworzenie bazy danych EBIA-CT

Zbudowaliśmy ogólnodostępną, interaktywną bazę danych, która wyświetla informacje o wynikach metaanaliz i informacje zebrane na temat CCT w celu rozpowszechniania danych wygenerowanych podczas tego ogólnego przeglądu. Zebrane przez nas informacje na temat wielkości efektu, uczestników, interwencji i ryzyka błędu systematycznego w przypadku CCT są dostępne w bazie danych. Jeśli podano zakres wieku i/lub zakres IQ, ale średni wiek i/lub średnie IQ były nieznane, przypisywaliśmy średnią jako równą medianie zgłaszanego zakresu. Niektóre CCT opisano w kilku metaanalizach ze względu na nakładające się metaanalizy. W tej sytuacji systematycznie faworyzowaliśmy informacje zebrane w metaanalizie zachowane w analizie pierwotnej. Jeżeli w głównej metaanalizie nie było jakiejś informacji, ale była ona obecna w innej metaanalizie, informację tę stosowano jako substytut. Wszystkie wyniki analiz statystycznych przeprowadzonych na potrzeby niniejszego badania zostały uwzględnione w bazie danych. Co więcej, wszystkie informacje zebrane na temat CCT dotyczące uczestników, interwencji i ryzyka błędu systematycznego zostały uśrednione na poziomie metaanalizy i wyświetlone w bazie danych (przeprowadzono średnią ważoną liczby uczestników na CCT). Ta baza danych będzie aktualizowana co najmniej raz w roku przez następne pięć lat przy użyciu tej samej metodologii, jaką opisano w tym manuskrypcie.

Wyniki

W ramach naszego systematycznego przeglądu początkowo zidentyfikowaliśmy łącznie 7493 raporty (ryc.  1 ). Spośród tych raportów 96 pobrano do badania pełnotekstowego, a 44 uznano za kwalifikujące się do tego badania (patrz tabele uzupełniające  S4 i S5 , aby zapoznać się z listą badań włączonych i wykluczonych wraz z przyczynami wykluczenia). W tych 44 raportach przedstawiono 128 metaanaliz (1488 szacunków wielkości efektu), które opierały się na ponad 190 niezależnych CCT. Metaanalizy podzielono systematycznie na osiem podtypów interwencji: EIBI ( n  = 36), NDBI ( n  = 28), PMI ( n  = 20), TECH ( n  = 16), SSG ( n  = 15), TEACCH ( n  = 7), DEV ( n  = 4) i CBT ( n  = 2). Rozważaliśmy osiem wyników związanych z poprawą deficytu komunikacji społecznej ( n  = 36), deficytu języka ( n  = 33), ogólnych zdolności poznawczych ( n  = 18), ogólnego nasilenia objawów ASD ( n  = 16), zachowań adaptacyjnych ( n  = 15 ), zachowania destrukcyjne ( n  = 7) oraz zachowania ograniczone i powtarzalne ( n  = 3). Zachowaliśmy tylko najnowsze i rygorystyczne metaanalizy, jak opisano w sekcji Metody. Zatem 46 metaanaliz pochodzących z 18 raportów uwzględniono w ostatecznej analizie po odrzuceniu nakładających się metaanaliz.
Ryc. 1: Diagram PRISMA przedstawiający wyniki selekcji badań.

Rysunek ten wizualnie podsumowuje proces selekcji. Bardziej szczegółowe informacje na temat przyczyn wykluczenia można znaleźć w materiałach uzupełniających.

Opis metaanaliz zawartych w analizie pierwotnej

Spośród 46 niepokrywających się metaanaliz wybranych w analizie pierwotnej osiem pochodziło z raportów spełniających „wysoki” poziom jakości metodologicznej według narzędzia AMSTAR-2, natomiast pozostałe metaanalizy uzyskano z raportów o „krytycznie niski” poziom jakości (wyniki uzupełniające S 1.B ). Głównymi czynnikami powodującymi obniżenie ocen jakości był brak listy badań wykluczonych wraz z podaniem przyczyn wykluczenia, wcześniejszej rejestracji lub wszechstronnego przeszukania literatury (w szczególności ze względu na ograniczenie do artykułów napisanych w języku angielskim) ). Mediana liczby CCT na metaanalizę wyniosła sześć (rozstęp międzykwartylowy, IQR = [2, 10]), mediana liczby uczestników na metaanalizę wyniosła 238 (IQR = [68, 409]), a mediana liczby uczestników Wyniki oceniane dla każdego rodzaju interwencji wynosiły pięć, od jednego do ośmiu. Najczęściej badanym wynikiem było zmniejszenie objawów komunikacji społecznej. Redukcja ograniczonych i powtarzalnych zachowań była najmniej badanym wynikiem i była celem jedynie w metaanalizach, które badały skuteczność NDBI i SSG.
Ponad połowa metaanaliz (24/46) wykazała, że ​​uczestnicy grup eksperymentalnych osiągnęli znacznie lepsze wyniki w porównaniu z uczestnikami grup kontrolnych (tj. wartość p łącznej wielkości efektu < 0,05). Sześć z tych 24 statystycznie istotnych metaanaliz miało zbiorczą wielkość efektu powiązaną z wartością p mniejszą od 1e-06, 13 zostało potwierdzonych istotnym efektem badania o najniższej wariancji, a dziewięć miało 95% przedział przewidywania, który wykluczono wartość zerową. Jeśli chodzi o wielkość efektu, w 19 metaanalizach (41%) łączna wielkość efektu była umiarkowana do dużej (SMD >= 0,50). Jednakże łącznie 12 uwzględnionych przez nas metaanaliz ( 26% ) wykazało umiarkowaną lub dużą niespójność (statystyki I² były wyższe niż 50%), a efekty małych badań zaobserwowaliśmy także w przypadku sześciu metaanaliz (13%). Wreszcie, średnio 20% uczestników w każdej metaanalizie zostało włączonych do badań charakteryzujących się „niskim ryzykiem błędu systematycznego”. Dlatego większość uczestników uwzględnionych w metaanalizach, które rozważaliśmy, nie została losowo przydzielona do grup ani nie została poddana ślepej ocenie.

Wiarygodność dowodów

Jeśli chodzi o podstawowe objawy ASD, jak pokazano na ryc.  2 , wszystkie testy EIBI, NDBI, DEV i PMI wykazały skuteczność w komunikacji społecznej u dzieci w wieku przedszkolnym, popartą sugestywnymi dowodami (klasa III; wyniki uzupełniające S 1.C ). Skuteczność SSG w zakresie komunikacji społecznej i ogólnych objawów ASD u dzieci i młodzieży w wieku szkolnym została również poparta sugestywnymi dowodami. Skuteczność wszystkich innych interwencji w zakresie ogólnych objawów ASD, deficytów komunikacji społecznej lub ograniczonych/powtarzających się zachowań została potwierdzona albo słabymi, albo nieistotnymi dowodami (klasa IV lub klasa ns). Jeśli chodzi o umiejętności językowe, pomimo stosunkowo dużej liczby metaanaliz oceniających skuteczność interwencji psychospołecznych w odniesieniu do tych wyników (umiejętności receptywne: n  = 6 i umiejętności ekspresyjne: n  = 6), tylko dwie interwencje zostały poparte słabymi dowodami: EIBI wykazały znaczną łączną wielkość efektu zarówno w języku ekspresyjnym, jak i receptywnym, a NDBI w języku ekspresyjnym. Wszystkie inne interwencje dotyczące umiejętności językowych zostały poparte nieistotnymi dowodami. Jeśli chodzi o stan funkcjonalny (IQ i zachowania adaptacyjne), te dwa wyniki badano prawie wyłącznie u dzieci w wieku przedszkolnym, u których badanie EIBI wykazało sugestywne dowody zarówno dotyczące zachowań adaptacyjnych, jak i IQ. W przypadku wszystkich pozostałych interwencji dowody dotyczące tych wyników były albo słabe, albo nieistotne. Wreszcie, tylko PMI wykazało statystycznie istotną łączną wielkość efektu w przypadku zachowań destrukcyjnych, z wysoce sugestywnymi dowodami dotyczącymi dzieci we wczesnym wieku szkolnym. Metaanalizy oceniające skuteczność EIBI, NDBI, TECH i SSG nie osiągnęły istotności statystycznej w zakresie zachowań destrukcyjnych.
Ryc. 2: Wykres leśny przedstawiający zbiorczą wielkość efektu dla każdego rodzaju interwencji i wyniku, które uwzględniliśmy w przeglądzie zbiorczym.

Wyświetlane są niektóre cechy metaanaliz: średni wiek (lata = lata), klasa, wielkość próby (N) i ryzyko błędu systematycznego (RoB; Niskie = ponad 75% uczestników brało udział w badaniach o niskim ryzyku stronniczość; Średnie = 50% do 75% uczestników brało udział w badaniach o niskim ryzyku stronniczości; Wysokie = mniej niż 50% uczestników brało udział w badaniach o niskim ryzyku stronniczości).

Analizy wrażliwości

Pierwsza analiza wrażliwości ograniczona do badań o niskim ryzyku błędu systematycznego wykazała, że ​​tylko jedna trzecia ( n  = 15) z 46 metaanaliz uwzględnionych w naszej analizie pierwotnej obejmowała co najmniej dwie RCT o niskim ryzyku błędu w wykrywaniu. Z tych 15 metaanaliz dwie dostarczyły sugestywnych dowodów (PMI dotyczące zachowań destrukcyjnych i deficytów komunikacji społecznej u dzieci w wieku przedszkolnym), a dwie dostarczyły słabych dowodów (NDBI dotyczące funkcji poznawczych i DEV dotyczące ogólnych objawów ASD u dzieci w wieku przedszkolnym). Skuteczność wszystkich innych interwencji została potwierdzona nieistotnymi dowodami, nawet jeśli dwie z tych nieistotnych metaanaliz miały marginalnie istotną wartość p (wyniki uzupełniające S 2.A ). Jeśli chodzi o wielkość zbiorczych rozmiarów efektu, podczas gdy 41% metaanaliz wykazało w naszej analizie pierwotnej umiarkowaną do dużej wielkość efektu zbiorczego (SMD ≥ 0,50), jedynie w 20% metaanaliz wielkość efektu wynosiła tej wielkości w niniejszej analizie wrażliwości.
Następnie przeprowadziliśmy drugą analizę wrażliwości, w której zebrano metaanalizy wykluczone ze względu na pokrywanie się. Zaobserwowaliśmy, że te nakładające się metaanalizy doprowadziły w większości przypadków do podobnych wniosków, z wyjątkiem EIBI i NDBI, w których wystąpiły bardziej widoczne różnice (Wyniki uzupełniające  2.B ). W przypadku EIBI pierwszy powód rozbieżności w wynikach wiąże się z włączeniem (lub wyłączeniem) badania RCT, w którym porównano grupę EIBI prowadzoną przez profesjonalistów z grupą EIBI prowadzoną przez rodziców. W przeciwieństwie do innych badań uwzględnionych w metaanalizach EIBI, to RCT dostarcza informacji na temat sposobów wdrażania EIBI, a nie na temat skuteczności samej interwencji [ 55 ]. Ponieważ w tym RCT podano bardzo małe rozmiary efektu (jeśli nie na korzyść grupy „interwencyjnej”), metaanalizy obejmujące to badanie zwykle pokazywały mniejsze zbiorcze rozmiary efektów w porównaniu z innymi. Inne przyczyny, które mogą wyjaśniać rozbieżności w wynikach, obejmują stosowanie różnych miar wielkości efektu w celu ilościowego określenia skutków EIBI, np. w niektórych metaanalizach wykorzystywano różnice między grupami po teście, podczas gdy w innych określano ilościowo różnicę między grupami przed i po teście. zmiany, różne kryteria włączenia intensywności interwencji , np. niektóre metaanalizy wymagają minimum 10 godzin tygodniowo, podczas gdy inne wymagają więcej niż 20 godzin tygodniowo, lub różne podejścia do ram czasowych oceny wyniku , np. niektóre metaanalizy priorytetowo traktują oceny przeprowadzane bezpośrednio po interwencji, podczas gdy inni traktują priorytetowo oceny uzupełniające. Warto zauważyć, że gdy powtórzyliśmy naszą pierwotną analizę, ale uwzględniliśmy wszystkie CCT zidentyfikowane we wszystkich metaanalizach EIBI, wyniki pozostały niezmienione. Co więcej, wystąpiły rozbieżności dotyczące NDBI pomiędzy dwoma głównymi raportami metaanalitycznymi, w których oceniano skuteczność tej interwencji w zakresie ogólnych objawów ASD [ 56,57 ] . Pierwsza metaanaliza wykazała skromny, ale znaczący wpływ NDBI na ogólne objawy ASD (SMD = 0,38, wartość p = 0,03), podczas gdy druga wykazała bardzo mały, nieistotny wpływ (SMD = 0,05, p-wartość = 0,75). Badania uwzględnione w tych dwóch metaanalizach nie pokrywały się w pełni i w żadnym z artykułów nie przedstawiono listy badań wykluczonych z ostatecznej analizy. Co ciekawe, w kilku metaanalizach konkretnych programów NDBI, takich jak leczenie odpowiedzi kluczowej lub model Denver o wczesnym rozpoczęciu leczenia, zidentyfikowano pewne badania, które nie zostały wybrane lub zlokalizowane w ramach dwóch głównych metaanaliz NDBI. Dlatego powtórzyliśmy obliczenia, uwzględniając wszystkie CCT zidentyfikowane we wszystkich metaanalizach NDBI. Ostatecznie do tej ponownej analizy włączono łącznie 21 badań, w których oceniano skuteczność NDBI w leczeniu ogólnych objawów ASD u dzieci w wieku przedszkolnym. Metaanaliza efektów losowych ujawniła statystycznie istotną, ale małą zbiorczą wielkość efektu (SMD = 0,22, wartość p = 0,02), a skuteczność potwierdzoną słabymi dowodami.

Dyskusja

W naszym ogólnym przeglądzie opisanym tutaj zbadaliśmy wyniki wygenerowane łącznie przez 128 metaanaliz. W metaanalizach dokonano syntezy dowodów dostarczonych przez ponad 190 unikalnych badań CCT, w których badano skuteczność interwencji psychospołecznych w leczeniu podstawowych i powiązanych objawów ASD. Zaobserwowaliśmy, że znaczna część metaanaliz wykazała umiarkowaną lub dużą wielkość efektu zbiorczego (tj. SMD ≥ 0,50; 41% metaanaliz) i/lub statystycznie istotne wyniki (53% metaanaliz) w na korzyść interwencji psychospołecznych. Zgodnie z kryteriami algorytmicznymi opracowanymi na potrzeby tego przeglądu zbiorczego odkryliśmy, że skuteczność wielu z tych interwencji psychospołecznych została potwierdzona wysoce sugestywnymi (klasa II) lub sugestywnymi (klasa III) dowodami, w zależności od wieku uczestników i rozpatrywanego wyniku . W przypadku dzieci w wieku przedszkolnym wskaźniki EIBI, NDBI, DEV i PMI zostały poparte sugestywnymi dowodami: dotyczącymi zaburzeń komunikacji społecznej, zachowań adaptacyjnych i IQ w przypadku EIBI oraz komunikacji społecznej w przypadku NDBI, PMI i DEV. W przypadku dzieci we wczesnym wieku szkolnym znaleziono wysoce sugestywne dowody na skuteczność PMI w leczeniu zachowań destrukcyjnych. U dzieci w późnym wieku szkolnym i młodzieży znaleziono sugestywne dowody na wpływ SSG na komunikację społeczną i ogólne objawy ASD. Niezależnie od wieku uczestników, żadna interwencja nie wykazała skuteczności uznanej za sugestywną w odniesieniu do ekspresyjnych lub receptywnych umiejętności językowych (EIBI i NDBI wykazały znaczną łączną wielkość efektu, ale były poparte słabymi dowodami) lub powtarzalnych i ograniczonych zachowań (SSG miało znaczny łączny rozmiar efektu poparty słabymi dowodami). Zatem nasze wyniki podkreślają różnorodność podejść psychospołecznych dostępnych dla osób z ASD, a także dowody naukowe potwierdzające skuteczność tych interwencji w zakresie różnych wyników na każdym etapie życia.
Przeprowadzono analizę wrażliwości ograniczoną do RCT, w której osoby oceniające wyniki nie wiedziały o statusie eksperymentalnym, przeprowadzono w celu uzupełnienia naszych głównych wyników i rzucenia światła na dowody uzyskane w badaniach o niskim ryzyku błędu systematycznego. Analiza ta ujawniła, że ​​znaczna część metaanaliz, które wykazały statystycznie istotne wyniki w naszej analizie pierwotnej, obejmowała mniej niż dwa badania o niskim ryzyku błędu systematycznego. Spośród metaanaliz, które obejmowały co najmniej dwie z nich, jedynie PMI, NDBI i DEV nadal zachowały statystycznie istotne (lub marginalnie istotne) wyniki u przedszkolaków w tej analizie wrażliwości. Skuteczność PMI zarówno w odniesieniu do zachowań destrukcyjnych, jak i komunikacji społecznej uznano za sugestywną (klasa III), a skuteczność zarówno NDBI w zakresie funkcji poznawczych, jak i DEV w zakresie ogólnych objawów ASD uznano za słabą (klasa IV). Żadna interwencja nie została oceniona w co najmniej dwóch badaniach o niskim ryzyku stronniczości, przeprowadzonych wśród dzieci, młodzieży i dorosłych w wieku szkolnym.
Co ciekawe, równolegle ze spadkiem istotności statystycznej w naszej analizie wrażliwości, która ograniczała się do RCT ze zaślepionymi osobami oceniającymi wyniki, proporcja rozmiarów efektu, które można uznać za umiarkowane do dużego, była również mniejsza w przypadku tylko RCT o niskim ryzyku błędu wykrywania zostały rozważone. Podczas gdy w analizie głównej 41% metaanaliz charakteryzowało się umiarkowaną do dużej wielkości efektu zbiorczego w analizie głównej, w tej analizie wrażliwości jedynie 20% miało wielkość efektu zbiorczego tej wielkości. Wynik ten może sugerować, że ograniczenie analiz do RCT, w których wyniki były mierzone przez ślepych oceniających, mogło odrzucić duże zbiorcze wielkości efektów pochodzące z stronniczych badań. Należy jednak zauważyć, że poprzez ograniczenie do zaślepionych wyników zmienił się także rodzaj wyników uwzględnionych w metaanalizach. W szczególności zmniejszył się odsetek zgłaszanych wyników, natomiast wzrosła liczba wyników ocenianych za pomocą standardowych testów. Dlatego możliwe jest, że w tej analizie wrażliwości zaobserwowaliśmy zmniejszenie wielkości łącznych rozmiarów efektu, ponieważ interwencje psychospołeczne dają subtelne efekty, które można wykryć w codziennym życiu pacjentów (i dlatego są one ujmowane w raportach informatorów widzących pacjenta na co dzień), ale nie można ich wykryć w bardziej ustrukturyzowanych, mniej ekologicznych ocenach. Przyszłe badania mogą skorzystać na opracowaniu wyników opracowanych specjalnie w celu uchwycenia zmian w badaniach klinicznych i badaniach podłużnych [ 58 ], a także na wdrożeniu nowych metodologii, takich jak chwilowa ocena ekologiczna (EMA) [ 59 ].
Dodatkowym celem naszego badania było zbudowanie interaktywnego zasobu internetowego o otwartym dostępie ( https://www.ebiact-database.com ), który zawiera wszystkie informacje i wyniki, które zebraliśmy i wygenerowaliśmy podczas tego ogólnego przeglądu. Naszym celem było ułatwienie rozpowszechniania wiedzy na temat interwencji psychospołecznych u osób z ASD poprzez zapewnienie ogólnodostępnego źródła informacji opartych na dowodach. Ta baza danych została bezpośrednio zainspirowana podobnym projektem w dziedzinie depresji, tj. bazą danych METAPSY [ 60 ]. Jednak w porównaniu z tą metaanalityczną bazą danych, nasze podejście oparte na przeglądzie parasolowym pozwala dostarczyć kluczowych informacji nie tylko na temat poszczególnych badań, ale także na temat metaanaliz, które są już opublikowane w literaturze. Ta funkcja umożliwia dostarczenie wiarygodnych informacji w oparciu o znaczącą pulę badań, a tym samym oszczędza użytkownikom konieczności samodzielnego przeprowadzania tego łączenia (co może prowadzić do bezsensownego łączenia, co jest dobrze znanym problemem w metaanalizach [ 61 ] ).
Przewidujemy, że zapewniając uprzywilejowany dostęp do wyników literatury naukowej, nasza baza danych pomoże klinicystom być na bieżąco z najnowszymi informacjami naukowymi. Wierzymy również, że ta baza danych będzie przydatna dla badaczy. Zasoby te można wykorzystać jako interfejs umożliwiający łatwe przeprowadzanie przeglądów określających zakres i tym samym identyfikowanie luk w wiedzy na temat interwencji psychospołecznych u osób z ASD. Może to również zwiększyć spójność CCT uwzględnionych w przyszłych metaanalizach, ponieważ badacze będą mieli wygodny dostęp do listy wszystkich CCT uwzględnionych w poprzednich metaanalizach. Wreszcie baza danych będzie przydatna dla badaczy. Planując nowe badania, niewiele zespołów bierze pod uwagę istniejące metaanalizy na swój temat, aby pomóc w wyborze materiałów lub analizie mocy [ 62 , 63 , 64 , 65 ]. W tym względzie wykazano, że duża zmienność narzędzi stosowanych do pomiaru podobnych wyników w obszarze ASD może utrudniać bezpośrednie porównania między badaniami [ 66 ]. Baza danych EBIA-CT umożliwia także identyfikację głównych miar wyników zastosowanych w poprzednich CCT w ciągu kilku minut. Ponieważ ta baza danych zawiera najważniejsze informacje, które można wykorzystać do przeprowadzenia analizy mocy (takie jak szacunkowa zbiorcza wielkość efektu w metaanalizie, jej 95% przedział przewidywań lub wielkość efektu w największym badaniu), będzie ona użyteczna oszacowanie odpowiedniej wielkości próby w nowych badaniach.
Głównym wyborem metodologicznym, jakiego dokonaliśmy podczas opracowywania tego ogólnego przeglądu, była ocena wiarygodności dowodów przy użyciu kryteriów algorytmicznych, a nie ocena jakości tego zbioru dowodów przy użyciu bardziej subiektywnego podejścia, takiego jak gradacja zaleceń, ocena, rozwój i ewaluacje (GRADE). podejście [ 67 , 68 ]. Zgodnie z wytycznymi dotyczącymi przeglądu ogólnego [ 32 ], głównym celem obecnego przeglądu zbiorczego była identyfikacja i ocena wszystkich dowodów uzyskanych w wyniku metaanaliz dotyczących skuteczności interwencji psychospołecznych u osób z ASD, aby wskazać czytelnikom aktualnie najlepsze dowody. Naszym celem nie było opracowanie nowych zaleceń dotyczących leczenia ani wyciągnięcie wniosków na temat porównawczej skuteczności różnych interwencji psychospołecznych. Zamiast tego nasza niezależna od kontekstu, algorytmiczna ocena wiarygodności dowodów miała na celu jedynie syntezę, w postaci unikalnego wskaźnika, dużej ilości informacji na temat wyników każdej metaanalizy, w tym na temat obecności błędu metodologicznego w badaniach pierwotnych, obecności małych wyników badania i niespójności, przy użyciu spójnej i solidnej metody, niezależnie od ocenianych interwencji i wyników. Takie podejście algorytmiczne jest zgodne z wieloma podobnymi zbiorczymi przeglądami metaanaliz badań klinicznych dotyczących zdrowia psychicznego i fizycznego [ 53 , 54 , 69 , 70 , 71 ].
Pierwszym ograniczeniem niniejszej pracy jest brak oceny skuteczności określonych technik interwencyjnych (takich jak podpowiadanie, modelowanie lub wzmacnianie) stosowanych w różnych interwencjach psychospołecznych ocenianych w przeglądzie. Innymi słowy, nie dostarczyliśmy informacji na temat skuteczności każdego „składnika aktywnego” stosowanego w każdym typie interwencji psychospołecznej. Kryteria włączenia do naszego przeglądu systematycznego pozwoliły na identyfikację metaanaliz oceniających skuteczność takich konkretnych technik, ale odnaleziono jedynie metaanalizy pojedynczych badań eksperymentalnych na ten temat, np. metaanalizę przeprowadzoną przez Wanga i współpracowników [ 72 ] Zatem pomimo mocnej konstrukcji CCT, ważnym kierunkiem przyszłych badań jest rozszerzenie tego ogólnego przeglądu na inne projekty badań klinicznych, aby uzyskać szerszy obraz skuteczności interwencji psychospołecznych u osób z ASD. Drugim ograniczeniem naszego badania jest to, że informacje zebrane na poziomie CCT zostały zaczerpnięte z uwzględnionych metaanaliz, a nie bezpośrednio z raportów opisujących CCT. To ograniczenie, które jest nieodłącznie związane z metodą przeglądu parasolowego ze względów wykonalności, czasami prowadzi do niekompletnych informacji na poziomie CCT. Przyszłe aktualizacje bazy danych będą uzupełniać brakujące informacje poprzez rutynowe dostarczanie danych z nowych metaanaliz na ten temat, gdy tylko staną się dostępne.
Podsumowując, niniejszy przegląd zbiorczy potwierdził wcześniejsze ustalenia, które podkreśliły obiecującą rolę interwencji psychospołecznych u osób z ASD. Jednakże potrzebne są dodatkowe, dobrze zaprojektowane RCT, aby uzyskać spójny obraz skuteczności interwencji psychospołecznych w ASD przy wyższym poziomie dowodów. Uzupełniająca ogólnodostępna baza danych zaprojektowana w tym badaniu ułatwi rozpowszechnianie opartej na dowodach wiedzy na temat interwencji psychospołecznych w ASD i przyczyni się do wzmocnienia projektu metodologicznego przyszłych badań klinicznych. Ta baza danych będzie regularnie aktualizowana, aby zapewnić przekazywanie dokładnych informacji na przestrzeni czasu.