Metoda syntetycznej kontroli

Metoda syntetycznej kontroli (ang. synthetic control method)^[a] – quasi-eksperymentalna technika analizy danych obserwacyjnych oparta na konstruowaniu sztucznej grupy porównawczej na podstawie odpowiednio ważonej kombinacji danych z jednostek obserwacyjnych, które były jak najbardziej podobne w podłużnych szeregach czasowych do grupy eksperymentalnej zanim nie została ona poddana wpływowi badanego czynnika. O ile konstrukcja zapewnia funkcjonalny odpowiednik randomizacji grup w klasycznym eksperymencie, o tyle metoda syntetycznej kontroli daje podstawy do przyczynowej interpretacji danych obserwacyjnych. Innymi słowy, pozwala pryncypialnie oszacować, co działoby się z grupą eksperymentalną, gdyby nie wystąpiły rozważane zjawiska – i jaką wywołały one kontrfaktyczną zmianę. Jest to szczególnie użyteczne w przypadku problemów badawczych, w których uzyskanie precyzyjnej odpowiedzi na pytania przyczynowe jest pożądane, ale realizacja klasycznego eksperymentu jest nieetyczna lub niepraktyczna, co jest charakterystyczne dla nauk medycznych i społecznych^[2].

Metoda została opisana i zastosowana przez zespół Abadiego m.in. w pracy z 2003 nt. następstw terroryzmu w Kraju Basków^[3], i w pracy z 2010 dot. efektywności kalifornijskiej ustawy przeciwdziałającej paleniu tytoniu^[4]. Opiera się o elementy technik różnicy w różnicach i dopasowania, wykorzystując obie z nich w uporządkowany sposób, mający na celu uzyskanie jak najbardziej wiarygodnego i nieobciążonego estymatora. W odróżnieniu od tej pierwszej metody, nie wymaga aby żadna poszczególna jednostka obserwacyjna z grupy porównawczej charakteryzowała się dokładnie takim samym przebiegiem zmian jak grupa eksperymentalna^[2].

Centralnym wyzwaniem metody jest dobry wybór grupy porównawczej. Abadie i in. wskazują, że ważne jest uwzględnienie nie tylko powierzchownego podobieństwa szeregów czasowych tej grupy z obiektem badania, ale kluczowe jest także przekonujące teoretyczne i strukturalne uzasadnienie tego, że mechanizmy kształtujące oba szeregi są dogłębnie podobne, i że – idealnie – różnią się one generalnie tylko pod względem dobrze wyodrębnionego analizowanego zjawiska. Autorzy zalecają ponadto, aby przetestować odporność preferowanego modelu na zmiany doboru próby poprzez porównanie go z różnego rodzaju alternatywnymi specyfikacjami w roli „placebo”^[2].

Syntetyczne grupy kontrolne wykorzystano w rosnącej liczbie zastosowań empirycznych, m.in. do oszacowania kosztów klęsk żywiołowych^[5], czy wpływu zabójstwa politycznego na lokalny rynek mieszkaniowy^[6].

Przykładowy opis matematyczny

Najprostszy przypadek syntetycznej grupy kontrolnej jest definiowany przez zespół Abadiego jako wektor wag $W^{*}$ dla wektora $k$ zmiennych w grupie eksperymentalnej $X_{0}=(k\times 1)$ i w grupie porównawczej obejmującej $J$ przypadków, $X_{1}=(k\times J).$ Wektor wag ma wymiary odpowiadające liczbie przypadków, z wartościami pomiędzy 0 a 1 włącznie, i sumuje się do 1, $W^{*}=(w_{2},\dots ,w_{J+1}),$ $0\leqslant w_{j}\leqslant 1,$ $w_{2}+\dots +w_{J+1}=1.$ Wagi wybiera się jako taką wartość $W^{*},$ która minimalizuje kwadratowe różnice pomiędzy obserwacjami z obu grup:

\sum _{m=1}^{k}v_{m}(X_{1m}-X_{0m}W^{*})^{2}.

Dodatkowe wagi $v_{m}$ odzwierciedlają relatywne znaczenie, jakie badacze przypisują dokładnemu dopasowaniu grup pod względem zmiennej $m$ – gdzie czynniki będące przedmiotem badania powinny mieć wysokie wagi.

Uzyskane parametry wykorzystuje się następne w regresji zmiennej objaśnianej, co po przekształceniu pozwala oszacować wielkość jej kontrfaktycznego efektu.

Wykorzystanie możliwie najdłuższych szeregów czasowych do oszacowania ich wzajemnego podobieństwa, i co za tym idzie – wag – zwiększa wiarygodność rezultatu^[2].

Uwagi

↑ Pojęcie syntetycznej kontroli jest na ten moment bardzo rzadko przekładane na język polski, i być może najwłaściwsze jest stosowanie angielskiego terminu. Tu użyte tłumaczenie występuje w niezidentyfikowanym „Słowniczku” Banku Światowego; tłumaczenie raportu KE stosuje określenie „syntetyczna grupa kontrolna”.

Przypisy

↑ JensJ. Hainmueller JensJ., AlexisA. Diamond AlexisA., AlbertoA. Abadie AlbertoA., Synth: An R Package for Synthetic Control Methods in Comparative Case Studies, „Journal of Statistical Software”, 42 (1), 2011, s. 1–17, DOI: 10.18637/jss.v042.i13, ISSN 1548-7660 [dostęp 2019-03-24] (ang.).
↑ ^a ^b ^c ^d AlbertoA. Abadie AlbertoA., AlexisA. Diamond AlexisA., JensJ. Hainmueller JensJ., Comparative Politics and the Synthetic Control Method, „American Journal of Political Science”, 59 (2), 2015, s. 495–510, DOI: 10.1111/ajps.12116, ISSN 1540-5907 [dostęp 2019-03-05] (ang.).
↑ JavierJ. Gardeazabal JavierJ., AlbertoA. Abadie AlbertoA., The Economic Costs of Conflict: A Case Study of the Basque Country, „American Economic Review”, 93 (1), 2003, s. 113–132, DOI: 10.1257/000282803321455188, ISSN 0002-8282 [dostęp 2019-03-05] (ang.).
↑ AlbertoA. Abadie AlbertoA., AlexisA. Diamond AlexisA., JensJ. Hainmueller JensJ., Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California’s Tobacco Control Program, „Journal of the American Statistical Association”, 105 (490), 2010, s. 493–505, DOI: 10.1198/jasa.2009.ap08746, ISSN 0162-1459 [dostęp 2019-03-05] .
↑ EduardoE. Cavallo EduardoE. i inni, Catastrophic Natural Disasters and Economic Growth, „The Review of Economics and Statistics”, 95 (5), 2013, s. 1549–1561, DOI: 10.1162/REST_a_00413, ISSN 0034-6535 [dostęp 2019-03-05] .
↑ Pieter A.P.A. Gautier Pieter A.P.A., ArjenA. Siegmann ArjenA., Aico VanA.V. Vuuren Aico VanA.V., Terrorism and attitudes towards minorities: The effect of the Theo van Gogh murder on house prices in Amsterdam, „Journal of Urban Economics”, 65 (2), 2009, s. 113–126, DOI: 10.1016/j.jue.2008.10.004 [dostęp 2019-03-05] (ang.).