Metoda syntetycznej kontroli

Wykres liniowy przedstawiający poziom PKB (na osi Y) w kolejnych latach między ok. 1960–1990 (na osi X); zawiera dwie linie, odpowiadające realnemu i syntetycznemu Krajowi Basków, o zbieżnym przebiegu do ok. 1980. W dalszych latach PKB kraju rozwijało się wolniej niż sugeruje porównanie z syntetyczną kontrolą.
Wykres porównujący poziom realnego PKB w Kraju Basków z oszacowanym kontrfaktycznym, syntetycznym stanem gospodarki tego regionu, gdyby nie doszłoby do nasilenia się konfliktu związanego z baskijskim separatyzmem. Wykres opiera się o dane z jednego z pierwszych, głośnych zastosowań metody syntetycznej kontroli, autorstwa zespołu Abadiego i in.[1]

Metoda syntetycznej kontroli (ang. synthetic control method)[a] – quasi-eksperymentalna technika analizy danych obserwacyjnych oparta na konstruowaniu sztucznej grupy porównawczej na podstawie odpowiednio ważonej kombinacji danych z jednostek obserwacyjnych, które były jak najbardziej podobne w podłużnych szeregach czasowych do grupy eksperymentalnej zanim nie została ona poddana wpływowi badanego czynnika. O ile konstrukcja zapewnia funkcjonalny odpowiednik randomizacji grup w klasycznym eksperymencie, o tyle metoda syntetycznej kontroli daje podstawy do przyczynowej interpretacji danych obserwacyjnych. Innymi słowy, pozwala pryncypialnie oszacować, co działoby się z grupą eksperymentalną, gdyby nie wystąpiły rozważane zjawiska – i jaką wywołały one kontrfaktyczną zmianę. Jest to szczególnie użyteczne w przypadku problemów badawczych, w których uzyskanie precyzyjnej odpowiedzi na pytania przyczynowe jest pożądane, ale realizacja klasycznego eksperymentu jest nieetyczna lub niepraktyczna, co jest charakterystyczne dla nauk medycznych i społecznych[2].

Metoda została opisana i zastosowana przez zespół Abadiego m.in. w pracy z 2003 nt. następstw terroryzmu w Kraju Basków[3], i w pracy z 2010 dot. efektywności kalifornijskiej ustawy przeciwdziałającej paleniu tytoniu[4]. Opiera się o elementy technik różnicy w różnicach i dopasowania, wykorzystując obie z nich w uporządkowany sposób, mający na celu uzyskanie jak najbardziej wiarygodnego i nieobciążonego estymatora. W odróżnieniu od tej pierwszej metody, nie wymaga aby żadna poszczególna jednostka obserwacyjna z grupy porównawczej charakteryzowała się dokładnie takim samym przebiegiem zmian jak grupa eksperymentalna[2].

Centralnym wyzwaniem metody jest dobry wybór grupy porównawczej. Abadie i in. wskazują, że ważne jest uwzględnienie nie tylko powierzchownego podobieństwa szeregów czasowych tej grupy z obiektem badania, ale kluczowe jest także przekonujące teoretyczne i strukturalne uzasadnienie tego, że mechanizmy kształtujące oba szeregi są dogłębnie podobne, i że – idealnie – różnią się one generalnie tylko pod względem dobrze wyodrębnionego analizowanego zjawiska. Autorzy zalecają ponadto, aby przetestować odporność preferowanego modelu na zmiany doboru próby poprzez porównanie go z różnego rodzaju alternatywnymi specyfikacjami w roli „placebo”[2].

Syntetyczne grupy kontrolne wykorzystano w rosnącej liczbie zastosowań empirycznych, m.in. do oszacowania kosztów klęsk żywiołowych[5], czy wpływu zabójstwa politycznego na lokalny rynek mieszkaniowy[6].

Przykładowy opis matematyczny

Najprostszy przypadek syntetycznej grupy kontrolnej jest definiowany przez zespół Abadiego jako wektor wag W {\displaystyle W^{*}} dla wektora k {\displaystyle k} zmiennych w grupie eksperymentalnej X 0 = ( k × 1 ) {\displaystyle X_{0}=(k\times 1)} i w grupie porównawczej obejmującej J {\displaystyle J} przypadków, X 1 = ( k × J ) . {\displaystyle X_{1}=(k\times J).} Wektor wag ma wymiary odpowiadające liczbie przypadków, z wartościami pomiędzy 0 a 1 włącznie, i sumuje się do 1, W = ( w 2 , , w J + 1 ) , {\displaystyle W^{*}=(w_{2},\dots ,w_{J+1}),} 0 w j 1 , {\displaystyle 0\leqslant w_{j}\leqslant 1,} w 2 + + w J + 1 = 1. {\displaystyle w_{2}+\dots +w_{J+1}=1.} Wagi wybiera się jako taką wartość W , {\displaystyle W^{*},} która minimalizuje kwadratowe różnice pomiędzy obserwacjami z obu grup:

m = 1 k v m ( X 1 m X 0 m W ) 2 . {\displaystyle \sum _{m=1}^{k}v_{m}(X_{1m}-X_{0m}W^{*})^{2}.}

Dodatkowe wagi v m {\displaystyle v_{m}} odzwierciedlają relatywne znaczenie, jakie badacze przypisują dokładnemu dopasowaniu grup pod względem zmiennej m {\displaystyle m} – gdzie czynniki będące przedmiotem badania powinny mieć wysokie wagi.

Uzyskane parametry wykorzystuje się następne w regresji zmiennej objaśnianej, co po przekształceniu pozwala oszacować wielkość jej kontrfaktycznego efektu.

Wykorzystanie możliwie najdłuższych szeregów czasowych do oszacowania ich wzajemnego podobieństwa, i co za tym idzie – wag – zwiększa wiarygodność rezultatu[2].

Uwagi

  1. Pojęcie syntetycznej kontroli jest na ten moment bardzo rzadko przekładane na język polski, i być może najwłaściwsze jest stosowanie angielskiego terminu. Tu użyte tłumaczenie występuje w niezidentyfikowanym „Słowniczku” Banku Światowego; tłumaczenie raportu KE stosuje określenie „syntetyczna grupa kontrolna”.

Przypisy

  1. JensJ. Hainmueller JensJ., AlexisA. Diamond AlexisA., AlbertoA. Abadie AlbertoA., Synth: An R Package for Synthetic Control Methods in Comparative Case Studies, „Journal of Statistical Software”, 42 (1), 2011, s. 1–17, DOI: 10.18637/jss.v042.i13, ISSN 1548-7660 [dostęp 2019-03-24]  (ang.).
  2. a b c d AlbertoA. Abadie AlbertoA., AlexisA. Diamond AlexisA., JensJ. Hainmueller JensJ., Comparative Politics and the Synthetic Control Method, „American Journal of Political Science”, 59 (2), 2015, s. 495–510, DOI: 10.1111/ajps.12116, ISSN 1540-5907 [dostęp 2019-03-05]  (ang.).
  3. JavierJ. Gardeazabal JavierJ., AlbertoA. Abadie AlbertoA., The Economic Costs of Conflict: A Case Study of the Basque Country, „American Economic Review”, 93 (1), 2003, s. 113–132, DOI: 10.1257/000282803321455188, ISSN 0002-8282 [dostęp 2019-03-05]  (ang.).
  4. AlbertoA. Abadie AlbertoA., AlexisA. Diamond AlexisA., JensJ. Hainmueller JensJ., Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California’s Tobacco Control Program, „Journal of the American Statistical Association”, 105 (490), 2010, s. 493–505, DOI: 10.1198/jasa.2009.ap08746, ISSN 0162-1459 [dostęp 2019-03-05] .
  5. EduardoE. Cavallo EduardoE. i inni, Catastrophic Natural Disasters and Economic Growth, „The Review of Economics and Statistics”, 95 (5), 2013, s. 1549–1561, DOI: 10.1162/REST_a_00413, ISSN 0034-6535 [dostęp 2019-03-05] .
  6. Pieter A.P.A. Gautier Pieter A.P.A., ArjenA. Siegmann ArjenA., Aico VanA.V. Vuuren Aico VanA.V., Terrorism and attitudes towards minorities: The effect of the Theo van Gogh murder on house prices in Amsterdam, „Journal of Urban Economics”, 65 (2), 2009, s. 113–126, DOI: 10.1016/j.jue.2008.10.004 [dostęp 2019-03-05]  (ang.).