본문 바로가기

잡다하게

인과분석에 대한 다양한 접근들

사회과학과 통계학 (최근에는 컴퓨터공학도 가세)에서 인과를 다루는 방법은 여러가지가 있다. 경제학의 한 분야인 Econometrics, 통계학의 Causal Inference 등. 내 제한적 관찰에 의하면 이 두 분야만큼 크지는 않지만 Structural Equation Modeling (SEM)이나 Causal Diagram (컴퓨터과학자 Judea Pearl이 밀고 있는) 등도 있다. 대학원 2학년 말쯤에 통계학에서도 Causal Inference를 계량경제학과 좀 다른 관점에서 다룬다는 것을 알게 되었는데, 최근에 갑자기 더 그 차이가 궁금해져서 이것 저것 찾아보았다. 역시 이미 내가 고등학교를 막 졸업했을 때에 이 동네에서는 신나게 이것을 두고 논쟁을 했었었다. 다시 나의 제한적 관찰에 의한 인상 비평을 하자면,

 

1. 바이오스탯, 역학이나 또는 응용통계학에서의 Causal Inference는 Neyman-Rubin Causal model을 기반으로 하고 있다. Rubin의 1972년 논문과 더 올라가면 Neyman의 1923년 논문이 사람들이 이야기하는 출발점, 또는 시조.

 

2. 계량경제학에서의 인과분석은 Heckman and Pinto (2013)에 의하면, Haavelmo (1943)가 그 출발점이라고. 경제학 모델과 데이터의 결합이라는 점에서 Structural estimation, 또는 경제학 모델과 coherent한 인과분석의 시초라고 할 수 있을 것임. (tmi: 필자가 몸 담고 있는 분야이기도)

 

3. 상대적으로 최근에 Judea Pearl이라는 학자는 Causal Diagram이라는 독특한 어프로치를 만들어서 루빈 계열 Causal Inference에 counterfactual을 더하려고 하는듯 함. 이 어프로치를 쉽게 말하자면 (토폴로지의) 그래프 를 통해서 인과의 방향을 더해주는 것임.


4. Heckman and Pinto (2013)는 통계학 + Pearl의 어프로치를 매우 강하게 비판하는데, 포인트를 요약하자면 (1) Pearl의 방법에서 할 수 있는거 모두 Haavelmo (1943)에서 할 수 있을 뿐더러, Pearl의 방법론은 기본적인 확률론과 통계학 기반으로 하고 있지 않다. 따라서 필요 없다 -_-; (2) Rubin 계열 모델은 Causality의 정의와 identification을 혼동하고 있다.

 

 

나의 짧은 감상은, -확실히 Pearl의 방법론은 경제학 모델 + 칼리브레이션, 또는 모델 기반 에스티메이션에 비해 우월한 점이 뭔지 잘 모르겠다. 그냥 이해하기 쉬운 간단한 모델이지만, 그 이해하기 쉬운만큼 counterfactual을 했을때 extrapolation이 얼마나 현실적일지 의문이 든다. 이미 미시경제학 모델은 충분한 시간에 거쳐서 발달해왔다. 굳이 이런 잘 발달된 모델들을 두고 훨씬 단순하면서 엄밀하지않은 Pearl의 접근을 차용할 유인이 있을까?  그의 책 "book of why"를 한번 사서 보고싶었는데, 여기서 말한 내용이 전부라면 굳이 안읽어도 될듯. 실제로 이것이 전부일 가능성이 높은 것 같다. - Rubin 계열 모델에 대한 헤크먼의 코멘트는 너무 harsh해서 사실 좀 갸웃하다.

 

Roy Model을 그렇게 제너럴하게 해석하는 것도 그렇고. 나중에 내가 시간 됬을때 직접 그 루빈 모델을 차용한 연구들을 읽어보고 판단할 일. - 헤크먼님 무섭; 물론 그의 관점이 모든 계량경제학의 관점을 대표하는 것은 아니다. 계량경제학 대가 Imbens는 Rubin의 공저자이기도 하고. 헤크먼과 상당히 다른 관점을 보여준다. - 모델을 데이터분석에 접목시킨 점에서 Haavelmo 1943은 classic인것 같다.  나중에 시간 나면 Tinbergen과 더불어서 그의 페이퍼들을 읽어보고싶다. 학부때 정치사상을 참 좋아했는데, 이런 원류의 페이퍼를 읽는 그런 재미가 또 있다.  

 

그러나 오늘은 자야한다...

'잡다하게' 카테고리의 다른 글

글은 생각날때만 쓰자  (0) 2020.07.23