한빛출판네트워크

IT/모바일

실무로 통하는 인과추론 with 파이썬

데이터 분석에서 정책 수립까지, 이론과 사례 연구를 통한 실용적인 학습법

한빛미디어

번역서

판매중

실무로 통하는 인과추론 with 파이썬
좋아요: 19
  • 저자 : 마테우스 파쿠레
  • 역자 : 신진수 , 가짜연구소 인과추론팀 , 박지용(감수)
  • 출간일 : 2024-03-05
  • 페이지 : 464쪽
  • ISBN : 9791169212113
  • 물류코드 :11211

합계 : 34,200

  • [저자] 마테우스 파쿠레

    아시아 외 지역의 최대 핀테크 회사인 누뱅크(Nubank)에서 경제학자이자 시니어 데이터 과학자로 일하고 있습니다. 그는 자동화된 실시간 금리 및 신용 결정부터 교차 판매 이메일, 마케팅 예산 최적화에 이르기까지 다양한 비즈니스 상황에서 인과추론을 성공적으로 적용해왔습니다. 또한 인기 있는 오픈소스 도서인 『Causal Inference for the Brave and True』의 저자로, 이 책에서 엄격하지만 재미있는 방식으로 인과추론을 알리고자 노력하고 있습니다.

    [역자] 신진수

    네오플을 거쳐 크래프톤(KRAFTON)의 데이터 분석가로 일하고 있습니다. 게임 업계에서 쌓은 커리어를 기반으로 <던전앤파이터>, <뉴스테이트 모바일>, <배틀그라운드 모바일> 등 다양한 장르의 게임에서 데이터 분석과 실험을 통해 유저 경험을 개선하는 데 기여했습니다. 비영리 데이터 사이언스 커뮤니티인 가짜연구소에서 인과추론팀을 운영 중입니다. 마테우스 파쿠레의 웹북 「Causal Inference for The Brave and True」를 한국어로 번역하는 작업을 주도했습니다

    (https://github.com/CausalInferenceLab/Causal-Inference-with-Python)

    [역자] 가짜연구소 인과추론팀

    가짜연구소 인과추론팀은 2022년부터 데이터를 통한 문제 해결력을 높이고자 인과추론을 함께 학습하고 있습니다. 한국어 자료가 많지 않은 인과추론을 많은 분이 쉽게 접하실 수 있도록 기여하고자 하는 마음으로, 가짜연구소에서 인과추론 이야기와 실험 및 조직문화에 대한 이야기를 이어나가고 있습니다. 이 책의 번역 작업에는 인과추론팀 김소희, 김성수, 김상돈, 김준영, 남궁민상, 박시온, 최은희, 정호재, 홍성철이 함께 참여했습니다.

    [역자] 박지용(감수)

    미국 조지아대학교 테리 경영대학교(Terry College of Business)에서 경영정보시스템 조교수로 재직 중입니다. 디지털기술의 사회적, 환경적 영향에 대한 실증연구를 수행하면서 인과추론 방법론을 통해 사회현상과 기업활동에서의 원인과 결과를 분석하는 일을 합니다. 인과추론의 저변을 확대하고자 매년 여름 ‘Korea Summer Workshop on Causal Inference’를 조직하고 있으며, 유튜브 채널 <인과추론의 데이터과학>을 운영 중입니다.

    • 안녕하세요 분석하는 컨티뉴언입니다.

      오늘 들고 온 책,

      제목부터 보겠습니다.

      <실무로 통하는 인과추론 with 파이썬>입니다.

      이 책은 결론부터 말씀드리면 살짝 어렵습니다.

      아니 많이 어려울 수 있어요.

      그런데도 봐야되는 이유는?

      제목에서도 드러나듯이 두 가지 키워드가 있죠.

      첫번째, 실무

      두번째, 인과추론

      이 책은 인과추론이라는 단어와 함께 어떤 방법들이 있는지 소개합니다.

      그러면 이 책이 더 필요한 이유는 무엇이 있을까요?

      컨티뉴언 분석 인사이트

      바로 무의식입니다.

      분석가들 뿐만 아니라 일반인들은 무의식적으로 경험을 갖고 분석을 합니다.

      일단 대략적으로 감을 잡죠.

      자신의 경험에 따라 추정하기 시작합니다.

      그런데 경험에 따라 생각하기 시작하면 놓치는 것들이 한 두가지가 아니게 되죠.

      물론 경험도 중요해요.

      생각을 열려면 다양한 경험이 모이는게 중요하죠.

      그런데 그러한 경험도 제대로 쓰려면 필요한게 인과추론입니다.

      데이터 기반의 통찰력 있는 의사결정

      분석가들뿐만 아니라 데이터를 보는 사람들은

      데이터를 통해 비즈니스 임팩트를 얻으려하죠.

      즉 데이터와 돈이 어떻게 연결되는지 확인하고 싶어합니다.

      대표적으로 책에서는 마케팅에 대해 말하고 있죠.

      인스타그램도 마찬가지고 대부분의 온라인 시스템은 사람들이 접속합니다.

      접속하는 사람들이 모두 고객이죠.

      고객들이 어떤 채널을 통해서 들어왔는지,

      카톡을 통해 접근했는지,

      인스타 광고를 통해 들어왔는지

      아니면 자기가 직접 검색했는지.

      이런 부분들을 확인해야하는거죠.

      물론 다양한 분석 툴을 통해서도 볼 수 있어요.

      그리고 파이썬을 활용한다면 좀 더 다양한 추론을 해볼 수 있는거죠.

      온라인 마케팅 예산을 1달러 높이면 구매자는 얼마나 늘어날까요?

      그러면 추론은 어떻게 해볼 수 있을까요?

      여러가지 방법이 있겠고, 대표적으로 그룹을 나눠서 실험해보는거죠.

      100명의 사람이 있을때 30명은 A그룹, 70명은 B그룹이라하면

      별도의 실험을 해볼 수 있어요.

      그런데 여기서 재밌는 점은 그룹별로 사람 수가 다르면 결과에 대한 해석도 다를 수 있겠죠?

      여기서 추론의 과정이 달라질 수 있는거죠.

      이처럼 추론은 과정에 따라 결과도 달라질 수 있는 부분이죠.

      그래서 다양하게 그룹은 나눠서 추론을 해보는거예요.

      50대 50으로도 해보고,

      40대 60으로도 해보고.

      기초적인 통계공식만 활용해서 얼마나 고객이 특정광고로 들어오게 됐는지 볼 수 도 있는거죠.

      이 책은 영향력과 효과를 추정하는 데 있어 인과추론이 지닌 아직 활용되지 않은 잠재력을 설명합니다

      이 책에서 발견할 수 있는 인과추론의 재미가 있어요.

      평소에 우리가 생각해왔던 단순한 생각을 코드 몇 줄과 시각화로 실험해볼 수 있는거죠.

      실제로 예시코드와 그림까지 있으니 내 생각과 책의 내용이 어떻게 다른지도 볼 수 있어요.

      무엇보다 머신러닝이나 분석을 다양하게 하시고 싶은 분들에게

      다른 내용을 선사해줄 수 있다는 점이 재밌는 부분이죠.

      보통 인과추론관련된 책들은 교양서적이나 철학서인 내용이 있는데요.

      이 책은 실제 데이터를 통해 추론내용을 확인할 수 있으니

      답답함이 줄어들 수 있는거죠.

      인과에 대한 복잡함을 풀고 싶은 분들에게는

      반드시 추천드리는 책입니다!

      우리는 일상생활에서 무의식중에 수많은 인과추론을 하며 살아갑니다

      실무로 통하는 인과추론 with 파이썬

      저자

      마테우스 파쿠레

      출판

      한빛미디어

      발매

      2024.03.05.

      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

      #한빛미디어 #나는리뷰어다 #서평단 #도서리뷰 #실무로통하는인과추론with파이썬 #인과추론 #추론

    • 인과추론이라는 분야에 관심이 많아, 입문서에 속하는 '원인과 결과의 경제학'을 읽은 적이 있습니다. (https://wizmusa.tistory.com/1170964450) 방법론보다는 인과추론 자체에 대한 설명 등 제반사항에 집중한 책이라 아쉬웠습니다. 그러다 마침 한빛미디어에서 정말 상세하게 길잡이 노릇을 해주는 '실무로 통하는 인과추론 with 파이썬'을 내놓아서 반가웠습니다. 인과추론에 대해서는 디지털 마케팅 회사에 다니던 시기에 알게되었고 그 일을 잘 하고 싶었던 터라 관심을 갖게 되었습니다. 광고 배너에 대해 A/B test를 했을 때나 '그냥 직관으로' 했을 때 모두 현장에서 광고 성과가 나오기는 하지만 근거가 탄탄하지는 못했기 때문입니다. 예전 회사에 있을 때에 관여했던 상품 추천도 마찬가지였습니다. 상품이 잘 팔렸다고 해도 추천 덕인지 쿠폰 덕인지 알기 힘들었습니다. 현장에서는 분석을 거이 포기하다시피했습니다. 대체로 어려운 일이라는 얘기입니다.

       

      이 책의 미덕은 인과추론에 필요한 통계 지식을 되짚어주며 머신러닝과 통계학 사이에 혼란스러운 요소를 곳곳에서 바로 잡아주는 구절입니다. 통계학 석사라면 무리 없이 볼 만하며 개발자로서 시작하여 데이터 과학자로 성장하는 이에게는 여러모로 도움이 될 만하다고 봅니다. 경험이 일천해서 A/B test 결과를 회귀분석으로 보정하여 판단하는 내용에 감탄했습니다. 이후에 책에서 다루는 수준은 꽤 높아서 제게는 좀 버거웠습니다. 통계에 익숙하지 않은 독자는 열심히 읽었을 때에 3~6개월 정도 걸릴 만한 분량과 수준이 아닐까 합니다.

       

      마지막 장은 숙제입니다. 가끔 보이는 독특한 구성입니다. 내용이 전문적이다 보니 후속작으로서 나오기가 힘들어 보입니다. 독후감은 썼습니다만, 저는 이 책을 더 숙독하여 제 일에 녹여야 합니다. 쉽지 않은 터라 신이 나지는 않습니다.

    • AI가 아직 해결하기 힘든 난제이자 진리로 향하는 필수 도구인 인과추론의 개념과 도출 기법을 다룬 몇 안되는 희귀한 도서.

      인과관계는 상관관계와 다르다.”(이 책에서는 상관관계를 연관관계라는 단어로 표현한다.)

      아이스크림이 많이 팔리면 상어에게 인간이 잡혀먹힐 확률이 높다라는 가정은 직관적으로 생각해도 말이 안되는 명제이지만 일상에서 생각보다 많은 사람들이 상관관게의 현상에 가려 잘못된 인과를 도출한다.

      실상 원인은 기온이고 그에 따른 결과로 아이스크림이 많이 팔릴 뿐이다. 기온이 올라가니 사람들이 해변에서 수영을 즐기는 빈도가 높아지고 자연스레 상어로 부터의 위험에 노출될 확률이 올라가는 것이다.

      그럼에도 해당 도메인 분야에 약간의 무지만 더한다면 상관관계와 인과관계를 구별하는 것은 생각보다 쉬운일이 아니다. 이 책은 통계학적 기법을 중심으로 그 차이를 분별해 낼 수 있는 능력을 키워주는 도서이자 나아가 통계 모델과 수학을 활용하여 관측된 데이터를 객관적으로 해석할 수 있는 방법을 도출하는데 도움을 준다.

      사실 인과추론은 결코 쉬운 주제가 아니다. 경험의 축적을 통해 충분히 인과관계를 밝힐 수 있는 직관이 확립된 일상생활이나 또는 수십년간의 연구를 통해 해당 도메인 분야에 내공이 쌓인 경우가 아니라면 결국은 관측 데이터를 통해 궁금증을 해결할 수 밖에 없기 때문이다.

      위험한 함정에 빠지지 않기위해 이 책에서는 실제 데이터와 파이썬의 시각화를 통한 검증을 거쳐가며 가급적 쉽게 인과추론의 타당성을 검증해 나간다.

      예시데이터

      책의 구성 상 차례대로 읽어나갈 것을 권하고 싶다. 특히 1장의 경우 인과추론 입문 과정의 필수지식을 담고 있기에 반드시 정독해야 한다. 인과추론의 기본 개념은 물론 관계 심슨의 역설과 같은 반드시 알아두어야 할 인과 함정 등의 내용이 등장한다.

      심슨의 역설

      특히, ATE(평균 처치효과), 실험군에 대한 평균 처치효과(ATT), 조건부 평균 처치효과(CATE) 개념은 반드시 숙지해 둬야 할 개념이다. 인과추정량을 모르고는 2장부터 마지막까지 이어지는 대부분의 내용을 이해하기 어려울 것이다.

      인과추정량

      인과의 함정을 피하기 위한 도구로 후반부 까지 지속적으로 검증에 도움을 주는 도구로 활용되기 때문이다.

      초반부에는 인과를 검증하기 위한 어려 장치들이 등장한다. 통계학 진영에서 긴 세월동안 축적해 온 귀무가설의 p-value를 측정할 때 활용하는 유의성 검증부터 시각적 도구로 난해한 관계에 직관을 부여하는 그래프 인과 모델 등이 그러한 예시이다.

      유의성검증


       

      그래프인과모델

      2부로 넘어가면 회귀분석을 활용하여 편향을 제거하는 방법이나 및 성향점수나 이중 강건 추정법을 활용하는데 마치 연안에서 망망대해를 나가는 과정에 비유할 수 있겠다.

      3부에서는 머신러닝을 활용한다. 그간 전통적인 통계 기법은 엄밀성을 강조한 나머지 추론한 결과의 신빙성은 보호할 수 있었으나 경영진이 의사결정하는데 있어 정작알고 싶은 가려운 구석은 긁어주지 못하는 한계를 가지고 있었다.

      최근 화두가 된 AI 진영의 기법이 더해지면서 보다 실용적으로 인과추론을 활용하는 시도들이 소개된다. T, X, S러너들이 대표적인 기법들인데 개인화에 초점을 맞춘다거나 편향을 제거하는데 보다 좋은 성과를 얻을 수 있다.

      4부는 개인적으로 가장 흥미롭게 읽었던 부분이다. 솔직히 통계학 전공이 아니기에 매 순간 이해하는데 어려움이 많았는데 이 파트는 더욱 이해하기 어려웠다. 인과에 시간이 더해지는 파트이다.

      사실 인과 자체도 어려운 영역인데 시간 역시 만만치 않다. 시간을 정의내리는 것이 쉽지 않기 때문이다. 과학을 넘어 철학까지 이어지는 여정은 흥미롭고 신비한 여정이지만 그에 상응하는 고통도 수반한다. 누구도 시간을 흔쾌히 정의내리지 못한다. 아인슈타인의 시공간이 하나라는 개념이 더해지면 더욱 그렇다.

      문제는 인과는 정의만 쉽지 검증이 어렵다. 이 두 난해한 과제가 만나 시계열 분석은 물론 인과추론까지 접목되어 통계학에서 그간 애용된 이중차분법과 같은 모델이 만나니 왠만한 내공의 독자가 아니면 이 파트를 속시원히 설명하긴 어려울 듯 하다.

      마지막 5부에서는 불연속 설계나 스위치 백 실험들이 등장하고 추가로 학습해 볼만한 주제들이 등장한다.

      저자는 이 책을 인과추론의 입문서 정도로 소개했지만 안에 담긴 내용은 결코 입문서 수준이 아님에 유의하길 바란다. Python 예제들은 직관을 도출하거나 난해한 통계 검증 기법을 시각화 시켜주는데 도움을 주지만 인과추론을 연역적으로 기술하는 도구는 아니다. 어디까지나 보조장치로 활용되기에 Python으로 인과추론을 이해하는 구성이라 생각하면 안될 것 같다.

      그보다는 머신러닌 진영의 기법이나 특히 통계학의 수학을 기반으로 한 연역 기법이 많이 활용되고 있어 Python과 같은 프로그래밍 스킬은 물론 통계학이나 수학적 지식의 베이스가 탄탄한 독자가 읽는 것이 이해에 무리가 없을거라 생각한다.

      개인적으로 인과추론은 향후 AGI에의 도달을 위해 해결해야 할 가장 큰 장애물 중 하나라고 생각한다. 현 시점 묵과할 주제가 아니라는 말이다.

      게다가 인과추론은 신생 학문이고 참조할 만한 레퍼런스가 너무 적다. 그런 의미에서 현 시점 이 책이 가지는 가치는 상당할 것으로 평할 수 있을 것이다. 한 단계 고차원적인 AI 기법의 하나이자 보다 정확한 진실을 향해 다가가는데 활용할 수 있는 도구로써 인과추론에 관심있는 독자들에게 본 도서의 일독을 권하는 바이다.


    • ✏️실험설계, 가설검증을 통한 합리적인 결과도출과정에 대해 관심이 있어 최근에 기술블로그에도 작성을 했었다. 인과추론에 관해서 이론&코드와 함께 집중적으로 다룬 책은 처음 봐서 더욱 눈길이 갔던 책

      - 이론의 내용도 심화적이라 데이터분석가들에게 추천한다 

      *한빛미디어 <나는 리뷰어다> 활동을 위해 관심 주제에 대한 책을 제공받아 작성된 후기입니다

    • "연관관계는 인과관계가 아니다." 는 말은 맞지만, 연관관계는 때로는 인과관계가 될 수도 있다.


       

      통계학을 공부한 사람이면,  '연관관계는 인과관계가 아니다.'를 배운 적이 있을 것이다. 그럼에도 불구하고, 사람들은 연관관계를 통해 인과관계를 추론하게 된다. 이 책에서는 주식 투자자가 주가가 급등하기 직전에 매수했거나 폭락하기 전에 매도 했던 경험을 예시로 들어, 시장 타이밍을 맞출 수 있다고 착각하는 경우가 있다고 말한다. 많은 사람들은 자기 직관이 불규칙한 주가의 움직임과 인과적으로 연결되어 있다고 생각하면서, 잘못된 믿음을 더 위험한 베팅으로 이끌고 결국에는 투자자산을 잃게 된다. 

      즉, 연관관계는 2개의 수치와 확률변수가 같이 움직이는 것이며, 인과관계는 한 변수의 변화가 다른 변수의 변화를 일으키는 것을 의미한다. 예를 들어, 한 국가의 노벨상 수상자 수를 1인당 초콜릿 소비량과 연관시킬 수 있고, 두 변수가 같이 움직일 수 있지만 한 변수가 다른 변수의 원인이라고 생각하는 것은 어리석다는 것이다. 이 말에서 이책에서 말하는 인과 추론이 무엇인지, 연관관계와의 차이가 무엇일지 이해할 수 있었다. 

       


        인과 추론에서 시작해, 머신러닝, 연관관계와 인과관계의 차이, 인과추론의 근본적인 문제, 인과 모델까지 스토리를 통한 설명이 되어 있어서, 통계학을 아예 모르는 사람이라도 책을 술술 읽으면서 '인과추론'에 대해 깊이있게 배워갈 수 있을 것이다. 특히, 인과추론을 학습할 때, 시뮬레이션 데이터를 통해 학습하는 것이 좋은데, 이는 아래와 같은 이유 때문이다. 

      이 책에서는 고객 데이터를 통해 인과 효과를 추정하는 과정을 통해, 이메일을 받지 않은 그룹, 긴 이메일과 짧은 이메일을 받은 그룹간의 전환율을 나타내어, 어떤 이메일을 보냈을 때 더 효과적인지 분석하는 과정을 보여준다. 실제로 마케팅에서도 이런 방법이 자주 사용되는 것으로 알고 있는데, 가설을 설정하고 실험을 하는 것을 자주 해볼 수록 도움이 될 것이다. 
       



      각 그룹을 평가하는 다양한 방법 중에서 간단하게 실험 대상 집단 사이의 정규화 차이를 계산해서 평가하는 방법을 택하는데, 공식이 이해되지 않아도 걱정하지 말라는 말과 함께, 결과표를 어떻게 해석해야 제대로 추론을 할 수 있는지 알려준다. 

      설명 속에 다양한 통계학의 원리들이 자연스럽게 녹아 있어서, 이 책을 읽기 위해 통게학을 따로 공부하지는 않아도 될 것이다. 수학적 공식이 이해가 되지 않는 경우도 있는데, 그림이나 도표 등을 통해 직관적으로 이해할 수 있도록 되어있었다. 
       

      인과추론을 업무에 활용하고 싶지만, 방법을 모르는 독자들이 읽으면 큰 도움이 되는 책이라고 생각한다. 복잡하게 생각하지 않고, 이 책에서 설명하는 주제를 순서대로 따라가다 보면, 실무에서의 인과 추론은 더 이상 어려운 일이 아닐 것이다.





       "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

    • 데이터 분석의 수준을 한 단계 높일 수 있는 책
       


      데이터 분석을 시작하면서 관련 도서와 자료들을 많이 찾아보면 대부분 아니, 모든 도서는 데이터를 X, Y의 기준으로 단순한 수치적 분석만 할 뿐 그 관계가 가지는 의미, 인과관계 등에 대한 내용은 다루지 않는다.


      분명히 변수 간의 인과관계를 알 수 있다면 더욱 의미 있는 분석 결과를 도출할 수 있음에도 말이다.


       


      이 책에서는 변수 간의 연관관계로부터 인과관계를 추론하여 이에 대한 내용을 이해하는 인과추론에 대한 내용을 파이썬을 활용하여 다룬다.

       






       


      실무로 통하는 인과추론 with 파이썬


      이번에는 책 표지에 나오는 동물의 의미를 찾았다.


       


      이 책의 목차는 다음과 같다.


       


      1장 인과추론 소개



      2장 무작위 실험 및 기초 통계 리뷰

      3장 그래프 인과모델



      4장 유용한 선형회귀



      5장 성향점수

      6장 이질적 처치효과

      7장 메타러너

      8장 이중차분법

      9장 통제집단합성법

      10장 지역 실험과 스위치백 실험

      11장 불응과 도구변수



      12장 더 배울 내용


       



      아무리 많은 데이터 분석을 한다고 해도 데이터의 관계에 대한 분석이 없다면 큰 의미가 없을 것이다.


      그렇지 않다면 상관관계 분석과 같은 방법이 왜 필요할 것이고 왜 만들어졌을까?


       


      데이터의 원인과 결과를 추론하는 것은 데이터 분석의 실용성과 신뢰성을 높여주기에 필요하다.


      이에 대한 내용으로 책에서는 인과추론의 개념과 목적을 다루고 있으며, 이를 머신러닝과 함께 풀어낸 내용도 포함되어 있


       


      이 책은 수학, 이론에 집중되어 있지 않으며 인과추론에 대해 설명하는 목적이 있어서, 누구나 어렵지 않게 읽고, 활용할 수 있다.또한 파이썬 코드를 통해 배운 내용을 실습하여 빠르게 이해하고 사용할 수 있었다.


       


      데이터 분석을 하고자 하는 사람, 하는 사람에게는 반드시 읽어야 되는 책일 것이며, 마케팅과 같은 직무에 있는 사람에게도 권장하고 싶다.


       


      수학과 이론에 대한 두려움을 버리고, 시간 낭비라는 생각 없이 읽어보면 반드시 당신에게 도움이 될 책이다.


       




       "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


      리뷰는 실제 도서를 읽어본 후 작성되었으며, 도서의 제공 여부와 상관 없이 독자의 시점으로 작성하였습니다.


       

    • 실무로 통하는 인과추론 with 파이썬(2024, 한빛미디어)

       

       


      책 소개

      저자 : 마테우스 파쿠레( Matheus Facure )

      제목 : 실무로 통하는 인과추론 with 파이썬

      번역 : 신진수, 가짜연구소 인과추론팀

      출판사 : 한빛미디어

      출간 연도 : 2024. 03.

      원문 제목 : Causal Inference in Python

      페이지 : 총 464쪽

       

       

      https://product.kyobobook.co.kr/detail/S000212577153


       

       

       

       빅데이터 시대, 데이터 분석과 머신러닝, 딥러닝이 더욱 고도화 되면서 '알고리즘' 이후의 요인들이 화두로 떠오르고 있다. 인과추론은 연관관계로부터 인과관계를 추론하여 언제, 왜 서로 다른지 이해하는 과학으로 '현실 이해'를 목적으로 하는 과학으로써, '원인과 결과의 관계를 알아야 원인에 개입하여 원하는 결과를 가져올 수 있다.'를 토대로 개입의 영향을 분석한다. 인과추론으로 데이터 분석을 통한 의사결정에 실질적으로 기여하는 방법을 알아가보자.

       


       

      책의 구성

      5개의 파트, 세부 12장으로 구성된 책은, 인과추론의 기본 개념을 시작으로 인과관계와 상관관계를 구분하는 데 중요한 선형회귀분석과 성향점수 가중치를, 이후 인과추론에 시간 차원이 추가된 상황을, 마지막으로 램덤화가 어려운 상황에서 활용 가능한 다양한 실험 설계 방법을 설명한다.

       


       

      책의 장점

       인과추론을 설명하며 필요한 이론적 내용에 대해 수학적 수식과 더불어 이미지와 간단한 예시를 통해 독자의 이해도를 높이는 구성이 책의 장점이다. 시각적 이해를 돕기 위한 다양한 그래프의 사용과 핵심 키워드의 인포그래픽은 딱딱하고 낯선 주제에 접근하기 편하도록 독자를 배려한다. 특히 3부 - 6장에서 다루는 이질적 처치효과는 앞서 언급하는 '개입'이 사람마다 어떻게 다른 영향을 미치는지 설명하는데, '개인화'를 인과 추론으로 설명하는 방법을 알려준다. 실험 대상 i 마다 처치효과 Ti가 다를 수 있다는 것을 관측 가능한 실험 대상의 특성으로 한정하여 조건부 평균 처치효과(CATE)로 설명하는 부분이, 이후 실무에서 적용 가능하도록 시나리오화 되어있어 인상 깊다.

       또한 책의 4부와 5부는 같은 문제의 다른 접근법을 설명한다. 다양한 비즈니스 상황 환경에서 해당 데이터의 수집이 어려울 경우를 대비하여 수립 할 수 있는 대안적 실험 설계 방법을 안내하는데, 실제 업무에서 차용할 수 있는 상황 속 조건을 고려하여 독자들에게 안내하는 점이 눈에 띈다. 


      마치며

       빠른 기술 발전 속에서 현대의 비즈니스는 더 다양하고 복잡해지고 있다. 이러한 환경 속에서 문제의 본질적인 '인과'를 파악하는 능력은 더욱 중요해질것이고, 이를 활용하는 '인과추론' 역시 향후 비즈니스를 지탱하는 핵심 요소로 작용할 것으로 보인다. 데이터 분석이 더 고도화 되고 데이터가 삶에 더 가까워지는 오늘날, 원인을 핸들링하여 결과를 변화시킬 수 있는 '인과추론'이 궁금하다면, 이번 한빛미디어의 신작 ' 실무로 통하는 인과추론 with 파이썬'으로 데이터 분석 이후를 준비하는 것을 추천해본다.

       

       

        "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

       


       

    • 인과추론은 데이터 분석과 의사결정에 있어서 핵심적인 개념인데요. 데이터를 통해 특정 요인이 다른 요인에 미치는 영향을 식별하는 것을 목표로 합니다. 예를 들어 마케팅 캠페인의 효과를 분석하거나 의료 연구나 특정 치료법의 효과를 확인하는 등 다양한 분야에서 응용될 수 있습니다. 하지만 아직까진 데이터 과학에서 인과추론을 중요한 분야임에도 많이 알려지지 않은 분위기인데요.

       

      이번에 소개할 실무로 통하는 인과추론 with 파이썬은 데이터 분석과 관련된 업무를 하는 사람들에게 현실적이고 실질적인 지식을 제공하는 데 있어서 가치 있는 책입니다. 이 책은 인과추론의 이론적인 부분과 함께 파이썬을 활용한 실무적인 방법론을 통해 실제 문제 해결에 도움이 되는 내용을 다루고 있습니다.

       

      이론적인 내용을 파이썬의 코드와 함께 설명하여 독자가 실제 데이터를 다루면서 인과추론을 이해하고 적용할 수 있도록 도와줍니다. 또한, 다양한 실무 사례와 함께 각각의 상황에서 어떻게 인과추론을 적용할 수 있는지를 보여줌으로써 독자들에게 실제 업무에 응용할 수 있습니다. 실무로 통하는 인과추론 with 파이썬은 인과추론의 엄격한 증명과 정리보다는 실용적인 적용에 중점을 두었으며, 복잡하고 완벽한 설명보다는 간단하고 직관적인 설명 방식을 사용하기 때문에 이론과 실무의 밸런스가 잘 맞춰지게 구성된 점이 가장 좋았습니다.

       

      특히, 책에서는 A/B 테스트, 스위치백, 통제집단합성법 등 다양한 인과추론 방법론을 다루며, 이를 통해 독자들이 데이터를 분석하고 의사결정을 내릴 때 효과적으로 인과관계를 파악할 수 있도록 돕습니다. 더불어, 실제로 어떤 변수가 다른 변수에 어떤 영향을 미치는지를 이해하는데 있어서 중요한 역할을 하는데요. 이러한 개념들을 통해 데이터 기반의 의사결정이 중요해지면서 인과추론의 필요성을 강조합니다. 고객이 실제로 원하는 제품을 만들어 내는 것 더 나아가 개개인 및 팀의 성과를 측정하고 평가하는 과정에서 인과추론의 필요성을 느낍니다.

       

      이 책을 통해 데이터를 기반으로 한 의사결정이 얼마나 중요한지를 인지하며, 더 나은 결과를 도출할 수 있도록 다양한 산업 분야에서 발생하는 실무문제를 접함으로써 어떻게 해결할 수 있는지 고민하는 시간을 가질 수 있습니다. 참고 사항으로 이 책을 읽기 전에 알아 두면 좋은 지식으로 파이썬 기본 지식, 자주 사용하는 라이브러리(판다스, 넘파이, 맷플롯립, 사이킷런), 통계학 개념, 머신러닝 모델들(그레이디언트 부스팅, 의사결정 트리, 선형회귀, 로지스틱 회귀), 고등학교 수준의 수학 지식(함수, 로그, 제곱근, 행렬, 벡터) 등 알고 인과추론을 접하시면 더 빨리 배울 수 있다고 생각합니다.

       

      실무로 통하는 인과추론 with 파이썬은 데이터 분석에 대한 전문성을 가진 사람들뿐만 아니라, 데이터에 대한 이해를 높이고 싶은 누구에게나 추천할 만한 가치 있는 책입니다. 데이터 분석의 중요성이 더 커지고 있는 현대 사회에서, 이 책을 통해 인과추론에 대한 이해를 높이고 실무에서의 활용 능력을 키울 수 있다면, 더 나은 데이터 기반의 의사결정을 내릴 수 있을 것입니다.

       

      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

       

    • 여러 사례, 연구, 그래프로 시각화하는 내용 등을 따라가며 인과추론을 할 때 어떤 것이 필요한지 엿볼 수 있었습니다.

    • 개요

      새로운 프로젝트를 시작하거나 서비스를 도입할 때, 모델 선택, VRAM 용량, 자원 확보 등의 기술적인 요소들이 우선적으로 고려된다. 하지만 실제로 중요한 것은 주어진 일정 내에 서비스를 구현하거나 원하는 기능을 만드는 것만이 아니라 데이터 확보 및 관리, 외부 요인 분석 등의 인과추론 역시 성공적인 프로젝트를 위해 필수적인 역할을 한다.
       

      성공적인 테크 기업들은 A/B 테스트, 스위치백, 통제집단합성법 등 다양한 인과추론 방법론을 적용하고 개발하여 시장, 제품, 사용자에 대한 이해를 높인다. 이러한 접근 방식은 까다롭고 복잡할 수 있지만, 기업의 성장과 발전에 필수적인 역할을 합니다.


       

      이 책은 데이터 사이언티스트의 시각에서 인과추론의 기초부터 심화까지 다루는 전문 서적이다. 다양한 실제 사례를 통해 인과추론 개념을 이해하고, 실제 문제에 적용하는 방법을 배우도록 도와준다.

       

      책의 구성

      1부에서는 인과추론의 기본 개념을 다룬다. 1장에서는 가격 인하가 미치는 영향을 분석하는 데 필요한 인과추론의 주요 개념을 소개한다. 2장에서는 A/B 테스트(또는 무작위 통제 실험)의 중요성을 다룬다. 이는 의사결정 도구로서뿐만 아니라, 다른 인과추론 도구들을 평가하는 기준점 역할을 한다. 3장에서는 주로 이론에 중점을 두고, 인과관계 식별과 그래프 모델을 다룬다. 이렇게 1부를 다 읽고 나면 인과추론에 대한 기본적인 이해를 갖추게 된다.

       

      2부에서는 인과관계와 상관관계를 구분하는 데 중요한 선형회귀분석과 성향점수 가중치에 대해 배운다. 4장에서는 선형회귀분석을 새로운 관점에서 다루는데, 특히 직교화라는 중요한 편향 제거 방법에 초점을 맞춘다. 5장에서는 성향점수와 이중 강건 추정법을 살펴본다.

       

      3부에서는 머신러닝과 빅데이터를 이용해 2부에서 배운 내용을 확장한다. 또한 인과추론을 개인화된 의사결정 도구로 활용하는 방법을 배운다. 6장에서는 처치효과의 다양성을 알아보고, 7장에서는 머신러닝과 인과추론이 만나면서 나타나는 최근의 발전상을 탐구한다. T러너, X러너, S 러너와 이중/편향 제거 머신러닝과 같은 방법들을 처치 개인화 측면에서 배운다.

       

      4부에서는 인과추론에 시간 차원을 더한다. 8장에서는 이중차분법과 관련 최신 연구를 다루고, 9장에서는 마케팅 캠페인의 영향을 분석하는 데 사용하는 통제집단합성법과 그 변형을 알아본다.
       

      마지막으로 5부에서는 랜덤화가 어려운 상황에서 활용할 수 있는 다양한 실험 설계 방법을 소개한다. 10장에서는 지역 실험을 다루는데, 실험군과 대조군 지역을 선정하는 방법과, 분석 대상이 적을 떄 처치효과를 파악하기 위한 스위치백 실험을 진행하는 방법을 소개한다. 11장에서는 불응이 존재하는 실험을 다루고, 도구변수를 사용하는 방법과 불연속 설계에 대해 간략히 설명한다.


       

      마치며

      인과추론은 과학, 의학, 경제학, 사회과학 등 다양한 분야에서 중요한 역할을 하는 도구이다. 그러나 국내에서는 관련 도서가 부족하여 학습에 어려움을 겪는 경우가 많았다.

       

      이 책은 이러한 상황을 해결하기 위해 인과추론의 이론부터 실제 사례에 대한 적용까지 깊이 있게 다루는 책이다.

       

          "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

    • 데이터 사이언스라고 하면 머신러닝이 먼저 떠오르지만, 사실 데이터 분석의 꽃은 바로 '인과관계'를 밝혀내는 일이라고 합니다. 성공적인 테크 기업들은 모두 제품 개발과 직원 성과 측정에 이 인과관계 분석을 활용하고 있죠.



      그런데 이게 말처럼 쉽진 않다고 합니다. 어떤 데이터를 어떻게 모을지, 어떤 방법으로 분석할지 등을 꼼꼼히 따져봐야 해요. 제품마다 인과관계 분석 방법도 조금씩 달라지고요.



      책에서는 인과추론이 왜 어려운지 설명하고, 인과추론을 위한 기초 개념부터 A/B 테스트부터 통제집단합성법까지 실무에서 쓰이는 다양한 분석 기법을 설명합니다. 그리고 이론 뿐 아니라 파이썬 코드도 함께 제공하기 때문에 실제 실무에서도 적용할 수 있도록 합니다. 또한 기반이 되는 수학 공식들도 있지만, 실제 사례도 소개되어 있어서 이론부터 실무까지 이어지는 흐름을 이해할 수 있었습니다.



      국내에는 인과추론에 대해 잘 설명된 책이 없었다고 하는데, 이번 책이 누구나 접근 가능한 인과추론 입문 책으로 자리 잡으면 좋겠습니다. 

       

      “한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

    • 이 책은 인과추론이라는 어려울 수 있는 개념을 파이썬 라이브러리(pandas, NumPy, Matplotlib, Scikit-learn)들을 사용하여 다양한 예제코드로 실습할 수 있게 해주고, 현업에서 실제로 사용할 수 있는 방법, 즉 비즈니스 적용 사례들로 디테일한 이해를 돕습니다. 

       

      "인과추론"은 꽤나 생소한 단어였습니다. 인과관계는 들어봤는데 인과추론...? 인과관계를 추론하는 건가? 파이썬으로?

      순수한 호기심에 책을 신청해보았고, 이 책이 나는 리뷰어다 책으로 선정되어 읽어보게 되었습니다.

      딥러닝, AI와 관련된 책들은 꽤 읽어보았는데 인과추론이라는 단어는 그간 접하지 못했던 개념이었거든요.

       

      책을 읽어보니 왜 빅데이터, AI가 대세인 시대에서 인과추론이 대두되었는지 알 수 있을 것 같았습니다.

      빅데이터와 AI 매커니즘을 통하여 데이터들간의 연관관계를 파악하는 것은 쉽지만,

      정말 알아내고자 하는 예측은 복잡하고 다양한 외부요인과 방대한 데이터 속에서 "왜 이렇게 될까?" 라는 의문을 던지고 이것을 설명할 수 있는 "인과관계를 파악"하여 예측하는 인과추론에 있다는 것을 말입니다. 그리고 인과추론은 더 나은 의사결정을 돕는 핵심 요소입니다. 의사결정을 AI를 통해 자동화하는 추세에서 보다 의미있는 의사결정을 할 수 있는 인과추론은 앞으로 더욱 중요해질 학문이라고 생각하기 때문에 이 책은 시의적절하게 출판되었다고 생각합니다.

       

      온라인 마케팅 예산을 1달러 높이면 구매자는 얼마나 늘어나는지,

      더 높은 신용한도가 고객의 채무 불이행 가능성에 어떤 영향을 미치는지 등

      "통제 가능한 요소(마케팅 예산, 신용한도 등)"들을 변경했을 때 원하는 비즈니스 결과(유입되는 사용자 수, 채무 불이행 위험)에 어떤 영향을 미치는지를 알고 싶어하는 이론이 인과추론입니다.

      그래서 이 책에서 비즈니스의 여러 상황에서 분석과 판단과 관련한 사례들이 등장합니다.

       

      그런데 통계학과 관련한 지식이 부족하여 읽는 데 진도가 잘 안 나가긴 했습니다. 책에서도 독자 수준을 전제하고 있듯이 통계학 지식이 어느 정도 있는 사람들을 가정하고 있습니다.

      조금 난이도가 높다는 것을 감안하고 읽으면 좋을 것 같습니다.

       

      이 책을 읽고 나서 인터넷을 검색해보니

      한빛미디어 사이트에 번역가 신진수님이 올려놓은 글이 있어서 참고할 링크를 올립니다.

      https://m.hanbit.co.kr/channel/category/category_view.html?cms_code=CMS8017671681

      https://m.hanbit.co.kr/channel/category/category_view.html?cms_code=CMS5657964718&cate_cd=

       

      * 이 책은 한빛미디어 "나는 리뷰어다"를 통해 제공받았으며, 솔직하게 작성한 후기입니다.


    • ‘데이터분석의 진일보는 인과추론(Casual Inference)’ 
      _
      오래전부터 강조했던 데이터 리터러시(Data Literacy)의 중요성이 점점 더 현실에게 강조되고 있음을 느낍니다. 이미 수많은 기업에서는 데이터 분석 직무를 별도로 채용하고 있으며, 공공기관에서도 데이터 분석에 대한 전문성이 있는 분들의 경우는 단순 순환식 근무가 아니라 전문분야에 대한 대우가 달라질 추세라고 생각합니다. 이러한 시점에서 해당분야에 대한 접근을 했거나 준비하고 있는 사람이라면, 앞으로는 단지 데이터를 분석하는 역량이 아니라 유의미하게 의사결정할 수 있는 논리적 체계를 가지고 있어야 이 데이터 분야에서도 한단계 업그레이드 할 수 있을 겁니다. 저는 그 중에 하나라 인과추론(Casual Inference)를 실무에서 활용할 수 있는 역량이라고 보고 인과추론 데이터 분석의 불모지와 같은 대한민국에 마테우스 파쿠에레의 <실무로 통하는 인과추론 with 파이썬>이 등장한 것은 현직자들이 환영할 일이라고 생각합니다.

      아직 인과추론에 대해 익숙하지 않은 분들이 많을 겁니다. 예를 들어 ‘쇼핑몰의 크기를 20% 확장했더니 3개월 후에 방문객이 20%’증가한 결과가 나왔다고 봅니다. 그렇다면 쇼핑몰의 크기를 넓히면 방문객이 증가하는 것이 참일까요, 그리고 해당 크기만큼에 유의미한 방문객수가 증가할까요? 그런데 타 경쟁사나 해외의 사례들을 확인하고 싶어 해당 데이터 분석을 한 결과 어떤 쇼핑몰은 크기 확장대로 증가했지만 그렇지 않은 쇼핑몰의 비중이 크다고 할 때 데이터 분석가들이 바로 ‘인과추론’을 할 시점이며 인과추론은 데이터 변수간의 상관관계를 일반분석을 하는 것을 넘어 해당 변수에 대한 통계적인 이론을 접목하여 구체적인 방법론까지 제시하는 것을 의미합니다. 그리고 본서는 실무의 데이터 분석가들이 활용할 수 있도록 파이썬(Python)을 통해 이를 전달하고 있습니다.

      과거 인과추론에는 회귀분석(Regression Analysis)를 통한 선형회귀 방법과  A/B테스트등의 고전적 인과추론 방법이 쓰였습니다. 그런데 해당내용으로만은 인과추론의 이론적토대에 대한 접근성은 가질 수 있지만 실질 데이터 분석가나 경영평가 모형을 사용하는 실무진의 사용과는 거리가 있습니다. 그래서 본서는 이를 파이썬(Python)을 통한 실무 방법론과 연계시킵니다. 그래서 예를 들어 어떤 고객이 할인쿠폰없이 만족도가 높은지 배당 서비스의 서비스 충성도를 위해서는 어떤 방법이 ‘인과추론적’으로 의미가 있는지에 대한 정량적인 내용들과 실습이 가능합니다.

      성공한 연사의 경영성과내용을 보면 말로는 A라는 변수가 B라는 변수에 영향을 미쳐서 결과가 난 것 처럼 보이지만, 실제로는 B가 아니라 C, D, E 때문일수도 있습니다. 만일 인과추론 방법론을 이해하지 못하거나 이를 적용할 역량이 부족하면 곧이곧대로 B라는 변수가 맞다는 ‘확증편향’에 빠질 수 있습니다. 하지만 인과추론과 함께 실제 결과변인을 추론할 수 있는 능력을 갖춘다면 남들이 보지 못하는 새로운 변수를 알 수 있는 ‘희소능력’을 보유하게 됩니다. 이러한 능력이 바로 남들과 다른 차별화 역량이 되는 것이지요, 본서의 내용들을 하나하나 짚어가면 그것을 가능하게 만들어 줄 수 있습니다.

      ‘이제는 단순한 데이터 분석능력의 시대는 저물고 있습니다’

       

      한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다

       

       

    • 머신러닝 모델을 학습하기 위해 많은 변수를 수집할 때마다 생각합니다. 이거 진짜 결과에 영향 주는 변수 맞아..? 일단 활용 가능한 것들 다 넣어보는 거 아녀..? 사실 하나하나의 변수가 결과와 직접적인 관련이 없어 보이더라도 다른 변수들과의 상호 작용으로 인해 결과와 연관이 있다고 보여질 수 있습니다. 

      모델 성능이나 연관관계 파악 여부에만 관심이 있다면 사실 크게 문제되는 상황이 아닐 수 있겠습니다. 다만 연관성 여부를 넘어 ’만약‘ 값이 이렇게 바뀐다면 결과는 어떻게 될까와 같은 인과관계를 파악하고 싶다면 다른 방법이 필요합니다. 일부 변수들을 통제하면서 특정 변수의 효과를 확인하고 싶을 때, 원인과 결과 변수를 해석하는 데에 좀 더 관심을 두고 싶을 때는 인과추론 Causal Inference 이 필요하다고 합니다.

      좋은 성능을 보이는 모델을 만들고 활용하는 과정을 만드는 일 이상으로, 데이터를 좀 더 자세하게 들여다보는 과정을 배워보고자 이번 달에는 이 책을 선정하였습니다. 나중에 제품, 서비스에 대한 고객 데이터를 들여다 볼 일이 생긴다면 이 책의 내용을 적용해보고 싶네요.


       

      도서의 제일 큰 장점은 중간중간 첨부된 내용과 관련된 실제 사례라고 생각합니다. 제목에서 ‘실무’를 강조한 것에 걸맞은 구성이더군요. 도서에서 설명한 개념, 모델이 실제로 어떤 실험, 관찰 등에서 어떻게 적용되고 해석되는지를 사례로 제공해주는데 이게 이 도서의 큰 장점인 것 같습니다.

      수학적인 개념들은 수식이 이해되어도 그래서 어쩌라는건지 이게 어떤 식으로 ‘실제 세계에서’ 활용된다는 건지 감이 잡히지 않을 때가 종종 있는데요. 이런 사례들을 제공해줌으로써 독자들의 이해를 돕고 있어서 좋았습니다. 사례와 유사한 도메인에서 작업하는 분석가들에게 인사이트를 주는 큰 역할을 할 것 같아요.


       

      도서명에 ’with 파이썬‘을 포함하는 만큼 책에서도 어떻게 인과추론 개념을 파이썬 코드로 어떻게 적용할 수 있는지 제공하고 있습니다. 내용 이해가 빠삭하게 되셨다면 실무에서 바로 적용할 수 있을 것 같더라구요. 물론 당연히 파이썬의 판다스, 넘파이, 그래프를 만드는 라이브러리들 등 데이터를 다루는 패키지들을 알고 다룰 줄 알아야 더 빠르게 익힐 수 있겠습니다. 인과추론 개념만 이해하고 넘어가기엔 코드 자료도 알차게 들어있으니 꼭 직접 돌려보면 더 좋을 것 같습니다. 

      그리고 통계 개념에 친숙하면 읽기에 더 좋을 것 같습니다. 인과추론에서 확률, 조건부 확률, 분포, 기댓값, 분산, 표본, 실험군과 대조군 등등 기본적인 통계 개념들을 확장하며 어떻게 활용하고 있는지 보여주고 있어서요.(1부에서 기초 개념은 짚어줍니다!) 이전 장의 내용들이 계속 연결되며 개념을 확장하기 때문에, 앞의 내용을 이해하기 어렵다면 반복하며 익힌 후에 뒷 내용을 읽는 것이 좋을 것 같습니다. 

       

      한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

       

    • 인과추론이라는 개념을 데이터 분석 분야에서 들어본 것은 지난 가짜연구소에서 모집했던 인과추론팀 스터디였다. 스터디에서 소개하는 인과추론은 처음이기도 했지만 흥미롭게 느껴지기도 했다. 아직 학생으로서 이런 데이터 분석을 실제로 많이 할 일이 없기에 잘 접하지 못하는 것이긴 하지만, 한편으로는 미리 학습해놓는다면 나중에 실무에 적용할 때 많은 도움이 되지 않을까 싶어 이 책을 선택하게 되었다. 기본적으로 볼 수 있듯이 이 책은 초급자에게는 어렵게 느껴질 수 밖에 없을 것 같다. 나 역시도 읽으면서 이런 개념이 있고 이럻게 쓴다라는 방향성을 잡는데에 많이 집중을 했던 것 같다. 수학 수식들과 통계로 내용이 많이 구성되어있기 때문이다. 파이썬 코드는 이 책에서 소개하는 개념을 어떻게 적용하는지 보여주기 위해 사용한다. 이 책의 제목에서 엿볼 수 있듯이 실무에서 적용할 수 있도록 한 것이다. 그렇기에 이 책을 지금 나에게는 바로 적용되는 것은 아니지만 이 책을 통해 학습하고 나중에 다시 찾아볼 것 같은 책이라는 느낌이 들었다. 

      실무에서 인과추론을 사용하고자 하는 사람들에게 많은 도움이 되는 책이라고 생각한다. 데이터 분석을 진행할 때 자연스럽게 접할 수 밖에 없는 개념이라고 생각이 드는데 이 책을 통해 방법을 고민해보고 적용할 수 있을 것이라고 샌각한다.

       

      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

    • 실무로 통하는 인과추론 with 파이썬

      - 심도 깊은 데이터 분석을 위한 지침서 - 

       

      1. 누구를 위한 책인가요?

      실무로 통하는 인과추론 with 파이썬은 파이썬, R에 대한 기본 지식이 있고 통계지식, 회귀분석,  시계열 분석에 대해서 어느정도 지식이 있는 분들을 대상으로 하는 책입니다.

      실무로 통하는 이라는 제목에서 볼 수 있듯이 데이터 분석에 대한 기본 지식이 충분히 갖춰져 있는 분들을 대상으로 하는 책입니다.

      데이터분석을 처음 공부하거나 이제 막 기초지식을 공부한 경우 많이 어려운 책입니다.

      특히 통계와 회귀분석에 대한 지식이 잘 갖춰진 상태에서 읽어야 비로소 내용을 이해할 수 있으므로 미리 기초지식을 잘 쌓은 후에 읽는 것을 추천합니다.

      2. 실무로 통하는 인과추론 with 파이썬의 내용

      실무로 통하는 인과추론 with 파이썬은 일반적으로 볼 수 있는 데이터 분석에 관한 책이 아닙니다. 이 책은 제목에서 볼 수 있듯이 인과추론에 초점을 맞춘 책입니다.

      예를 들어 화장품 기업이 youtube 광고를 실시했는데 그 광고가 화장품 판매 매출에 영항을 미쳤는가? 를 분석한다고 했을 때 광고와 화장품 판매 매출간의 인과관계에 대해서 분석하는 내용입니다.

      특히 인과 관계를 분석하는데 있어서 광고 이외의 다른 요인이 매출에 미친 영향이 있는지를 검증하고 실제로 youtube 광고가 매출에 미친 영향만을 추출해 분석하는 방법을 알려줍니다.

      특히 2장  다중회귀분석을 이용하여 편향 보정을 하는 부분은 매우 흥미로웠습니다. 

      3. 실무로 통하는 인과추론 with 파이썬의 장점

      이 책의 장점은 내용이 흥미로운 것 뿐만 아니라 생소하기 때문에 어려울 수 있는 개념을 최대한 쉽게 설명하고자 하는 노력이 돋보이면서도 관련된 이론을 심도있게 설명한다는 점입니다. 

      특히 데이터셋을 분석하는 과정을 꼼꼼하게 보여주면서 중간중간 필요한 이론과 수식을 풀이하고 그래프로 결과를 보여주면서 아주 상세하게 설명합니다. 

      4. 마무리

      실무로 통하는 인과추론 with 파이썬은 흔히 볼 수 있는 데이터 분석 책이 아닌 데이터를 분석할 때 인과관계를 어떻게 추출하고 실제로 인과관계가 있는 변수를 찾아 그 영향력을 정확히 분석하는 방법을 알려주는 책입니다.

      아직 많이 알려지지 않은 분야지만 심도있는 데이터 분석을 위해서라면 꼭 필요한 공부라고 생각됩니다.

      수식도 많이 나오고 통계와 회귀분석, 그리고 데이터 분석에 대한 이해가 있어도 쉽게 이해하기 어려운 내용입니다. 하지만 데이터를 분석하는 과정을 처음부터 끝까지 보여주며 자세한 설명을 덧붙이기 때문에 천천히 따라하며 반복적으로 학습하면 많은 것을 얻을 수 있을 것입니다.

      심도있는 데이터 분석을 원하는 분들에게 꼭 공부해 보시기를 추천합니다.

      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

      #인과추론 #실무로통하는인과추론 #데이터분석 #인과관계분석 #한빛미디어

       

       

    • 이 책은 머신러닝, 통계, 파이썬에 대한 이해가 있다고 가정하고 쓰여진 책이에요. 저는 프론트엔드 개발자이고 데이터 분석과 파이썬을 잘 모르지만 인과추론에 대해 이해하기 쉬운 예시를 통해 차근차근 소개해줘서 좋았어요. 덕분에 인과추론을 통해 현실을 이해하고, 인과관계를 이해하여 의사결정에 기여하는 것이 왜 중요한지 알게되었죠.

       

      처음 들어보는 용어와 낯선 수식들이 나와서 데이터 분석쪽에 대해 기본적인 지식이 있었다면 더 재미있게 읽을 수 있었을텐데 하는 아쉬움도 남았어요. 그럼에도 실생활 사례와 실무를 중심으로 설명하기 때문에 재미있게 읽었고, 이해못한 부분도 많아서 다시 읽어보려고 해요.

       

       

       

      한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

    • 파이썬이 대세긴 대세이다.

      모든 논리적, 수학적, 프로그래밍적인 흐름들이 모두 파이썬으로 구현되고 소개되어지고 있다.

       

      이 책은 인과추론의 개념과 실무 적용에 대한 기본적인 이해를 제공하는 좋은 책이다. 하지만, 수학적 배경 지식이 부족하거나 코드 구현 경험이 적은 경우 이해에 어려움을 느낄 수 있다. 그래서, 심층적인 인과추론 분석을 위한 전문 지식이나 다양한 분야의 실무 적용 사례에 대한 정보는 굉장히 풍부하다.

       

      따라서, 이 책을 통해 인과추론에 대한 기본적인 이해를 쌓은 후, 추가적인 학습과 전문 지식 습득을 통해 인과추론을 실무에 효과적으로 활용할 수 있도록 노력해야 한다.

       

      그래서 이 책은  수학적 배경 지식에 대한 부가 설명 제공이 더 풍부하게 제공되어야 한다.

      그리고 코드 구현 과정에 대한 자세한 설명 및 예시 추가가 더 필요하다.

      최신 다양한 분야의 실무 적용 사례 추가와 인과추론 연구 동향에 대한 정보 제공이 더욱 되면 좋겠다.

      전문가 수준 지식을 위한 심화 내용 추가이 필요하다.


       

      이론과 실제의 괴리: 대부분의 인과추론 입문서가 그렇듯, 이 책도 경제학 배경지식이나 전공 과목 교과서처럼 구성되어 있어 복잡한 수식과 증명에 초점을 맞추고 있다. 이로 인해 실제 실무에 적용하기까지의 거리감을 느낄 수 있다. 

       

      파이썬 코드의 접근성: 책에서 제공하는 파이썬 코드는 인과추론을 구현하는 데 있어 매우 유용하지만, 초보자가 이해하기에는 다소 어려울 수 있다. 코드에 대한 설명이 충분하지 않거나, 인과추론에 대한 기본적인 이해가 없는 경우 코드를 따라가기 어려울 수 있다.

       

      인과추론의 근본적인 문제: 인과추론의 근본적인 문제는 동일한 실험 대상에 대해 동시에 관찰할 수 없다는 것이다. 이는 인과추론을 통한 결론이 항상 일정한 불확실성을 내포하고 있음을 의미한다. 이러한 불확실성은 연구 결과의 해석에 있어 주의를 요구하며, 잘못된 결론으로 이어질 수 있는 위험을 내포하고 있다.

       

      이 책은 인과추론을 파이썬으로 구현하고자 하는 연구자와 데이터 과학자에게 유용한 자료이지만, 이론과 실제의 괴리, 파이썬 코드의 접근성 문제, 그리고 인과추론의 근본적인 문제점에 대한 이해가 필요하다. 이러한 단점과 위협을 인지하고, 보다 실용적인 접근 방법을 모색하는 것이 중요하다.


       

      이 책은 가짜연구소 인과추론팀과 신진수님이 내용을 번역했는데...

       

      가짜연구소라는 커뮤니티가 굉장히 흥미롭다.


      이 가짜연구소의 커뮤니티 참여를 통하여 전문가와 협업하거나 최신 연구 동향을 탐색하는 것도 흥미로울 것이라는 생각이 들었다.

      한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

    • '인과관계'는 일상에서도 자주 사용되는 단어이다. 하지만 이 인과관계라는 것은 생각보다 그렇게 만만히 볼 개념이 아니다. 예를 들어, 한 대형마트가 연말을 맞아 초특가 세일을 하는 경우를 살펴보자. 이러한 세일 이벤트를 진행하자 고객 수가 1.5배 증가했다면, 할인이 고객 수를 1.5배 증가시키는 '인과관계'가 있다고 이야기할 수 있을까? 조금 통찰력이 있는 사람들이라면 꼭 그렇진 않을 것이라는 답변을 했을 것이다. 연말 파티를 준비하기 위해 마트를 찾았을 수도 있고, 근처에서 연말 공연이 열려 공연을 본 김에 마트에 들러 물품을 샀을 수도 있다. 심지어는, 그날의 온도, 습도가 사람들을 마트로 가고 싶도록 만들었을 수도 있는 노릇이다! 즉, 정확한 인과관계를 알기 위해서는 해당 사건이 정확하게 같은 시간, 같은 공간, 같은 조건에서 딱 하나의 사건만이 바뀌어야 한다. 마치 우리가 중고등학교 때 배웠던 실험군과 대조군처럼 말이다.

       

      하지만 이러한 것은 불가능하다. 어떻게 우리 집 앞 대형마트가 세일을 하는 상태와 세일을 하지 않는 상태가 공존한단말인가? 슈뢰딩거의 고양이도 아니고 말이다.. 그렇다면 우리는 이러한 '인과관계'를 어떻게 알 수 있을까? 세일이 고객 수 증가에 미치는 정확한 영향력을 어떻게 측정할 수 있을까? 이러한 물음들에 대한 답을 찾고자 하는 과정이 바로 '인과추론'이다.

       

      이 책은 그러한 인과추론 단계를 수식과 파이썬 코드를 이용해서 이해하고, 계산해볼 수 있도록 하는 책이다. 하지만 이러한 이론과 동시에 실제 사례들 또한 함께 소개하며 독자의 이해를 돕는다. 데이터 엔지니어나 연구자는 물론이고, 기획자, 마케터 등 코딩과는 다소 거리가 멀어 보이는 직군에게도 강력한 인사이트를 주며 그 인사이트를 검증할 수 있는 인과추론이라는 강력한 도구를 쥐어준다. 이들은 이를 통해 마케팅 예산을 늘려달라고 상사를 설득할 수도 있고, 가격 책정 전략을 어떻게 수립해야 최대 효율의 수익을 올릴 수 있을지 알 수 있게 될 것이다.

       

      다소 어려운 용어와 수식이 많이 나오지만 하나하나 뜯어서 쉽게 설명해주는 덕에 조금만 참고 보다 보면 문외한들에게도 그리 어렵지 않다. 그렇다고 마냥 쉽고 두리뭉실하지도 않아서 뜬구름 잡는 듯한 개념서와도 거리가 멀다. 이론과 실무 사이 적절한 지점을 정확히 짚어 깔끔하게 설명하고 있는 이 책은 연구 영역에서 주로 논의되던 인과추론의 개념을 좀 더 실무에 가까운 영역으로 끌어들였다. 이로써 우리는 인과추론이라는 개념에 좀 더 쉽게 접근할 수 있고 또 적절히 활용할 수 있게 되었다고 생각한다.

       

      만약 당신이 어떤 형태로든 데이터 기반 사고가 필요한 직군에 있다면, 한번쯤은 꼭 읽어보면 좋을 것 같다.

    • "실무로 통하는 인과추론 with 파이썬"은 데이터 사이언티스트, 데이터 분석가, 비즈니스 전문가들을 위한 종합적인 안내서로, 인과추론 기법을 활용하여 의미 있는 의사 결정을 내릴 수 있도록 도와주는 책이다.

       

      이 책은 비즈니스 분석에 관여하는 사람이라면 공감할만한 "온라인 마케팅 지출이 고객 유치에 어떤 영향을 미치는가?", "가격 전략의 성공은 어떤 요소에 달려있는가?"와 같은 흥미로운 질문으로 시작한다. 그리고 이러한 질문에 대한 대답은 물론, 데이터로부터 의미 있는 통찰력을 추출하는 강력한 프레임워크를 제공하는 인과추론이 어떻게 도움이 되는지를 명쾌한 예시와 실제 사례를 통해 보여준다.

       

      책의 부드러운 문체와 공감할 수 있는 사례들은 다양한 수준의 독자에게 복잡한 개념을 접근하기 쉽게 만드는 것 같다. 경험 많은 데이터 사이언티스트든 초보 분석가든, 이 책의 실용적인 통찰력과 실행 가능한 전략에서 가치를 찾을 수 있을 것이다.

       

      책의 강점이라고 볼 수 있는 부분은 응용에 대한 강조이다. 산업별 사례 연구를 통해 무작위 통제 실험 및 성향 점수 매칭과 같은 고전적인 인과추론 방법을 설명하고, 각 방법이 산업에 어떻게 관련되는지를 명확하게 보여준다. 마케팅 캠페인의 영향을 추정하는 것부터 신용 위험 동태를 이해하는 것까지, 각 방법은 명확하게 설명되고 직접 경험할 수 있도록 파이썬 코드 예제도 제공한다.

       

      또한 인과추론에서 발생하는 흔한 문제인 편향 보정 및 이질적 처치 효과에 대해 다루며, 이러한 복잡성을 효과적으로 해결할 수 있는 방법을 제공한다. 인과추론에서 엄격함(분석 과정에서 편향을 줄이고 정확한 결과를 얻기 위해 필요한 요소)과 회의론(결과를 검증하고 부정확한 판단을 방지하는 데 중요한 요소)을 강조함으로써, 경험적 증거에 기반한 건전한 의사 결정을 장려한다.

       

      이 책은 파이썬과 통계 및 머신러닝에 대한 기본적인 이해를 전제로 하고 있지만, 다양한 배경을 가진 독자들의 이해를 돕기 위해 충분한 맥락과 참고 자료를 제공한다. 2장에서는 기본적인 개념을 되짚기 위한 기초 통계 리뷰가 포함되어 있다.

       

      요약하자면, "실무로 통하는 인과추론 with 파이썬"은 일상적인 업무에서 인과추론의 예측을 활용하려는 실무자들에게 좋은 자료가 될 것이다. 이 책은 이론적 통찰력과 실용적인 안내가 조화되어 데이터 중심의 의사 결정을 사람들에게 필수적인 자료가 될 것이라 생각한다. 인과추론이 학계와 산업에서 중요해지면서, 해당 분야에서 인과추론의 잠재력을 깨우려는 실무자들에게 시기적절한 안내서가 될 것이다.

    • 회귀분석 이론에 관심을 가지고 있어 FWL, 교란 요인 보정, 성향점수 가중치와 같은 편향 제거 방법을 특히 인상깊게 읽었습니다. 더불어 sklearn, pandas, numpy를 이용한 코드와 인과추론 라이브러리가 소개되어 공부하기 좋았습니다.

      메타러너에 대한 개념은 처음 알게 되었는데, 기초 지식이 충분히 있다면 이해하기에 문제가 없을 정도로 친절한 책이었습니다.

      또한 파이썬 코드가 모두 수록되어 있고 결과와 설명이 함께 나와있어서 파이썬으로 인과추론을 공부해볼 생각이 있으시다면 좋은 책이 될 것 같습니다.

      마지막으로 입문서가 아니기 때문에 파이썬, 머신러닝, 통계에 대한 지식이 어느 정도 있으신 분들께 추천드립니다.

       

       

      "한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다."

    • 인과추론의 기본개념, 비즈니스 문제를 추론으로 틀짓기, 편향과 인과추론 관계 이해 그리고 조정하기를 배울 수 있는 실무를 겸비한 충실한 이론서

       

      업무를 수행할 때, 지금까지 업무를 수행한 결과와 성과들이 있고, 현재 내가 투입할 수 있는 자원들이 있을 때, 자원들과 성과 및 결과들에 대한 인과관계를 연결시켜 주는 일은 가장 기본적인 일이며 모든 사람들이 궁금해 하는 일일 것입니다.

      이럴때 대부분의 담당자는 이렇게 해보고 또 저렇게 해봤을 때, 두 결과 중 좋은 결과에 투입한 자원과 방법을 선택합니다. 그리고 이런 것들이 쌓여 노하우와 직감이 됩니다. 이런 방법과 과정이 데이터를 기반하긴 했으니 데이터 기반의 의사결정이라고 생각했습니다. 물론 여기에 복잡한 기존의 통계학 방법들을 총 동원한다면 좋겠지만, 나는 이 분야에 대한 박사학위도 없고 전문가도 아니기도 하며, 상식적으로 충분한 의사결정 과정을 거쳤다고 생각했습니다. 이 책을 읽은 후, 내가 생각하는 방식이 A/B 테스트고, A/B 테스트를 하기에는 좋지 않은 사례며, 많은 오차가 포함될 수 있고, 이러한 오차에서 나오는 잡음을 제거하기 위해 CUPED나 FWL 같은 방법들이 있구나 라는걸 알게 되었습니다.

       

      인과추론은 데이터과학과 비즈니스를 분석하는데 핵심 영역입니다. 온라인 마케팅에 투자하고 이를 추가 고객 유치로 이어지게 하는, 최적의 가격 전략을 수립하는데 기반이 되는 다양한 결정을 하는데 있어 근본적인 질문에 답을 하는데 중요한 근거와 역할을 합니다. 이 도서는 이런 주제, 어쩌면 기업에서 가장 중요하다고 할 수 있는 주제를 다루고 있으며, 파이썬을 사용하여 실제로 활용할 수 있는 방법을 배웁니다. 그리고, 개인적으로 너무 짧아 아쉽지만, 곳곳의 실제 사례 안내를 통해 비즈니스 문제에 적용하는 방법을 알려줍니다.

       

      저자는 매우 실용적인 도서를 쓰려고 했지만, 이론을 충실히 설명하고 있기 때문에 독자에 따라 어렵게 느낄 수 있고, 실제 이해하기 위해서는 많은 노력과 추가 학습이 필요할 수 있습니다. 저자는 아마도 두꺼운 최신 이론이 총망라된 베개 책을 쓸 수도 있었는데, 이 도서를 그렇게 만들지는 않고, 대신 많은 참고할 수 있는 내용에 대한 짧은 설명을 많이 곁들였습니다. 인과추론에 흥미가 있는 개발자라면 과감히 읽어 보고, 데이터 과학자들이라면 읽어 보는 것을 추천해 드립니다.

       

      본 도서는 다양한 인과추론 방법을 소개하고 있습니다. 실제 비즈니스상에서 발생할 수 있는 문제와 현상을 인과추론 문제로 구조화하고, 편향이 미치는 영향을 이해시키며, 다양한 상황에서 어떤 영향을 미치는지 친절하게 설명해 줍니다. 그리고 편향을 조정하고 상황에 따라 인과 효과가 달라지고, 어떻게, 어떤 방식으로 검토해야 하는지 다루고 있습니다.

       

      인과추론의 필요성
      데이터 기반의 의사결정을 하는 기업이라면 인과추론은 단순한 예측을 넘어서, 특정 결정이나 조치가 실제 비즈니스 결과에 미치는 영향을 정확하게 파악하고자 할 때 필수적인 절차 입니다. 추가적인 온라인 마케팅 지출이 실제로 얼마나 많은 고객을 유치하는지, 혹은 특정 고객이 할인 쿠폰을 받았을 때만 구매를 결정하는지 등의 질문에 답하기 위해서는 단순한 상관 관계 분석을 넘어 인과관계를 이해 해야합니다.

       

      인과추론 방법론
      저자는 인과추론의 기본기에 대해 설명하고, 다양한 편향 보정 방법에 대해 소개하며 이를 발전시켜 고려해야 될 다음의 문제들 그리고 이를 해결하는 방안에 대한 다양한 방법론을 소개합니다. 각 방법론은 실제 산업 사례를 통해 설명되어, 이론과 실무 사이의 간극을 메우는 데 중점을 두고 있습니다.

       

      실용적 접근
      이 도서는 Python과 Python 기반의 데이터 과학 라이브러리를 사용하여 인과추론을 실제 데이터 세트에 어떻게 적용할 수 있는지를 눈으로 확인시켜 줍니다. 이 책은 이론적 배경을 제공하는 동시에, 코드 예제와 함께 이론을 실제로 어떻게 적용할 수 있는지를 보여줍니다. 이런 접근 방식은 독자가 책에서 배운 내용을 자신의 작업에 직접 적용해 볼 수 있도록 합니다.

       

      도전과제와 기회
      책에서 다루는 사례 연구와 예제는 실제 기업에서 직면할 수 있는 지분히 사실적이면서 적나라하며 다양한 도전과제를 반영하고 있습니다. 예를들어, 추가적인 온라인 마케팅이 실제로 고객 유치에 얼마나 기여하는지, 또는 크레딧 라인 확장이 고객의 디폴트 확률에 어떤 영향을 미치는지 등을 파악하기 위해 인과추론이 어떻게 활용될 수 있는지를 보여주고 직관과 얼마나 차이가 나는지 확인해 줍니다.

       

      결론
      본 도서는 인과추론을 통해 데이터 기반 결정을 내리고자 하는 모든 이들에게 이론적인 충실한 배경지식을 제공해 주는 필수 자료입니다. 저자는 복잡할 수 있는 인과 추론의 개념을 쉽게 이해할 수 있도록 설명하였고, 이를 통해 독자들이 자신의 비즈니스 문제에 인과추론을 적용할 수 있도록 도와줍니다. 이 책은 이론적 지식과 실용적 적용 사이의 균형을 잘 맞추도록 노력하고 있으나, 다수의 수식이 나오는 등 이론적인 부분에 조금 더 무게감이 있습니다. 데이터 과학자, 비즈니스 분석가, 그리고 의사 결정권자들이 복잡한 비즈니스 환경에서 보다 정확한 결정을 내리고 싶은 이들에게 추천합니다.

       

      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

    • [북리뷰-IT] 실무로 통하는 인과추론 with 파이썬 (한빛미디어, 2024)

       

      "실무로 통하는 인과추론 with 파이썬"은 인과추론에 대한 실용적인 접근법을 제공하는 독특한 책입니다.  
      이 책은 인과추론의 기본 개념부터 시작하여, 편향 보정, 이질적 효과와 개인화, 패널 데이터, 그리고 대안적 실험 설계에 이르기까지 다양한 주제를 다룹니다.  
      이 책은 파이썬을 사용하여 인과추론의 핵심 개념을 이해하고 실제 문제에 적용하는 방법을 배울 수 있게 해줍니다.

       

       

      책의 주요 내용

       

      이 책의 목차를 보면, 인과추론의 기본 개념을 소개하는 첫 부분에서 시작하여, 편향 보정, 이질적 효과와 개인화, 패널 데이터, 그리고 대안적 실험 설계에 이르기까지 다양한 주제를 체계적으로 다루고 있습니다.  
      각 장은 주제에 대한 깊이 있는 이해를 돕기 위해 실제 사례와 실습을 통해 구체적인 내용을 설명하고 있습니다.

       

      PART 1 인과추론 기초

      • 1장 : 인과추론 소개
        • 연관성이 인과관계와 왜 다른지와 연관성을 인과관계로 만드는 방법을 배울 수 있습니다. 또한 인과적 추론을 이해하는 방법으로 잠재적 결과 표기법을 소개하고 있습니다. 잠재적 결과 프레임워크를 통해 우리는 통계 자료를 두 가지 가능한 현실로 간주합니다. 하나는 처치를 받은 것이고 다른 하나는 처치를 받지 않은 것입니다. 불행하게도 인과 추론의 근본적인 문제로 인해, 동시에 관측할 수 없고 그 중 하나만 관찰할 수 있습니다.
      • 2장 : 무작위 실험 및 기초 통계 리뷰
        • 인과추론에 있어서 가장 근본이되는 방법이라고 할 수 있는 무작위 실험으로 부터 시작해서 인과관계를 추정하는 몇 가지 기본 방법을 안내합니다. 무작위 실험이 왜 인과적 영향을 추론하는 가장 간단하고 가장 효과적인 방법인지를요. 바로 실험군(T-group)과 대조군(C-group)을 비교 가능하게끔 만들어 주는 것이죠. 무작위 실험을 항상 할 순 없지만, 우리가 할 수 있는 이상적인 실험이 무엇인지를 생각하도록 합니다.
        • 온라인 수업이 대면 수업에 비해 학업성취도 저하를 유발하는 것을 알아냈습니다. 또한 통계학적으로 유의한 결과임을 확인했고, 두 집단의 평균 신뢰구간을 비교하고, 차이에 대한 신뢰구간을 살펴보고, 가설검정을 수행해서 p값을 확인했습니다.
      • 3장 : 그래프 인과모델
        • 인과추론의 식별 부분에 중점을 두어, 더 잘 이해하고 표현하기 위한 언어로서 그래프 모델들을 안내합니다. 그래프에서의 조건부 확률의 규칙에 대해서, 또한 편향으로 이어질 수 있는 몇 가지 구조에 대해 탐색합니다.
        • 첫 번째는 교란(confounding)인데, 처치와 결과가 우리가 계산하거나 통제할 수 없는 공통의 원인을 가지고 있을 때 발생합니다. 두 번쨰는 선택 편향(selection bias)인데, 동일한 효과에 대한 조건화로 인해 발생합니다. 세 번째 구조는 선택 편향의 한 형태인데, 이번에는 매개 변수에 대한 과도한 통제로 발생합니다. 이런 과도한 통제로 발생한 편향은 처치가 무작위로 할당된다고 하더라도 발생할 수 있습니다. 선택 편향은 종종 그저 아무것도 하지 않음으로써 고칠 수도 있지만, 우리는 행동에 편향되어 있기 때문에 사물을 통제하는 아이디어가 득보다 실이 많을 때도 그것을 영리하다고 보는 경향이 있습니다.

       

      PART 2 편향 보정

      • 4장 : 유용한 선형회귀
        • 회귀분석에 대해 배우지만, 머신러닝 책에서 보는 관점과는 다른 방향으로 배웁니다. 회귀분석을 주로 교란 요인을 보정하거나 분산 감소에 사용합니다.
        • 조건부 독립성이 유지될 때 직교화를 이용해 처치가 무작위로 배정된 것처럼 보이게 할 수 있습니다.
      • 5장 : 성향점수
        • 편향을 보정하는 두번째 방법인 역확률 가중치를 알아봅니다. 이것 또한 처치를 모델링해야하는데, 이는 인과추론 문제에서 처치 배정 메커니즘을 생각하는 것이 얼마나 중요한지를 알려줍니다.
        • doubly robust estimator 를 만드는 선형회귀와 경향 점수를 결합하는 방식을 알아봅니다. 이 추정량은 하나의 모델만 정확한 것을 요구하기 때문에 그런 이름이 붙었습니다. 만약 경향 점수 모델이 맞다면 종속변수 모델이 틀렸더라도 우리는 인과 효과를 추정할 수 있습니다. 반대로 종속변수 모델이 맞다면 경향 점수 모델이 틀리더라도 인과 효과를 추정할 수 있습니다.

       

      PART 3 이질적 효과와 개인화

      • 6장 : 이질적 처치효과
        • 이질적 처치효과의 개념을 소개합니다. 핵심 아이디어는 실험 대상마다 처치효과가 다를 수 있다는 것입니다. 이 효과를 안다면 효과적으로 실험 대상에 처치를 배정할 수 있지만, 인과추론의 근본적인 문제로 인해 이 효과는 관측할 수 없습니다. 하지만 처치와 공변량 간의 상호작용 항을 포함하는 선형회귀 분석을 사용하여, 처치효과가 개별 대상 수준에서 관측되지 않더라도 그룹 효과를 추정할 수 있습니다.
      • 7장 : 메타러너
        • 처치변수를 feature로 사용해 S러너를 활용하는 것이 가장 쉬운 접근이라고 할 수 있습니다. 이것은 처치가 결과의 약한 예측 변수가 아닐 때 잘 작동하는 경향이 있습니다. 그렇지 않은 경우엔, S러너는 종종 제로로 편향되거나 처치를 완전히 무시하기도 합니다. 
        • 조금 더 복잡한 T러너를 사용하여 러너에게 처치를 강제적으로 인식하도록 할 수 있습니다. 여기서는 각 처치 수준마다 각각의 머신 러닝 모델을 맞추는 것입니다. 이것은 모든 처치 수준에 충분한 샘플이 있는 경우에는 잘 작동하지만, 하나의 처치 수준의 샘플 크기가 작으면 모델을 크게 정규화해야 할 수 있으므로 실패할 수 있습니다. 
        • 이를 보완하기 위해 데이터 수가 매우 적게 추정된 모델에서 발생할 수 있는 잠재적인 오류를 수정하기 위해 두 번째 단계 모델과 경향성 점수 모델을 사용하는 X러너를 사용하여 한층 더 복잡하게 할 수 있습니다.

       

      PART 4 패널데이터

      • 8장 : 이중차분법
        • 여러 기간에 걸쳐 동일한 대상에 대해 여러 측정값이 있는 데이터인 패널 데이터를 사용하는 방법을 살펴봅니다. 이 경우 개체(entity)를 제어하는 고정 효과 모델을 사용해, 모든 대상과 시간이 변하지 않는 변수를 고정할 수 있습니다. 고정 효과 모델은 교란변수를 통제하는 강력하고 매우 설득력 있는 방법이며 랜덤이 아닌 데이터를 사용하는 것만큼이나 효과가 좋습니다.
      • 9장 : 통제집단합성법
        • 여러 제어 집단을 결합하여 처치된 집단과 유사하게 만드는 Synthetic Control을 만들 수 있다는 것을 배웁니다. 이 Synthetic Control을 통해 우리는 처치가 없었다면 처치된 집단에 어떤 일이 일어났을지 알 수 있습니다.
        • 처치되지 않은 집단이 실제로 처치된 척하고 효과도 계산해봅니다. 이것들은 플라시보 효과였습니다. 처치 없이도 관찰할 수 있는 효과였습니다. 우리는 그것들을 사용하여 우리가 추정한 처치 효과가 통계적으로 유의한지 확인합니다.

       

      PART 5 대안적 실험 설계

      • 10장 : 지역 실험과 스위치백 실험
        • 사용 가능한 실험 대상의 수가 다소 부족한 경우를 대비한 두 가지 대안적 실험 설계를 살펴봅니다.
      • 11장 : 불응과 도구변수
        • 사람들이 처치 받지 않기로 선택할 수 있을 때 불응 문제가 발생합니다. 많은 회사들은 고객이 선택할 수 있는 제품이나 서비스를 제공하므로, 불응은 흔한 일입니다. 
        • 불응을 다룰 때 도구변수를 활용하는 방법을 배웁니다. 도구변수는 교란 없이 처치에 영향을 주고, 처치를 거치지 않으면 결과에 영향을 미치지 않는 변수입니다.
      • 12장 : 더 배울 내용

       

       

      책의 장점 및 특징

       

      이 책은 통계와 머신러닝에 관한 수학과 이론에 치우치지 않으면서 인과추론의 핵심 개념을 이해하기 쉽게 설명하고 있습니다. 또한 최신 연구 결과들을 충실히 담고 있어, 이론과 실제 사이의 균형을 잘 맞추고 있습니다.  
      파이썬 실습을 통해 실무적이고 실전적인 학습을 균형 있게 다루고 있어, 곁에 두고 필요할 때 찾아볼 수 있는 지침서이자 참고서로서도 손색이 없습니다.

       

      ● 실무 중심적인 접근 : 이론과 수학적 설명에 치우치지 않고 실제 비즈니스 문제 해결에 초점을 맞춰 다룹니다. 
      ● 파이썬 실습 : 각 장의 내용을 파이썬 코드로 실습하며 직접 적용해 볼 수 있습니다. 
      ● 최신 연구 결과 : 최근 인과추론 분야의 발전을 반영하여 최신 연구 결과들을 다룹니다. 
      ● 체계적인 구성 : 기초부터 응용까지 단계별로 학습할 수 있도록 체계적으로 구성되어 있습니다. 
      ● 명확하고 간결한 설명 : 전문 용어를 최소화하고 쉬운 용어로 설명하여 이해하기 쉽습니다.

       

       

      인과추론에 대한 실질적인 이해를 돕는데 필수적인 책

       

      이 책은 인과추론의 중요성을 강조하며, 데이터 분석이 우리의 추론과 의사결정을 대신하기 시작하면서 현상에 대한 인과관계가 빅데이터의 홍수 속에 파묻혀 점점 더 모호해지고 있다는 점을 지적합니다. 
      이러한 문제를 해결하기 위한 방법을 제시하며, 데이터에서 원인과 결과를 추론하는 것이 어렵지만 불가능하지 않다는 메시지를 전달합니다.

       

      은행 종사자로써, 책을 읽어보고 업무에 적용할 수 있는 몇 가지를 생각해 봤습니다.

       

      1. 마케팅 효과 분석 및 최적화 

      • 캠페인 효과 분석
        • A/B 테스트를 통해 다양한 마케팅 캠페인의 효과를 정확하게 비교하고 최적의 캠페인을 선정할 수 있습니다.
        • 고객의 인구 통계, 행동 및 기타 특성을 고려하여 이질적 효과 분석을 수행하여 각 고객에게 가장 효과적인 캠페인을 제공할 수 있습니다.
      • 고객 세분화 및 타겟팅
        • 성향점수 분석을 통해 고객을 세분화하고, 각 세분화 그룹에 맞춤형 마케팅 메시지를 제공하여 마케팅 효율성을 높일 수 있습니다. 
        • 고객의 과거 거래 내역, 상품 이용 패턴 등을 기반으로 개인화된 상품 추천 시스템을 구축하여 고객 만족도를 높일 수 있습니다. 

       

      2. 신용 위험 관리 및 평가 

      • 신용 불량 예측
        • 과거 데이터를 기반으로 머신러닝 모델을 구축하여 신용 불량 위험이 높은 고객을 사전에 예측하고 대비할 수 있습니다.
        • 인과추론 모델을 통해 다양한 변수가 신용 불량 위험에 미치는 영향을 정확하게 분석하고, 위험 관리 전략을 개선할 수 있습니다.
      • 사기 예방
        • 고객 거래 데이터를 분석하여 사기 행위를 사전에 예측하고 차단할 수 있습니다. 
        • 인과추론 모델을 통해 사기 행위의 원인을 파악하고, 보다 효과적인 사기 예방 시스템을 구축할 수 있습니다. 

       

      3. 상품 개발 및 가격 책정 

      • 고객 니즈 분석
        • 고객 설문 조사 데이터를 분석하여 고객의 니즈를 정확하게 파악하고, 이에 맞는 새로운 상품을 개발할 수 있습니다. 
        • 인과추론 모델을 통해 다양한 변수가 고객 니즈에 미치는 영향을 분석하고, 고객 만족도를 높일 수 있는 상품 개발 전략을 수립할 수 있습니다. 
      • 가격 민감도 분석
        • 고객의 가격 인식 및 구매 패턴을 분석하여 최적의 상품 가격을 책정할 수 있습니다. 
        • 인과추론 모델을 통해 가격 변화가 고객 구매에 미치는 영향을 분석하고, 수익성을 극대화할 수 있는 가격 정책을 수립할 수 있습니다.

       

      4. 리스크 관리 및 규제 준수 

      • 운영 리스크 분석
        • 은행 내부 데이터를 분석하여 다양한 운영 리스크 요인을 식별하고 평가할 수 있습니다. 
        • 인과추론 모델을 통해 리스크 요인의 상호 연관성을 분석하고, 효과적인 리스크 관리 전략을 수립할 수 있습니다.
      • 규제 준수 검증
        • 규제 관련 데이터를 분석하여 은행의 규제 준수 여부를 검증할 수 있습니다. 
        • 인과추론 모델을 통해 규제 위반 가능성을 사전에 예측하고, 규제 준수를 위한 시스템을 구축할 수 있습니다.

       

      5. 고객 서비스 개선 및 운영 효율성 향상 

      • 고객 만족도 분석
        • 고객 만족도 조사 데이터를 분석하여 고객 불만족 요인을 파악하고 개선할 수 있습니다. 
        • 인과추론 모델을 통해 고객 만족도에 영향을 미치는 변수를 분석하고, 고객 만족도를 높일 수 있는 전략을 수립할 수 있습니다.
      • 운영 효율성 분석
        • 은행 운영 데이터를 분석하여 비효율적인 프로세스를 개선하고 운영 효율성을 높일 수 있습니다.

       

       

      "한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다."

       

      #북리뷰  #책  #IT  #인과추론  #데이터분석  #머신러닝  #파이썬  #마케팅  #신용위험  #상품개발  #가격책정  #리스크관리  #규제준수  #고객서비스  #운영효율성  #고객만족도  #A/B테스트  #성향점수  #이질적효과  #개인화  #사기예방  #고객니즈  #가격민감도  #운영리스크  #규제위반

       

    • 데이터 분석을 할 때에 대부분이 상관관계를 바탕으로 회귀모델을 만드는 것에 그치게 됩니다.

      다양한 시각화 도구들을 활용하여 분석하는데 그치는 경우가 많은데 반해

       

      이 책은 통계적이론 특히 위 사진의 FWL 이론을 활용하여, 요인들 간의 관계분석을 수학적 통계이론들을 활용하여

      보다 구체적인 판단이 가능하도록 돕는 기술이 `인과추론` 입니다.

       

      지금 국내에 출간된 유일한 `인과추론` 개념의 A-Z까지 다루는 기본서로, 옮긴이의 주석이 꼼꼼하게 잘 추가되어 원서가 있는 분들이라도 번역본을 돈을 주고서라도 꼭 읽어볼 만한 가치가 있는 책이었습니다.

       

      %% 본 리뷰는 IT 현업개발자가, 한빛미디어 책을 제공받아 작성한 서평 입니다 %%

       

      ※ 본 리뷰는 IT 현업개발자가, 한빛미디어 책을 제공받아 작성한 서평입니다.%

      ※ 본 리뷰는 IT 현업개발자가, 한빛미디어 책을 제공받아 작성한 서평입니다.

      ※ 본 리뷰는 IT 현업개발자가, 한빛미디어 책을 제공받아 작성

    • 머신러닝, 데이터 분석, 사무자동화, 모두 파이썬과 연관된 키워드입니다.

       

      "요즘 머신러닝이 인기라던데??"

      같은 마음으로 유튜브에서 파이썬 문법 영상을 몇개 보다 보면 어느순간 이런 생각이 듭니다.

      이렇게 배운 파이썬 문법으로 데이터 분석은 어떻게 하는거고 머신러닝은 어떻게 하는건데???

      프로그래밍 언어를 공부하다가 흥미를 잃게 되는 순간이 바로 이런 순간이죠.

      이 책은 데이터 분석은 어떻게 하는건데??에 대한 해답을 알려주는 책입니다.

      "실무로 통하는 인과추론 with 파이썬"은 실무적 경험이 풍부한 저자가 이론에 입각한 실습 과제를 제시하고, 다양한 팁을 수록하여 '인과추론'이라는 카테고리에서 파이썬을 활용한 데이터 분석을 경험할 수 있도록 저술하였습니다.

       

      파이썬 문법을 어느정도 익혔다면, 데이터 분석을 해보고 싶은데 어떻게 시작해야 할지 잘 모르겠다면, 이 책을 추천합니다.


      사실 엄밀히 말해서 이 책은 파이썬 데이터 분석 입문자를 위한 책은 아닙니다.

      저자가 책의 앞부분에서 몇번에 걸쳐 경고했듯 실무를 경험하고 있는 개발자들을 위한 책이기 때문에 입문자가 읽기엔 다소 어려운 내용들이 군데군데 있기 때문입니다.

      하지만 저는 오히려 그런 점이 입문자에게 도움이 된다고 생각했습니다.

      독자가 당연히 알고 있다고 가정한 채로 사용된 다양한 용어들이 바로 입문자들이 필수로 알아야 하는 키워드라는 뜻이기 때문에 도리어 입문자들에게 데이터 분석가가 되기 위해 필요한 공부거리들을 속성으로 알려준다고 생각하기 때문입니다.

      역시 저자가 언급한대로, 책을 1회독 하며 부족한 부분을 탐구하고 2회독에 접어들면 그때 다시 인사이트를 얻을 수 있을 것입니다.


      입문자를 위한 책이 아니라고 언급하지만 마냥 불친절한 책은 아닙니다.

      중간중간 NOTE 섹션에 저자의 꿀팁들이 수록되어 있어 실무자의 시각에서 데이터 분석에 대한 꿀팁들을 접할 수 있습니다.


      제 생각에 이 책의 최대 진입장벽은 다양한 수식과 그래프가 아닐까 생각합니다.

      수포자였던 저로써는 책에 잔뜩 기록되어 있는 수식들이 머리를 아프게 했습니다.

      하지만 데이터분석은 수학의 통계학에 속한다고 생각하기 때문에 머리아픈 수식들을 이해하는 것 역시 데이터 분석가가 되기 위한 기본 소양이라고 생각했습니다.


      다행히 실습 코드도 다양하게 수록되어 있으니 수학책 같았던 느낌이 조금은 옅어지기도 합니다 ㅎㅎ...


      파이썬으로 데이터 분석을 해보고 싶으신가요?

      지금 "실무로 통하는 인과추론 with 파이썬 책"을 펼치고, 인과추론이라는 카테고리를 통해 실무적 관점에서 데이터 분석을 경험해보시기 바랍니다.

       

      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

  • 내용이 없습니다.
  • 내용이 없습니다.
닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?