한빛출판네트워크

IT/모바일

Head First Data Analysis : 당신을 최고의 데이터 분석가로 이끌어줄 마법 같은 학습서

한빛미디어

번역서

판매중

Head First Data Analysis : 당신을 최고의 데이터 분석가로 이끌어줄 마법 같은 학습서
좋아요: 38
  • 저자 : 마이클 밀튼
  • 역자 : 김경태
  • 출간일 : 2013-04-11
  • 페이지 : 488쪽
  • ISBN : 9788968480119
  • 물류코드 :2011

합계 : 27,000

  • 데이터에서 필요한 정보를 제대로 뽑아내는 방법을 알려줍니다!


    세상에는 수많은 데이터가 있고, 그것을 어떻게 이해하느냐는 당신의 몫입니다. 어디서부터 시작할까요? 『Head First Data Analysis』는 당신이 엑셀이나 오픈오피스, 나아가서는 R을 사용하여 데이터를 조직화하고, 산포도와 히스토그램에서 의미 있는 패턴을 찾아내고, 휴리스틱을 사용하여 결론을 도출하고, 실험과 가설 검정을 통해 미래를 예측하게 해줍니다. 또한 명쾌한 시각화를 통해 당신이 발견한 것을 보여줍니다.

    혹시 새 제품의 성공 가능성을 조사하는 제품 개발자이거나, 캠페인의 효과를 측정하는 마케팅 매니저이거나, 데이터를 고객에게 보여줘야 하는 영업사원인가요? 또는 데이터 집약적인 기능에 책임을 져야만 하는 사업가인가요? 그렇다면 당신의 비즈니스에 유용한 도구와 데이터를 활용할 수 있도록 완벽히 가르쳐 주는 이 책을 선택하세요!

     

    대상 독자

    • 데이터를 활용하여 비즈니스에 활용하려는 마케터와 영업사원
    • 데이터 분석에 입문하려는 일반인과 학생
    • 데이터 분석이 필요한 IT 개발자, 기획자

     

     

    상세이미지

  • [저자] 마이클 밀튼

    경력 대부분을 비영리 단체의 자금 조달을 개선하는 일을 도우면서 보내왔습니다. 비영리 단체의 자금 제공자로부터 모은 데이터를 해석하고 그 결과에 따라 행동했습니다. 플로리다 뉴 칼리지(New College of Florida)에서 철학 학위를 그리고 예일 대학에서 종교 윤리 학위를 받았습니다. 그는 매우 중요한 내용이 담긴 지루한 책을 읽고 몇 년이 지난 후에 헤드 퍼스트 시리즈를 읽게 된 것이 신의 계시라고 생각했습니다. 그리고 중요한 내용이 담긴 신나는 책을 집필하는 기회를 얻은 행운에 감사하고 있습니다. 그는 도서관이나 서점에 없을 때에는 달리기를 하거나, 사진을 찍거나, 맥주를 양조합니다.

    [역자] 김경태

    한국전자통신 연구소의 연구원들로 활동 중이며 한남대학교 정보통신공학과 교수로 재직 중이다.
  • 1장_ 데이터 분석 입문: 잘게 쪼개세요
    데이터는 어디든지 있습니다. ‘데이터 분석가’이든 아니든 간에 요즘에는 누구든지 많은 양의 데이터를 취급해야만 합니다. 하지만 데이터 분석 기술이 있는 사람들은 많은 양의 데이터를 어떻게 취급해야 하는지, 그 방법을 알기 때문에 다른 어느 누구보다도 훨씬 유리한 위치에 있습니다. 그들은 가공되지 않은 숫자를 이용해 실제 세계에서 작용할 수 있는 정보를 이끌어냅니다. 그들은 복잡한 문제와 데이터를 분해하여 구조화하고, 그들의 비즈니스가 가지고 있는 문제의 핵심으로 곧바로 접근하는 방법을 압니다.

     

    2장_ 실험: 이론을 검증하라
    여러분의 생각을 증명할 수 있나요? 실제로 실험을 통해서 검증할 수 있나요? 과제를 해결하고 세상이 실제로 어떻게 돌아가고 있는지를 밝히는 데는 뛰어난 실험만한 게 없지요. 관찰한 데이터에만 의존하는 대신 잘 수행된 실험은 종종 인과관계를 파악하는 데 도움을 줍니다. 효과적인 실증 데이터가 있다면 여러분의 분석과 판단은 더욱 설득력을 가지게 될 것입니다.

     

    3장_ 최적화: 최대한 가져가기
    우리 모두는 무언가를 더 얻고 싶어 합니다. 그리고 우리는 항상 어떻게 그것을 얻을 수 있을지 알아내려 합니다. 더 얻고 싶은 것, 예를 들어 이익, 돈, 효율, 스피드는 숫자로 나타낼 수 있습니다. 데이터 분석 도구는 결정 변수를 조작해 보거나 해답과 원하는 것을 최대한으로 얻을 수 있는 최적점을 찾는 데 도움을 줄 수 있습니다. 이 장에서는 이러한 기능이 구현되어 있는 도구 중 하나로, 강력한 스프레드시트 해 찾기(Solver) 패키지를 사용하게 될 것입니다.

     

    4장_ 데이터 시각화: 그림은 여러분을 더 똑똑하게 만듭니다.
    수치표 만으로는 충분하지 않습니다. 여러분의 데이터는 여러분이 셀 수 없을 정도로 많은 변수를 가지고 있기 때문에 매우 복잡합니다. 수많은 스프레드시트를 차분히 검토하는 것은 그저 번거로운 일에 그치지 않습니다. 실제로 그것은 시간 낭비가 될 수 있습니다. 명확하면서도 많은 변수를 다루는 시각화는 여러분이 스프레드시트를 가만히 보고만 있다면 놓쳤을 전체적인 상을 작은 공간을 할애하여 보여줍니다.

     

    5장_ 가설 검증: 그렇지 않다고 말해줘
    세상은 설명하기 까다로울 수 있습니다. 그리고 미래의 사건을 예측하기 위해 복잡하고 서로 성질이 다른 데이터를 다뤄야 할 경우에는 극도로 어렵습니다. 그렇기 때문에 분석가들은 명백한 설명을 채택해서 이것을 참이라고 가정하는 일은 하지 않습니다. 주의 깊게 데이터를 분석하여 추론하면 수많은 선택지를 꼼꼼하게 평가하고, 여러분이 가지고 있는 모든 정보를 모델에 통합할 수 있습니다. 여러분은 이제 반증에 대해 배웁니다. 반증은 직관적이지는 않지만 신중하게 추론할 수 있는 강력한 방법입니다.

     

    6장_ 베이지안 통계: 첫 걸음을 내딛다
    여러분은 항상 새로운 데이터를 수집할 것입니다. 그런데 여러분이 수행하는 모든 분석에는 문제와 관련된 데이터를 반드시 포함시킬 필요가 있습니다. 반증을 통해 서로 다른 종류의 데이터 소스를 다루는 방법을 살펴봤는데, 확률은 어떻게 구할 수 있을까요? 이 질문에 답하기 위해서는 베이즈 정리라는 매우 유용한 분석 도구가 필요합니다. 이 정리는 기준 비율을 도입해 끊임없이 변화하는 데이터에서 쉽사리 알 수 없는 중요한 정보를 발견하는 데 도움을 줍니다.

     

    7장_ 주관적인 확률: 숫자에 대한 믿음
    때로는 숫자로 표현하는 것이 좋은 방법입니다. 정말 그렇습니다. 하지만 그 숫자가 여러분 자신의 심리 상태와 여러분의 믿음을 표현할 때에만 그렇습니다. 주관적인 확률은 여러분의 예감에 진정한 엄밀함을 더할 수 있는 간단한 방법이며, 여러분은 지금부터 그 방법을 살펴볼 것입니다. 여러분은 그 과정에서 표준편차를 이용하여 데이터 분포를 평가하는 방법을 배우게 될 것입니다. 그리고 지금까지 배웠던 강력한 분석 도구 중 하나가 특별히 모습을 드러낼 것입니다.

     

    8장_ 휴리스틱 분석: 인간처럼 분석합니다
    현실 세계에는 여러분이 다룰 수 있는 것보다 더 많은 변수가 있습니다. 여러분이 얻을 수 없는 데이터가 항상 존재합니다. 비록 여러분이 이해하고 싶은 것에 대한 대부분의 데이터를 가지고 있더라도 최적화하는 방법은 항상 찾기 힘든 일이며 시간을 많이 소모하게 됩니다. 다행히도 실제로 여러분이 하는 대부분의 생각은 ‘합리적인 극대화’가 이뤄지지 않았습니다. 여러분이 빨리 결정을 내릴 수 있도록 불완전하고 불확실한 정보를 경험 법칙을 사용하여 처리합니다. 그리고 정말 멋지게도 이러한 경험 법칙은 실제로 동작하고 데이터 분석가에게도 중요한 (그리고 필요한) 도구로 사용됩니다.

     

    9장_ 히스토그램: 숫자의 모양
    차트에서 얼마나 많은 것을 알 수 있을까요? 데이터를 그림으로 나타내는 방법은 매우 많습니다, 그 중 하나는 특별합니다. 그것은 히스토그램입니다. 히스토그램은 일종의 차트 비슷한 것으로, 데이터의 개요를 보여주는 매우 빠르고 쉬운 방법입니다. 여러분은 이 작고 강력한 차트를 사용하여 데이터의 분포, 변동성, 중심 집중 경향 등을 측정하려고 합니다. 데이터 집합이 아무리 크더라도 히스토그램을 그리면 데이터에서 무슨 일이 일어나는지 ‘볼’ 수 있습니다. 또한 우리는 놀랄 만큼 강력한 새로운 무료 소프트웨어 도구를 사용하여 그 작업을 하게 됩니다.

     

    10장_ 회귀: 예측
    예측하세요. 회귀는 제대로 사용하면 특정값을 예측할 수 있는, 믿을 수 없을 정도의 강력한 통계 도구입니다. 대조 실험과 함께 사용하면 회귀는 미래를 예측하는 데 정말 도움이 됩니다. 기업은 회귀를 최대한 활용하여 고객의 행동 양식을 설명하는 모델을 구축할 수 있습니다. 이제 곧 회귀를 적절히 사용하면 매우 유용하다는 사실을 알게 될 겁니다.

     

    11장_ 오류: 오류를 잘 처리하다
    세상은 복잡합니다. 그렇기 때문에 예측이 제대로 적중하지 않더라도 크게 실망할 일은 아닙니다. 하지만 여러분이 오차 범위와 함께 예측 결과를 제공한다면 여러분과 고객은 평균적인 예측값을 알 수 있을 뿐만 아니라 일반적으로 어느 정도의 오차가 예상될지를 알 수 있습니다. 오차를 나타내면 여러분의 예측과 의견에 대해 더 자세한 전망을 세울 수 있게 됩니다. 그리고 이 장에서 소개하는 도구를 사용하면 오차를 제어할 수 있는 방법을 익혀 오차를 가능한 한 억제하고 신뢰도를 향상시킬 수 있습니다.

     

    12장_ 관계형 데이터베이스: 관련 지을 수 있나요?
    변수가 너무 많은 데이터를 어떻게 구조화할 수 있을까요? 스프레드시트는 행과 열로 된 2차원입니다. 수차원의 데이터를 다룰 때 테이블 형식은 순식간에 구식이 되어버리죠. 이 장에서는 스프레드시트로는 다변량의 데이터를 관리하기 어렵다는 것을 먼저 깨닫고, 관계형 데이터베이스 관리 시스템을 사용하여 다양한 쌍의 다변량 데이터를 쉽게 저장하고 가져올 수 있는 방법에 대해 배우게 될 겁니다.

     

    13장_ 데이터 정리: 순서를 부여하다
    데이터 구조가 엉망이면 데이터를 사용할 수 없습니다. 또한 데이터를 수집하는 많은 사람들은 정돈된 데이터를 유지하기 위해 귀찮은 작업을 마다하지 않고 있습니다. 데이터가 정리되지 않으면 데이터를 분할하여 식을 실행하거나 데이터를 보는 것조차 할 수 없습니다. 데이터를 무시하는 것이 나을 겁니다. 그렇죠? 사실 더 적절하게 처리할 수 있습니다. 데이터에 필요한 형식에 대한 명확한 전망을 가지고 몇 가지 텍스트 조작 도구를 사용하면 심하게 지저분한 데이터를 유용한 상태로 바꿀 수 있습니다.

     

    부록 i_ 남은 것들: 상위 10개 항목(다루지 않은 것들)
    정말 큰 일을 해내셨습니다. 하지만 데이터 분석은 매우 광범위하고 항상 진화하는 분야이기 때문에 아직 학습할 것이 많이 남아있습니다. 이 부록에서는 본문에서는 설명할 기회가 없었지만 이어서 학습할 주제에 대한 톱 10을 다룹니다.

     

    부록 ii_ R을 시작해봅시다: R 설치하기
    모든 데이터 처리 기능은 그 내부를 살펴보면 엄청나게 복잡합니다. 하지만 다행히도 R을 설치하고 시작하는 일은 단 몇 분이면 할 수 있습니다. 이 부록에서는 R을 설치하는 방법을 설명합니다.

     

    부록 iii_ 엑셀 분석 도구 설치: 분석 도구
    엑셀의 멋진 기능 중 일부는 기본적으로 설치되어 있지 않습니다. 맞아요. 3장에서 최적화를 실행한다든지, 9장에서 히스토그램을 실행하려면 해 찾기 기능 및 분석 도구를 활성화해야 합니다. 이 두 확장 기능은 엑셀에 기본적으로 포함되어 있지만 여러분이 설정해주지 않으면 활성화되지 않습니다.

  •  

    • 이번에 처음 헤드 퍼스트 책을 읽어보았습니다.


       


      그리고 헤드퍼스트라는 브랜드가 학습서로서 최고라는 것을 알았습니다.


       


      책 첫머리에 책의 구성에 대한 철학을 보고 깊은 감명을 받았고,


       


      덕분에 데이터 분석에 대해 아주 재미있게, 이해하며, 기억할 수 있었습니다.


       


       


      단, 11장 오류 파트부터는 조금씩 내용이 부실하다는 생각이 들었습니다.


       


      그래도 데이터 분석의 큰 그림을 그릴 수 있었습니다.


       


      또한, 통계학에 대한 기초 개념이 있는 사람이 이 책을 읽는다면


       


      데이터 분석에 대한 구체적인 이미지를 그릴 수 있을 거란 생각을 했습니다.


       


       


      고맙습니다. 헤드 퍼스트!


       

    • 최근 IT서비스분야에서 가장 주목하는 키워드는 BIG DATA이다.

      기존의 관계형 DATABASE에서는 분석이 힘들고 오래걸리던 대량의 무의미한 DATA를 어떻게 비지니스에서 활용가능한 유용한 정보로 도출할 것인가? 란 질문에 대한 해답을 얻고자

      많은 분들이 BIG DATA 관련 책을 읽고, 기술을 공부하고 사업을 구상한다.

      재경DOMAIN에서 IT서비스를 업으로 삼고 있는 나도 이 조류에 예외일수는 없다.

      하지만 BIG DATA를 떠나 과연 나는 DATA 분석에 대한 개념이나 방법에 관해 알고 있는지 자문해 보았다.

      결론은 기초가 부족하고, BIG DATA에 대한 연구 이전에, DATA 분석에 대한 연구가 우선되어야 한다는 것이다.



      내가 찾은 해답이 바로 "Head First Data Analysis" 이다.



      이책 역시 다른 Head First 시리즈가 그러하듯, 빽빽하고 이론적인 설명으로 졸음을 부르는 다른 책들과 달리

      재미있는 삽화들과 다양한 도형으로 눈을 지루하지 않게 만들어준다.

      처음부터 화장품회사의 매출확대, 경제악화에 따른 커피브랜드 매출악화에 대한 대처하기 등 우리주변에서

      마주할 수 있는 실사례를 통해 DATA분석에 대한 설명을 확대해나가면서 자연스럽게 독자가

      DATA분석이 무엇인지 고민하고 이해할 수 있게 되어있는 구성덕분에 지루하지 않게 DATA분석에 공부할 수 있었던것 같다.



      이 책은 DATA분석의 정의와 단계에서부터 , 몇가지 확률통계방법, 관계형데이터가 무엇인지까지 설명한다.

      그리고 R과 엑셀을 DATA분석에 어떻게 활용하는지도 보여준다.

      부록으로는 친절히 컴맹을 위한 DATA분석을 위해 사용하는 엑셀의 분석도구와 R의 설치법도 다루고 있다.



      HeadFirst 시리즈를 경험해본 사람이라면 이 책이 어떻게 독자를 주제를 향해 이끌어주는지,

      그리고 어느수준의 깊이에 대해 말하는지 알수 있으리라 믿는다.



      이책 한권을 읽었다고 해서 DATA분석에 대해 깊이 알게되거나 유능한 DATA ANALYST가 된다고 믿지는 않는다.

      하지만 처음부터 두꺼운 이론서에 지치고싶지 않다면, 지루하지 않은 방식으로 DATA분석에 대한 기초를 다지고 싶다면

      워밍업으로 이 책을 추천한다.

    • 마케팅과 사업팀 이외 데이터 통계를 직접 분석하는 경우는 흔치 않다. 주관적으로 분석되고 정의내려진 다양한 데이터들이 뉴스, 논문, 증권가 분석 자료에 널리 퍼져있기 때문이다. 기획자를 비롯한 대부분의 사람들은 주어진 통계 데이터를 인용하는 정도 수준이었다.



      하지만, 시장에 "빅데이터"라는 이름을 달아버린 거대한 데이터에 대한 시장의 관심이 높아지며, 누구나 빅 데이터와 밀접해야 하는 것이 오늘 날의 현실이다. 오늘 이시간에도 무수히 많은 사용자 데이터가 축적되고 있지만 어떤 식으로 사용될지, 제안 해야 할지 감이 안잡힌다면, 직접 빅데이터를 분석,제안해야 하는 때가 왔다면 당연 "Head First"를 추천하겠다.



      좋은 책을 고르는 가장 좋은 방법은 1, 말머리와 2, 목차를 읽었을 때, 내가 필요한 내용이 있는지를 살피는 것이다.



      이 책은 처음 빅데이터를 다루기 시작한 사용자가 어떤 절차(커리큘럼)에 의해 정보를 배울 수 있는지부터 데이터를 정리/엑셀도구로 분석 통계 내리는 일 까지 데이터 분석의 A to Z를 보여준다.



      제목만 보았을때, 감이 안오더라도 "Head First"는 "그림"과 "예시"가 함께하기 때문에 이해가 쉽다.



      이 때문에 한빛미디어의 "Head First"를 먼저 구매하곤 한다. 보통 어떤 정보를 습득할 때 책을 구매하는 순서는



      1)헤드퍼스트 2)오라일리 시리즈 3)그중에서도 쿡북으로 초입/학습/적용 의 단계를 거치곤 한다.





      그 중 헤드퍼스트는 해당 정보 지식에 관하여 흥미를 가질 지, 어려움부터 가질 지를 보여주는 첫 단추이다.



      헤드퍼스트는 그림과 사례, 연습문제가 함께하기 때문에 책에서 제안하는 "캐릭터"에 감정이입하며 같이 문제를 해결해나가는 듯한 느낌을 받는 것이 가장 큰 장점이다. 헤드퍼스트의 "쉽게 다가가기" 전략은 언제나 옳다.



      각 챕터의 첫 장에는 위 이미지와 같이 제목, 이미지, 내용이 적혀있다. 중요한 키워드는 볼드 처리되어있으며, 한 장에서 다음에 배울 내용을 요약하여 보여준다.



      독자와 대화하는 듯한 QnA와 연습문제 등을 통해서 지식을 반복 심화할 수 있다.



      헤드퍼스트 데이터 아날리시스(Data Analysis)를 두 번 정도 반복하면 데이터 분석에 대한 기초를 확실히 다질 수 있다. 하지만 이 모든 내용은 어느정도의 "데이터를 추출 할 수 있는 환경"이 부여되었을 때 이루어진다. 책에서는 데이터가 어디에선가 제공되고 우린 분석만 하면 된다. 하지만 실제 시장에서는 어떤 데이터가 필요할 지 발로 뛰며 조사해야 하고, 생각보다 머리를 쓰는 때 보다 몸과 시간으로 매달리는 부분이 많다는 점도 간과해선 안된다.



      책에서 나오는 방법은 어찌보면 고등학교, 통계 등의 시간에서 배운 내용을 엑셀로 옮기는 방법. 보기 좋게 정리하는 법의 확장된 버전일 지도 모른다. 하지만 기초를 간과하면 심화를 배울 수 없음을 기억해야 한다.

    • 이번 도서는 빅데이터 시대가 부각이 되면서 중요시 되는 "데이터 분석"에 대한 책입니다. 빅데이터는 아래와 같은 특징을 가지면서 각 분야에서 비지니스 마케팅 전략부분에서 많은 관심을 가지고 있습니다.



      * 빅데이터의 특징 ( 3V )



      1) 대용량 ( Volume ) - 경제적 타당성으로 방대한 내용의 저장이 가능해짐

      2) 다양성 ( Variety ) - 저장이 불가능 했던 다양한 것들이 디지털화 시켜서 저장되어진다 .

      3) 빠른속도 ( Velocity ) - 고성능 분산병렬처리 기술의 보급



      고객들에 의해서 자동으로 발생되는 로그 데이터, 임의의적으로 생성하는 데이터들 속에서 "의미 있는" 어떤 데이터를 찾는 것이 제일 중요한 부분입니다. 이런 데이터를 찾는데 필요한 인프라구축, 기술은 당연히 제일 중요한 부분입니다.



      요근래 빅데이터에 대한 많은 책들이 등장을 하였습니다. 빅데이터에 대한 개념부터 시작을 해서 정치적인 부분, 사회적인 부분, IT기술 분야에서의 사례들이 많이 포함되어 있었습니다. 그리고 그 안에서 사용되는 기술 - 하둡, 맵리듀스, R프로그래밍 등에 대해서도 각각 주제를 선택하여 책으로 나왔습니다. 하지만, 이런 기술들 익히는데는 인프라를 구축하는데(환경을 구성하는데) 많은 시간을 소비해야 하며, 일반 사람들에게 접근하기는 매우 어려움이 있습니다.



      이 책은 이런 문제점들을 해소하면서 매우 쉽게 풀이한 책입니다. "Head First"는 입문자를 대상으로 쓰여지며, 흐름도 및 프로세스를 그림으로 모두 표현을 하여 이해를 높입니다. 어떤 어려운 주제가 나올지라도 우선은 입문자 레벨에서 중급레벨까지 갈 수 있는 길을 열어줍니다.



      이 책도 전문IT서적에서 어렵게 설명하는 부분을 단계별로 쉽게 설명을 해놓았습니다.







      데이터의 중요성이 어떤 것이지, 이런 데이터들이 비지니스 경영입장에서 어떤 중요성을 가지고 있는지 설명을 하고 있으며, 이런 수많은 데이터들의 관계성을 RDBMS를 통해서 어떻게 연결성을 찾을 수 있을지 고민하고 있습니다. 그리고 마지막는 빅데이터 분석에서 개인 사용자들이 응용할 수 있는 R프로그래밍에 대해 간단하게설명이 되고 있습니다.





      책 구성은 샘플 사진을 보듯이, 글보다는 그림들이 페이지에서 더 차지하고 있습니다. 상세한 환경분석을 구성하는 엔지니어링에게는 참고자료로 활용할 수 있으며, 입문자들에게는 그림을 통해 기억을 오랫동안 할 수 있으며 응용을 할 수 있는 기회를 줍니다. 다른 사람들에게 "데이터 분석"에 대한 설명을 할 시에 이 그림들을 샘플로 사용한다면 좋은 전달자가 되지 않을까 싶습니다.

    • 근 몇 년전부터 IT업계에서 떠오른 화두를 말하라 하면 대다수의 IT업계의 종사자들은 Big Data를 언급할 것이다. 폭발적으로 증가한 Data를 이용하여 Business Insight를 찾는다는 Big Data Trend는 미래 기업의 생존을 결정할 요소라고 말하는 사람도 있다.

      사실 Big Data라는 주제의 근저를 들어다보면 분석 대상 데이터의 범위가 확대되었다는 것이지, 기존에 있던 데이터 분석에서 벗어나지는 않는다.

      달리 말한다면, Big Data로 인해 Data에 대한 관심이 과거 어느 때보다 높아졌으며, 데이터 분석 능력에 대한 중요성이 강조되는 시대가 도래되었다는 것이다.

      하지만, 데이터 분석이라는 것이 말로는 쉽지만 막상 자신이 한다면 그렇게 만만치 않은 업무라는 것은 웬만한 사람들은 느낄 것이다. 당장 고등학교 때 배우는 수학의 범위를 보아도 이산 분포, 분산, 표준 편차 등 (데이터 분석에 필요한) 통계 수학 영역은 미적분과 더불어 가장 골머리를 썩히는 분야지 않는가?

      개인적으로 데이터 분석에 대한 학습이 필요하다고 느끼면서도 그 어려움에 주저하던 차에 Head First Data Analysis를 만나게 되었다. 다른 Head First 시리즈처럼 쉽고 친절하게 나를 데이터 분석 분야로 이끌어 주겠지 하는 믿음을 가졌었고, 역시 나의 믿음을 저버리지 않았다.

      책은 총 13장으로 구성되어 있는데, 각 장 별로 가상의 고객을 대상으로 데이터 분석하는 사례를 다루고 있다. 각 사례를 다루면서 여러 가지 데이터 분석 기법을 설명해주고 있다.

      데이터 분석을 배울려면 통계에 관련된 수학을 피할 방법은 없다. (이 때문에 많은 사람들이 통계를 공부하는 것을 포기하기도 한다!) 역시나 이 책에서도 꽤 많은 수학 공식이 나온다. 하지만, Head First 시리즈답게 최대한 간결하게 수학 공식을 나타내고 있고 또한 어렵지 않게 이해할 수 있도록 도와주고 있다. 중학교 수학 정도로 쉽게 설명하기 때문에 내용을 이해하는게 큰 무리가 없다.

      또한 데이터 분석 업무의 특성 상 엑셀과 같은 데이터 분석 도구를 사용하는 것은 피할 방법이 없다. (모든 데이터를 수기로 작성하고, 대조, 조회, 필터링 하는 것을 손으로 하는 어리석은 사람은 없을것이다.) 기본적으로 이 책의 주요 분석 도구는 엑셀이다. 엑셀 기능 중 약간의 함수만 사용하기 때문에 내용을 따라하는데 어려움을 느끼진 않았다. 후반부에 좀더 고급적인 데이터 분석을 할 때는 오픈소스 데이터 분석 도구로 유명한 R을 사용한다. R은 엑셀과 달리 사용이 무척 까다롭다. 하지만 책의 부록으로 R을 사용하는 방법을 수록해두어 사용에 큰 어려움을 겪지는 않는다.

      국가가 선진국에 가까워질수록 사회 구성원들은 직관에 의거한 행동보다는 (데이터에 근거한) 확률에 의거하여 행동하는 경향을 보인다. (세계에서 가장 발전한 통계 분석은 모두 미국에서 나왔다!) 비단 Big Data가 아니더라도 우리나라에서 데이터 분석은 계속 중요성이 높아질 분야라고 생각한다. 이런 시대적 조류에 맞추어 데이터 분석을 학습하고 싶어하는 분들에게 Head First Data Analysis는 무척 괜찮은 데이터 분석 입문서라고 감히 추천한다.

    • 시간이 난다면 - 먹고사니즘이 해결된다면 - MathLab 같은 도구를 배워우고 싶다는 생각을 가지고 있었다. 이번에 O"REILLY의 Head First Data Analysis을 경험할 읽을 좋은 기회를 얻었다.



      정말 이렇게 재미 있게 쓴 책은 드물었던것 같다. 이 책을 읽기 시작한지 24시간 만에 모두 독파하였다.



      이 Data Analysis에 대한 책을 펼치고 읽으면 마치 Data Analyst가 된 기분이다. 이 책은 사실적이고 실무에 가까운 전개로 독자들이 책에서 눈을 떼지 못하게 한다. 회사에서 짤리지 않기 위해서라도 독자는 정말 정확한 모델로 Error까지 포함하여 분석된 보고서를 심플하게 고객이나 보스에게 제공해야 한다. 독특한 방법으로 유머와 긴장감을 준다.



      이 책을 읽는데 필요한 수학은 고등학교 수준이면 충분하다. 또한, 엑셀을 다룰줄 알아야 한다. 그리고 R을 살짝 소개하고 다루므로 타이핑을 할 줄 알아야 한다.



      이 책은 데이터 분석 입문에 대한 것이다. 경험을 통해 데이터분석가가 어떤 역할을 해내고 어떤 지식이 필요한지 소개한다.



      그리고 이 책은 깊은 수준의 엑셀이나 R 매뉴얼이 아니다. 엑셀이나 R을 다룰줄 모른다면 따로 심도있게 공부해야 한다.



      이 책에 예제로 나오지만, 직관적인 판단보다, 모델과 가설을 통해 판단을 내리는것이 경영에 필요 하겠다는 생각이고, 요즘 미국에서 Data Analyst가 뜨고 있다는 이유도 충분히 이해가 되었다.



      이 책을 데이터 분석을 시작하려는데 어떻게 해야 할지 모르겠다 분에게 권한다. 그리고, 마치 경영학이 경제, 회계, 재무, 조직, 인사, 마케팅, 무역 등을 종합한것처럼 데이터 분석을 통한 정보 분석도 회사 경영에 필요한 지식이므로 가볍게 읽을 수 있으므로 경영자나 임원들에게 권한다.

    • 데이터과학 입문: 구글, MS, 이베이 데이터과학자에게 배우다

      레이철 슈트 , 캐시 오닐

    • 헬로 데이터 과학 : 삶과 업무를 바꾸는 생활 데이터 활용법

      김진영

    • 비즈니스를 위한 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고

      포스터 프로보스트 , 톰 포셋

    • 파이썬 라이브러리를 활용한 데이터 분석(수정보완판)

      웨스 맥키니(Wes Mckinney)

    • 비즈니스 활용 사례로 배우는 데이터 분석:R

      사카마키 류지 , 사토 요헤이

닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?