1. 왜? 통계학을 공부해야하죠? 프로그래밍은요?
통계학은 데이터 분석에서 운동에 비유한다면 기초체력에 해당합니다. 모든 운동에서 기초체력 중요하듯 데이터 분석에서는 통계학이 매우 중요합니다. 최근에 데이터분석 알고리즘에 관해 각종 매체에서 접할 기회가 많다보니, 실무에서 간단하게 알고리즘을 학습하고, 활용하는 경우가 많습니다. 하지만, 왜 이렇게 되는지, 정말 이 결과가 바른지 검정하지 못한다면, 실무에 이를 활용하는 건 너무 위험하지 않을까요? 결국 기본으로 돌아가통계학을 다시금 살피게 됩니다.
그렇다면 프로그래밍?
여러분들은 프로그래밍이라고 하면 어떤 단어가 떠오르게 되나요? 저는 로봇, 자동, 오토메이션이라는 단어가 자주 유추됩니다. 실무에선 프로그래밍을 이런 분야에 사용하는 경유가 많습니다. 내가 해야하는일을 다른 누군가가 도와 주어야하는데, 기계 즉 컴퓨터가 도와준다면, 정말 멋진일이겠죠? 데이터분석도 마찬가지로, 데이터 분석의 전과정, 수집, 가공, 분석, 검정, 결과 도출 등의 일련의 과정을 프로그래밍으로 통해 자동화한다면, 정말빠른시간에 다양한 분석을 수행하 수 있을 것입니다.
2. 파이썬으로 배우는 통계학 교과서, 이 책이 특징
이 책을 소개하기 위해, 긴 도입을 가졌습니다. 이 책은 통계학을 공부함과 동시에 프로그램으로 이를 실제 구현하고, 활용할 수 있도록 여러분들을 인도합니다. 물론 통계학을 공부하는 것만으로도 벅찰 수 있지만, 조금의 인내심 가지고 그 과정을 프로그램으로 만들면, 언제든지 손쉽게 다시 쓸 자동화 도구를 가질 수 있습니다. 그러면 자신도 모르게 능력이 변한 것을 느낄 수 있습니다.
이 책의 특징은 통계학의 기본 개념으로 파이썬을 가지고 구현하는 것입니다. 기초 통계학을 시작으로 파이썬과 주피터 노트북, 파이썬을 이용한 데이터 분석, 통계모델 기본, 정규선형 모델, 일반선형 모델, 통계학과 머신러닝까지 폭 넓은 내용을 제공합니다.
3. 장별 내용 소개
파이썬과 주피터 노트북은 30page에 걸처 설명하고 있습니다. 이 책을 소화하는데 큰 문제는 없을 정도로 정보를 제공하지만, 아무래도 프로그래밍을 처음 해보시는 분들이라면 기본적인 프로그래밍에 대한 입문 공부는 병행하는 것이 학습에 도움이 되실 것 같습니다.
1장에서는 통계 기본을 3장에서는 다변량 분석에 대해서 학습이 진행됩니다. 데이터 분석에 대해서 데이터의 특성을 파악할 수 있도록 내용을 담고 있습니다. 특히 다양한 시각화와 예시를 통해서 좀더 쉽게 이해할 수 있도록 내용을 구성했는데, 이 책의 강점이기도 합니다. 프로그래밍에 대한 결과 및 분석사항을 간단한 시각화를 통해서 계속적으로 학습시켜, 보통 통계를 접하지 않은 일반인들?(아무리 그래도 조금은 관심이 있는 그리고, 파이썬으로 데이터 공부를 조금이라도 한~ 정도입니다.)이 쉽게 이해할 수 있도록 코드와 예시를 제공합니다.