데이터 과학을 위한 통계(2판)

pjm***l2021-05-30

[리뷰]데이터 과학을 위한 통계(2판)

R이나 파이썬 프로그래밍 언어에 익숙하고 통계학을 접해본 경험이 있는 데이터 과학자들을 대상으로 한다.

이 책에서 소개하는 모든 방법은 통계학과 어느 정도 연관되어 있다.

신경망과 같이 주로 컴퓨터 과학에서 진화한 방법은 다루지 않는다.

이 책의 기본 목표는 다음과 같다.

- 데이터 과학과 관련된 통계의 핵심 개념들을 소화하기 쉽고, 따라 하기 쉽게 소개하며, 참조할 만한 읽을거리를 정리한다.

- 데이터 과학의 관점에서 어떤 개념들이 정말 중요하고 유용한지, 어떤 개념들이 덜 중요하고 그 이유는 무엇인지 설명한다.

- 대학교 때 통계와 관련된 과목들을 몇 학기 동안 들었던 경험 덕분에 이 책에 나오는 통계와 관련된 대부분의 용어들이 낯설지가 않아서 책을 보는 데 큰 어려움은 없었다. 추억이 소환 되는 짧은 시간이었다.

- 독자들에 대한 지은이들과 옮긴이의 세심한 배려와 꼼꼼한 구성이 매우 감동적이었다.

- 요즘의 시대에 데이터 과학과 빅데이터 분석에 대한 관심이 폭발적인 트랜드를 반영하여 파이썬과 R 언어에 대한 소스 코드를 동시에 제공한 것도 독자의 한 사람으로써 매우 기분이 좋았다.

- 조금 아쉬운 점은 통계학, 파이썬, R에 대한 기초 지식이 전혀 없는 독자라면 이 책을 보기가 쉽지 않겠다는 개인적인 생각이다.

- 이 책은 전통적인 통계학에 대한 책이 아니기 때문에 데이터 과학의 관점에서 통계 핵심 개념과 기법을 필요한 것만 골라 소개한다.

- 이 책에 나오는 50가지 개념을 차근차근 정리하고 코드를 실행해보면, 필수 통계 지식을 빠르게 익힐 수 있는 장점도 있다.

swan***l2021-05-24

[서평] 데이터 과학을 위한 통계(2판)

#데이터과학 #통계핵심 #데이터분석 #머신러닝통계 #통계추천

작년부터 인공지능과 딥러닝을 공부하면서 통계 기초가 정말 중요하다는 것을 절감했다.

데이터 분석과 머신러닝, 더 나아가 딥러닝을 하기 위해서는 통계의 핵심 내용을 이해해야 그다음 단계로 나아갈 수 있기 때문이다.

특히, 모두의연구소 인공지능혁신학교 AIFFEL 졸업하고 퍼실로 학생들을 코칭하는 입장이 되어보니 더 절실할 수밖에 없었다.

근데, 생각보다 데이터 과학에 정말 필요한 부분만 추려서 핵심 개념을 이해하기 쉽게 정리된 책을 찾기 어려웠다.

최근에 출간된 '데이터 과학을 위한 통계'는 정말 최고의 책이라고 추천할 수 있다.

캐글 대회라도 나갈 때 가장 기본 중 기본이라 할 수 있는 '탐색적 데이터 분석(EDA, Exploratory Data Analysis)'의 기본 개념과 시각화 부분으로 시작해서, 데이터와 표본 분포, 통계적 실험과 유의성 검정, 회귀와 예측, 분류, 통계적 머신러닝, 비지도 학습으로 목차가 정말 필요한 부분으로 잘 짜여 있다.

최근에 추천 분야를 공부하면서 '멀티 암드 밴딧(MAB, Multi-armed bandit) 알고리즘'을 스터디 친구들과 함께 파고 있는데, 어쩜 이렇게 쉽게 설명해 주고 있는지 감탄하면서 읽었다. '톰슨 샘플링(Thompson's sampling)'의 '베타 분포(Beta Distribtion)'를 이렇게 짧고 간단하고 명쾌하게 설명해 주다니! 이 개념을 제대로 알고 그때 공부를 했더라면 시간을 얼마나 절약할 수 있었을까? 역시 통계는 기초 공사가 명확해서 그 위에 쌓이는 지식들이 무너지지 않는 것 같다.

또한 마케팅 그로스 해킹 분야에서 가장 많이 사용되는 A/B 테스트 실험 설정을 위해서 기초적으로 알아야 할 통계 개념과 유의성 검정 방법에 대해서 정말 쉽게 정리되어 있다.

중간에 필요한 주요 코드들은 파이썬과 R로 제공되고 있으므로, 본인이 적용해 보고 싶은 프로그램 코드에 바로 삽입해서 돌려볼 수도 있다.

이 책의 뒷부분에도 강조되어 있는데, '파이썬과 R로 필요한 만큼만 배우는 실용주의 통계학'이라는 설명이 정말 딱 들어맞는다고 볼 수 있다.

데이터 분석가를 지향하거나, 머신러닝이나 딥러닝을 공부하는데 통계적인 기본 지식이 없어서 계속 방해받는다는 느낌이 드신다면 이 책을 통해서 그 답답함을 해소하시길 권해드린다.

이 책을 6개월 전에 알았더라면 모두연 AIFFEL 퍼실을 진행할 때 훨씬 학생들에게 도움이 많이 줬을 텐데, 지금 알게 되어 좀 미안하다는 생각이 든다. ^^

출처: https://yesicakim.tistory.com/entry/서평-데이터-과학을-위한-통계 [또하나의가능성]

pacien***l2021-05-24

[리뷰] 데이터 과학을 위한 통계(2판)

# 데이터 과학을 위한 통계(2판)

- 숫자를 싫어하고, 수학 및 통계에 대한 지식이 없는 사람이더라도 의사소통이 숫자로 이뤄지는 것을 더 편하다고 생각하는 사람들이 있습니다. 특히 사회생활을 하거나 경제활동을 하는 사람이라면 숫자로 말하고 듣고 하는 것을 중요하게 생각합니다.

- 특히 어떤 결과에 대해 보고를 하거나, 의견을 나눌 때 숫자는 반드시 필요한 요소입니다. 대화에 숫자를 제외하면 다음과 같이 애매모호한 상황이 발생합니다.

- 이번 프로젝트 성과는 전년도 보다 많이 좋아졌습니다. (그래서 얼마나 좋아졌는지?)

- 전년도 매출 대비 금년도 매출 실적이 하락하였습니다. (그래서 얼마나 하락했는지?)

- 통계학은 다른 사람에게 명확한 결과를 받아들이고, 불필요한 커뮤니케이션 비용을 줄이는데 효과적입니다. 때로는 부차적인 설명 보단 숫자로 결과를 얘기하는 것이 매우 효과적이고, 사실적입니다.

- 때로는 통계학은 범람하는 숫자들 속에서 유의미한 요소를 찾을 수 있습니다.

- 사람은 숫자로 얘기하는 것을 추상적인 표현으로 얘기하는 것보다 받아들이기 쉽지만, 단순한 숫자들의 나열은 숫자가 내포하는 핵심을 파악하기는 힘들어합니다. 그래서 주어진 숫자들을 그림으로 표현하는 작업을 수행합니다. 그림은 빠른 시간 내에 생각보다 많은 정보를 획득할 수 있도록 도와줍니다.

## 데이터 과학이란?

- 이제는 데이터 과학, 빅데이터, 머신러닝과 같은 단어들이 상당히 많은 사람들에게 친숙한 상황이 되었습니다.

- 제가 생각하는 데이터 과학이란 주어진 데이터 속에서 유의미한 정보를 찾아내고, 이를 활용하는 것이라고 생각합니다. 그렇기 때문에 데이터 과학은 상당수 많은 부분을 통계학과 공유합니다. (통계학을 다른 말로 표현하거나, 통계학을 사용한 하나의 응용 분야이기도 합니다.)

## 데이터 과학을 위한 통계(2판)는 어떤 책이었나?

- 통계학의 무서운 수학으로부터 안전하다.

- 파이썬 코드를 기반으로 통계학에서 사용하는 기초적인 개념부터 머신러닝 알고리즘까지 **개념**과 **코드**를 주로 다룹니다. 주로 통계학을 사용한 다양한 사용법을 공부하는 응용에 집중하였습니다.

- 각 예제에 대한 시각화가 매우 잘 되어있다.

- 개발자가 변수(또는 함수 등) 이름을 어떻게 지으면 좋을까? 하며 고민하는 것과 같이, 시각화는 데이터를 다루는 사람이라면 어떻게 표현하는 것이 좋을까?를 고민합니다. 주어진 결과를 바탕으로 어떤 의사결정을 내릴 자료이기 때문입니다.

- 이 책을 보면서 '굳이 관련 전공자가 아니어도 읽어봐도 좋겠는데?'라는 생각이 들었습니다. 복잡한 알고리즘을 이해하지 못하더라도(또는 필요하지 않더라도) 데이터의 형식과 이를 그래프로 표현하는 방법을 배우는데 매우 효과적이라 생각합니다.

- `더 읽을 거리`를 제공하여 추가적인 **학습에 대한 방향**을 제시한다.

## 통계는 정말 필요할까?

- 숫자를 잘 다루는 기술은 강력한 무기를 들고 있는 것과 같은 것이라 생각합니다.

- 이러한 무기를 들고 있다면, 필요한 상황에서 긍정적인 부분을 강조할 수 있고, 불필요한 상황에선 부정적인 부분을 감출 수 있습니다.

- 즉 통계학은 자신이 활용할 때는 예리한 무기로 사용할 수 있고, 상대방이 활용할 때는 단단한 방패가 되어 현혹되지 않도록 도와줍니다. 따라서 강력한 무기와 방패를 사용할 수 있도록, 통계 공부는 가히 필수라고 얘기하고 싶습니다.

> 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

rer***l2021-05-23

빠르게 통계와 머신러닝을 파이썬으로 코딩하면서 알고자하는 분에게 추천하는 책입니다.

qor***l2021-05-23

데이터 과학을 위한 최고의 참고서!!

통계학과 데이터 과학의 만남: 데이터 과학을 위한 통계, 2판

‘데이터’의 중요성이 날로강조되는 요즘이다. 최근 화두인 4차 산업 혁명의 핵심 기술은관점에 따라 여러가지로 나눌 수 있지만, 인공지능과 데이터 활용 기술은 핵심 중의 핵심이라는 데 이견이별로 없을 것이다. 인공지능이 21세기에 들어 각광받게 된데에는 컴퓨팅 파워의 급격한 발전, 인터넷 등 초고속 네트워크를 기반으로 하는 통신 기술과 함께 스마트폰 등 다양한 장치로부터 생산되는 대용량의 데이터가 큰 역할을 했다. 머신 러닝으로 대표되는 최근의인공지능 기술은 학습을 위한 대용량의 데이터가 필수적이다. 이렇게만 보면 4차 산업 혁명의 핵심이 데이터라고 해도 과언이 아닐 것이다.

이렇게 데이터, 특히 과거에는 생각할 수도 없을 만큼 대량의 데이터를처리하는 방법은 데이터 과학이라는 분야를 더욱 활발히 발전시키고 있다. 전통적으로 대량의 데이터를 다루는학문은 통계학이었다. 통계학은 현재의 데이터 과학에서도 여전히 유효하며, 데이터 과학을 발전시키는 큰 축을 이루고 있다. 실제로 데이터 과학은통계학, 컴퓨터 과학, 정보 기술, 도메인 특화 영역 등 여러 분야의 융합 학문이라고 할 수 있다.

‘데이터 과학을 위한 통계(2판)’은 데이터 과학과 관련된 통계의 핵심 개념들을 알기 쉽게 소개하며, 데이터과학의 관점에서 통계학의 많은 개념 중, 어떤 내용이 중요하고, 유용한지과학적인 이유를 들며 설명하고 있다.

이 책은 7개의 챕터(장)로 구성되어 있다. 1장, ‘탐색적데이터 분석’에서는 테이블 데이터, 위치 및 변이 추정, 데이터 분포 탐색에 대해 다룬다. 2장, ‘데이터와 표본 분포’는 임의표본추출과 표본편향, 선택편향과 함께 정규 분포, 긴 꼬리 분포, 이항분포, 푸아송 분포 등 다양한 분포에 대해 소개한다. ‘통계적 실험과 유의성검정’이라는 주제의 3장은 A/B검정, 가설검정, 재표본추출, 다중검정, 자유도및 검정력과 표본 크기 등을 이야기하고 있다. 4장의 ‘회귀와예측’에서는 단순 선형 회귀, 다중 선형 회귀, 회귀를 이용한 예측 및 회귀방정식 해석, 회귀진단, 다항회귀와 스플라인 회귀에 대해 다룬다. 5장 ‘분류’는 나이브 베이즈, 판별분석, 로지스틱 회귀, 분류 모델 평가 방법과 함께 불균형 데이터를 어떻게다루어야 하는지 소개한다. ‘통계적 머신러닝’의 6장은 k-최근접 이웃, 트리모델, 배깅과 랜덤 포레스트, 부스팅의 소주제를 이용하여 데이터에 따라유연하게 지역적으로 학습하는 분류와 예측방법을 다룬다. 비지도학습은 레이블이 달린 데이터를 이용해 모델을학습하는 과정없이 데이터로부터 의미를 이끌어 내는 통계적 기법을 의미하는데, 7장은 이를 다루고 있다. 7장에서는 수치형 데이터의 차원을 축소하기 위해 주로 사용하는 방법인 주성분분석과 k-평균 클러스터링을 소개하고, 수치형과 범주형이 혼합된 데이터 유형에적용할 수 있는 계층적 클러스터링, 통계 이론에 기초를 두고 더 엄밀한 접근 방식을 제시하는 모델 기반클러스터링의 내용도 포함한다.

이책은 R이나 파이썬 프로그래밍에 익숙하고, 이전에 통계학을잠깐이라도 접해본 경험이 있는 데이터 과학자를 대상으로 하고 있다. 2판으로 개정되면서 파이썬 코드가추가되어, R 뿐만 아니라 파이썬을 이용하여 실습을 진행할 수 있다.책의 중간 중간 ‘주요 개념’을 정리해주어 독자로하여금 어디에 초점을 두고 책을 읽어야 하는지, 그리고 핵심 내용을 잘 이해하고 있는 지 살펴볼 수있도록 하고 있다. 더불어 ‘더 읽을 거리’를 통해 책에서 다루고 있지 못한 내용이나 관련 자료를 찾아볼 수 있도록 안내하고 있다. ‘데이터 분석에서 머신 러닝까지, 파이썬과 R로 살펴보는 50가지 핵심 개념’이라는부제처럼 이 책은 머신러닝을 포함한 데이터 과학 전반을 통계적 관점에서 깊이 있게 다루고 있어 데이터 과학을 배우고자 하는 독자들에게 좋은 참고서가될 것이다.

** 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

byc3***l2021-05-23

파이썬으로 데이터 분석부터 머신러닝까지 깊게 배우고 싶다면 이책을 보라!

[나의 한줄 추천사]

파이썬으로 데이터 분석부터 머신러닝까지 깊게 배우고 싶다면 이책을 보라!

[책 추천 이유]

데이터 분석관련 책들은 대부분 R 로 작성되는 경우가 많은데 이책은 'R' 과 '파이썬' 동시에 제공해준다. 무엇보다도 통계학을 바탕으로 깊이있게 이야기해줌으로써 왜 이렇게 동작하는지에 대한 궁금증을 해소시켜 준다.

[내가 찾고자 했던 질문과 대답들]

1. 데이터 분석을 잘하려면 무엇을 알아야하는가?

- 데이터 분석을 하면서 계속 막히는 부분이 통계의 복잡한 용어와 실행된 결과의 해석 부분일것 같다.이책에서는 데이터 분석을 하기위한 EDA 부터 비지도 학습까지 꼭 필요한 부분에 대해서 깊게 짚어주고 있다.

2. EDA(탐색적 데이터 분석) 할때 무엇이 중요한가?

- 데이터 형태 및 분포가 중요하다. 데이터 형태는 수치형, 연속형, 이산, 범주형, 이진, 순서형의 데이터 형태를 파악해야 한다. 그 다음 데이터의 평균, 중간값, 특잇값등을 확인하여 데이터 의 도수분포표, 히스토그램, 상관관계를 파악한다.

3. 표본추출은 왜 필요한가, 어떤 방법으로 가능한가?

- 데이터의 질과 적합성을 일정 수준 이상으로 담보할수 없으면서 데이터 크기만 늘어나는 상황이다. 오히려 데이터를 효과적으로 다루기 위해서는 "데이터 편향"을 최소화하기 위한 방법으로 임의표본추출이 더 필요하다. 방법으로 "표본분포","부트스트랩(관찰된 데이터로부터 복원추출하는 방법)","정규분포", 통해서 가능하다.

4. 데이터 분석을 위한 실험은 어떻게 하는가?

- 가설을 세우고, 실험을 설계, 데이터를 수지바 추론 및 결론을 돌출한다. 직관적인 "재표본추출(부트스트랩)" 과정을 거쳐 우연에 의한 변이가 어느 정도까지 영향을 미치는 측정할수 있다.

5. 좀더 알고 싶다면?

- 코드 예제를 직접 실습하면서 하나씩 코드로 보면서 책을 보면 좀더 효과적이다.

https://github.com/gedeck/practical-statistics-for-data-scientists

moralmo***l2021-05-23

최고의 데이터 과학 입문서

2018년 말에 1판 번역서가 출간된 후로, 약 2년 반만에 새롭게 개정 2판으로 나온 Practical Statistics for Data Scientists(데이터 과학을 위한 통계) 입니다. 믿고 보는 오라일리의 데이터 과학 서적인데요.

제 경우, 작년에 해당 도서의 1판을 공부하며 많은 도움을 받았었는데, 이때 R로 작성된 예제를 참고하면서 약간 아쉬움을 느꼈던 기억이 납니다. Python에 비해 R은 상대적으로 익숙치 않아서, 종종 직관적으로 이해하기 어려웠던 것이 가장 큰 문제였는데요.

이번 2판에서는 기존 R코드로 작성된 예제와 대응되는 Python 코드를 추가로 삽입했다고 합니다. R에 완전히 대응하는 Python 코드가 추가 되었다는 것만으로도 분명 대상 독자가 훨씬 늘어나게 될 것이고, 기존 독자 입장에서도 무척 환영할만한 일입니다. 학부에서 R 수업도 수강한 적이 있고, 종종 사용할 일이 있었지만, 아직까지도 Python에 비하면 R은 너무 익숙치 않네요. ??

이미 시중에 수많은 데이터 과학 서적이 출간되어 있고, ML/DL을 비롯하여 여러 최신 기술을 다루는 서적 또한 그득그득 합니다. 하지만 그 수많은 책들 가운데서, 본 도서는 학습에 가장 큰 도움이 되었던 책 중 하나라고 단언할 수 있을 것 같습니다.

지난 해, 학부에서 데이터 과학 동아리의 리드를 맡아 일년 간 운영하였던 경험이 있습니다. 이때 겪었던 어려움 중 하나는 강의의 커리큘럼을 짜는 일이었는데요. 통계학 등의 관련 전공이 아니라는 점을 감안하여, 기초적인 통계학의 비중을 높여서 강의를 준비할 필요가 있었습니다. 이때 많은 데이터 과학 교재를 검토해보면서 최종적으로 사용했던 책이 본 도서(데이터 과학을 위한 통계 1판)와 밑바닥부터 시작하는 데이터과학 (1판) 이었습니다.

밑바닥부터 시작하는 데이터 과학이 여러 콘셉트를 다루면서, 전반적인 데이터 과학에 대한 이해 증진을 위해 활용할 수 있었다면, 본 도서는 데이터 과학의 학습을 위해 반드시, 필수적으로 알고 있어야 할 여러 통계 지식을 실용적으로 학습할 수 있는 내용을 제공하였습니다.

예컨대, 본 도서의 세 번째 챕터에서는 대조군의 이야기부터 시작해서 A/B 테스트, 가설검정의 개념과 표본추출, 통계적 유의성 검증 등과 같은 통계학 개론의 내용을 여러가지 예제 코드와 함께 제공합니다. 이미 진보된 여러 기술을 다루는(특히 컴퓨터과학에 기반한) 도서들은 이런 기초 통계적 내용을 다룰만한 여력이 없고, 다루는 것도 크게 의미가 없습니다. 그렇다고, 데이터 과학을 공부하기 위해서 학부 통계학 개론서를 처음부터 통독하는 것도 무리가 있습니다.

이러한 상황에서, 가장 최적화 된 도서가 바로 '데이터 과학을 위한 통계' 라고 생각합니다. 아주 기초적인 통계학 개념부터 시작해서, 회귀, 분류, 머신러닝, 비지도 학습까지 쭉쭉 맛을 볼 수 있는, 그야말로 데이터 과학 입문자를 위한 통계 입문서와 같은 책인데요. 특히, 이제 막 데이터 과학에 입문하려는 입문자, 또는 관련 분야의 비전공자 등, 기초를 쌓아야 될 필요가 있거나, 기초적인 부분에서 훈련이 조금 부족했던 분들에게는 정말 단비 같은 교재가 될 것입니다.

실제로 저자는 본 책의 목표를 다음 두 가지로 정의합니다.

- 데이터 과학과 관련된 통계의 핵심 개념들을 소화하기 쉽고, 따라 하기 쉽게 소개하며, 참조할 만한 읽을거리를 정리한다.

- 데이터 과학의 관점에서 어떤 개념들이 정말 중요하고 유용한지, 어떤 개념들이 덜 중요하고 그 이유는 무엇인지 설명한다.

저는 아직까지도 데이터 과학 또는 관련 분야에 관심을 가지고, 공부를 시작하려는 이들에게 가장 먼저 강력히 추천해주는 책이 본 도서입니다. 이번에 Python과 함께하는 2판이 추가되어서, 정말 기쁠 따름입니다 :)

예전에 공부하던 때에 Python 예제 코드가 함께 있었다면 정말 많은 도움을 받았을 것이란 아쉬움도 있었지만, 이번 '나는 리뷰어다'의 서평 도서로 본 도설르 받게 되어, 오랜만에 복습 할 기회를 얻을 수 있어서 한편으로는 무척 좋았습니다.

모쪼록, 데이터 과학에 관심이 있는 모든 분들에게, 강력히 추천드립니다!

본 리뷰는 한빛미디어의 도서 서평단 <나는 리뷰어다 2021> 프로그램의 일환으로, 무상으로 도서를 증정 받고 작성된 리뷰임을 고지합니다.

liebew***l2021-05-23

도서 리뷰: 데이터 과학을 위한 통계 (Practical Statistics for Data Scientists, 2판)/한빛미디어

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

나는 통계학을 전공하지 않았고, 데이터 사이언스 분야에서 업무를 하지도 않는다.

굳이 분야를 설명하자면 데이터 사이언티스트가 업무를 하기 위해 데이터를 수집하는 일을 하고 있는데 다음에 업무를 확장하게 된다면 아마도 데이터 사이언티스트 분야가 될 것 같아 어떤 분야인지 감을 잡아보기 위해 골랐던 책이다.

결론부터 말하면 너무나 지극히 통계학적이라 관련 공부를 했거나 업무에 종사하지 않는다면 이해하기 매우 어려운 책이고,

파이썬과 R 코드가 들어있으나 이 역시 파이썬과 R로 데이터 분석을 늘상 하는 사람들에게 유용한 코드이다.

당장 파이썬과 R을 시작하려면 무엇부터 해야하는지 모르는 나에게는 너무 생소한 책이었다.

책은 총 7장으로 구성되어있고, 각 장 마다 설명하고자 하는 개념의 원천과 한계점, 더 읽을 거리(주로 관련 서적이나 논문)를 소개해주는 방식으로 구성되어 있었다.

개념은 앞서 말했듯 이 분야의 초심자나 관심이 있는 일반인을 위한 수준은 아니고, 어느정도 현업에서 기초 체력 이상을 길러온 사람들이나 관련 대학/대학원 전공을 이수한 사람들을 대상으로 하기 때문에 몇 번 읽어서 이해가 될 만한 수준은 아니었다.

책 소개에서도 기초 통계학에 대한 설명을 다룬 책이 너무 쉽게 느껴지는 사람을 대상으로 한다고 했으니 내가 적절한 책을 고르지 않은 것은 맞다.

다만 현재 데이터 사이언티스트라는 직함으로 일을 하는 사람들이라면 이 정도의 통계학 지식은 베이스로 가지고 있겠구나, 라는 생각과

나중에 데이터 사이언티스트 업종으로 이직을 하려면 이 책에 있는 내용 정도는 알고 있어야 겠구나 라는 느낌을 갖게 됐는데

데이터 사이언티스트로 이직은 어렵겠다는 결론이 났다...! 혹시 모른다. 한 1년 뒤에는 내가 이 책 쯤이야 하는 정도의 지식을 갖게 되어있을지. 지금은 그렇지 않다는거다.

그럼에도 포기하지 않고 꿋꿋하게 3장까지 읽어봤고, 나의 이해 정도는 책 내용을 알듯 말듯 하면서도 책을 덮고 누군가에게 설명을 하라고 하면 한 마디도 꺼내지 못할 수준이었다.

데이터 사이언티스트 분야로의 포지션 이동에 대한 한계점을 마주하게 해준 책이다.

aul020***l2021-05-23

데이터과학을 위한 통계

lss***l2021-05-22

데이터과학을 위한 통계 - 인공지능, 분석 공부 추천

benbot***l2021-05-15

EDA는 데이터 분석의 8할