한빛출판네트워크

IT/모바일

소문난 명강의 : 김도형의 데이터 사이언스 스쿨(수학 편)

파이썬 라이브러리로 배우는 데이터 과학 필수 수학

한빛미디어

집필서

판매중

좋아요: 0
  • 저자 : 김도형
  • 출간일 : 2019-11-20
  • 페이지 : 880쪽
  • ISBN : 9791162242414
  • 물류코드 :10241

합계 : 49,500

  • “소문난 명강사 ‘김도형’이 데이터 사이언스 입문자에게 보내는 선물 같은 수학 책

     

    선형대수, 미적분, 최적화, 확률론, 검정과 베이즈 추정까지 머신러닝과 딥러닝에  필요한 모든 수학을 한권에!”

     

    이 책은 대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다. 기초부터 출발하지만 데이터 분석과 머신러닝에 필요한 모든 필수 수학을 다루며, 모든 수식은 파이썬 패키지를 활용해 코드로 보여줍니다. 스타트업 파일을 적용한 파이썬 주피터 노트북 실습 환경도 제공합니다.

    (알림 : 독자 여러분이 파이썬 언어에 대한 기초적인 지식이 있다고 가정합니다)

     

     

    ★ 이 책의 특징

    [입문자와 비전공자를 위해 기초부터 시작]

    대학에서 수학을 전공하지 않은 인공지능 개발 입문자와 현업 전문가에게 핵심 수학을 알려줍니다. 수식에 많이 사용되는 그리스 알파벳과 고등학교 과정의 수학 기호부터 설명해 누구나 차근차근 수학을 익힐 수 있습니다. 기초부터 출발하지만 데이터 분석과 머신러닝에 필요한 모든 필수 수학을 다루며, 모든 수식은 파이썬 패키지를 활용해 코드로 제시합니다.

     

    [머신러닝 이해에 필요한 핵심 내용만 선별]

    선형대수, 함수론, 미적분, 최적화 등 다양한 수학 분야를 다루지만 데이터 분석과 머신러닝에 꼭 필요한 내용만을 최소한으로 선별했습니다. 핵심 내용만 있으므로 이 책에 실린 내용을 충실히 익히면 데이터 분석과 머신러닝 이론을 효과적이고 깊이 있게 공부하는 데 도움이 됩니다. 이해가 되지 않는 부분은 반복해서 공부하시기 바랍니다.


    [파이썬 구현을 통한 이해와 응용]

    데이터 분석과 머신러닝은 코드로 알고리즘을 구현하므로 수학 수식만으로 이해해서는 부족합니다. 따라서 이 책의 모든 수식과 알고리즘은 파이썬 코드로 구현합니다. 수학을 코드로 이용하려는 개발자 입장을 고려해 알고리즘 자체를 구현하기보다는 알고리즘이 구현된 넘파이(NumPy), 심파이(SymPy), 사이파이(SciPy), 피지엠파이(pgmpy) 등의 패키지 기능을 잘 이해하고 자유롭게 사용할 수 있도록 하는 것을 목표로 합니다. 

     

    [연습 문제 300여 문항]

    책에서 설명하는 내용을 제대로 이해하고 있는지 확인하는 연습 문제 300여 개가 있습니다. 모든 연습 문제는 머신러닝의 이론을 설명할 때 나오는 수식의 일부를 미리 풀어보는 문제입니다. 연습 문제를 풀 수 있다면 나중에 나올 복잡한 수식을 쉽게 이해할 수 있습니다.

     

     

    ★ 이 책에서 다루는 파이썬 패키지

    이 책의 코드를 구현하는 데 파이썬 3.7과 다음 패키지를 사용했습니다.

    • 아이파이썬(IPython)
    • 사이킷런(Scikit-Learn)
    • 맷플롯립(matplotlib)
    • 넘파이(NumPy)
    • 시본(seaborn)
    • 사이파이(SciPy)
    • 피지엠파이(pgmpy)

     

    ★ 이 책의 구성

    [0장 파이썬 설치와 사용법]

    _ 파이썬과 파이썬 패키지를 설치하고 사용하는 방법을 배웁니다.

    _ 데이터 분석에 필요한 파이썬 패키지를 소개합니다.

    _ 아이파이썬과 주피터를 사용자에 맞게 설정하는 방법을 알려줍니다. 

     

    [1장 수학 기호]

    _ 수식에 많이 쓰이는 그리스 알파벳을 읽고 쓰는 법을 배웁니다.

    _ 머신러닝 교과서나 논문에 자주 사용되는 수학 기호의 의미를 알아봅니다. 

     

    [2장 넘파이(Numpy)로 공부하는 선형대수]

    _ 스칼라, 벡터, 행렬, 텐서의 의미와 기호, 넘파이 패키지를 사용하는 방법을 배웁니다.

    _ 행렬의 연산과 성질, 그리고 연립방정식을 다룹니다. 

     

    [3장 고급 선형대수]

    _ 기하학에서 선형대수가 어떻게 쓰이는지 알아봅니다.

    _ 고윳값분해, 특잇값분해를 공부하고 어떤 문제에 응용할 수 있는지 알아봅니다.

     

    [4장 심파이(SymPy)로 공부하는 미적분]

    _ 머신러닝에서 자주 사용되는 함수와 그 특징을 알아봅니다.

    _ 미분과 적분 공식을 배우고 심볼연산이 가능한 심파이 패키지를 사용하여 미적분을 하는 법을 익힙니다.

    _ 머신러닝에서 자주 사용되는 행렬의 미적분 공식을 공부합니다.

    _ 변분법 개념을 소개합니다. 

     

    [5장 사이파이(SciPy)로 공부하는 최적화]

    _ 최적화 문제와 최대경사법을 사용하여 최적화 문제를 푸는 방법을 알아봅니다.

    _ 사이파이 패키지를 사용하여 실제로 최적화 문제를 푸는 법을 익힙니다.

    _ 등식 제한조건이나 부등식 제한조건이 있는 최적화 문제를 푸는 라그랑주 승수법을 공부합니다.

    _ 머신러닝 이외에도 여러 분야에 널리 쓰이는 LP 문제와 QP 문제를 소개합니다. 

     

    [6장 피지엠파이(pgmpy)로 공부하는 확률론]

    _ 확률의 수학적 정의와 빈도주의 및 베이지안 관점에서 확률이 가지는 의미를 공부합니다.

    _ 확률분포함수가 어떤 과정을 통해 정의되었는지를 소개합니다.

    _ 머신러닝에서 사용하는 중요 개념인 조건부 확률과 베이즈 정리를 배웁니다.

    _ 피지엠파이 패키지를 사용하여 확률분포를 구현하고 베이즈 추정을 실행하는 법을 익힙니다.

     

    [7장 확률변수와 상관관계]

    _ 확률변수를 사용한 데이터 모형의 개념을 배웁니다.

    _ 표본 데이터의 기댓값, 분산의 의미와 분산의 기댓값이 가지는 특성을 공부합니다.

    _ 베르누이분포, 이항분포, 카테고리분포, 다항분포 등의 이산 분포와 가우시안 정규분포, 스튜던트 t분포, 카이제곱분포, F분포 등의 연속 분포의 정의와 특성, 그리고 이 분포들이 어떻게 데이터 분석에 쓰이는지 알아봅니다.

    _ 확률모수 모형에 사용되는 베타분포, 디리클레분포, 감마분포를 소개합니다. 

     

    [8장 사이파이로 공부하는 확률분포]

    _ 여러 확률변수가 가지는 상관관계를 어떻게 정의하는지 소개합니다.

    _ 가장 널리 쓰이는 상관관계 모형인 다변수 정규분포 모형에 대해 알아봅니다.

    _ 조건부 기댓값의 개념을 소개하고 머신러닝의 가장 큰 응용 분야인 예측에 어떻게 사용되는지 공부합니다. 

     

    [9장 추정과 검정]

    _ 데이터가 주어졌을 때 데이터에 기반해 판단하는 방법을 공부합니다.

    _ 가장 기본적인 데이터 기반 의사결정인 검정의 개념과 사이파이를 사용한 검정 방법을 익힙니다.

    _ 가능도의 개념과 최대 가능도 추정법을 사용하여 확률분포의 모수를 추정하는 방법을 알아봅니다.

    _ 모수 추정의 불확실성에 대해 공부하고 베이즈 정리에 기반한 베이지안 모수 추정법을 소개합니다.

     

    [10장 엔트로피]

    _ 엔트로피의 개념을 소개하고 엔트로피가 확률변수가 가진 정보량과 어떤 관계가 있는지 알아봅니다.

    _ 크로스 엔트로피와 쿨백 라이블러 발산을 사용하여 확률분포의 유사성을 비교하는 방법을 공부합니다

     

    상세이미지_700.jpg

     

     

  • [저자] 김도형

    KAIST에서 자동 제어와 신호 처리를 공부하여 박사 학위를 받았으나 금융 분야로 진로를 바꾸어 미래에셋대우에서 퀀트로 재직했습니다. 현재는 개인 퇴직연금운용을 위한 핀테크 기술 회사 베라노스 CTO이며 패스트캠퍼스 ‘데이터 사이언스 스쿨’에서 데이터 분석 관련 수학과 머신러닝을 가르칩니다. 2016년부터 ‘데이터 사이언스 스쿨’이라는 웹사이트를 운영하며 데이터 분석에 필요한 프로그래밍, 수학, 머신러닝, 딥러닝 관련 글을 올리고 있습니다.

  • 0장 파이썬 설치와 사용법

    __0.1 커맨드 라인 인터페이스 

    __0.2 파이썬 설치하기 

    __0.3 파이썬 처음 사용하기 

    __0.4 파이썬 패키지 설치하기 

    __0.5 데이터 분석용 파이썬 패키지 소개 

    __0.6 아이파이썬 및 주피터 설정 

    __0.7 구글 코랩 사용법 

    __0.8 마치며 

     

    1장 수학 기호

    __1.1 그리스 문자 

    __1.2 수열과 집합의 합과 곱 

    __1.3 마치며 

     

    2장 넘파이(Numpy)로 공부하는 선형대수

    __2.1 데이터와 행렬

    __2.2 벡터와 행렬의 연산 

    __2.3 행렬의 성질 

    __2.4 선형 연립방정식과 역행렬 

    __2.5 마치며 

     

    3장 고급 선형대수

    __3.1 선형대수와 해석기하의 기초 

    __3.2 좌표와 변환 

    __3.3 고윳값분해 

    __3.4 특잇값분해 

    __3.5 PCA 

    __3.6 마치며 

     

    4장 심파이(SymPy)로 공부하는 미적분

    __4.1 함수 

    __4.2 심파이를 사용한 함수 미분 

    __4.3 적분 

    __4.4 행렬의 미분 

    __4.5 변분법 

    __4.6 마치며 

     

    5장 사이파이(SciPy)로 공부하는 최적화

    __5.1 최적화 기초 

    __5.2 제한조건이 있는 최적화 문제 

    __5.3 선형계획법 문제와 이차계획법 문제 

    __5.4 마치며 

     

    6장 공부하는 확률론 피지엠파이(pgmpy)로 

    __6.1 집합 

    __6.2 확률의 수학적 정의와 의미 

    __6.3 확률의 성질 

    __6.4 확률분포함수 

    __6.5 결합확률과 조건부확률 

    __6.6 베이즈 정리 

    __6.7 마치며 

     

    7장 확률변수와 상관관계

    __7.1 확률적 데이터와 확률변수 

    __7.2 기댓값과 확률변수의 변환 

    __7.3 분산과 표준편차 

    __7.4 다변수 확률변수 

    __7.5 공분산과 상관계수 

    __7.6 조건부기댓값과 예측 문제 

    __7.7 마치며 

     

    8장 사이파이로 공부하는 확률분포

    __8.1 사이파이를 이용한 확률분포 분석 

    __8.2 베르누이분포와 이항분포 

    __8.3 카테고리분포와 다항분포 

    __8.4 정규분포와 중심극한정리 

    __8.5 스튜던트 t분포, 카이제곱분포, F분포 

    __8.6 다변수정규분포 

    __8.7 베타분포, 감마분포, 디리클레분포 

    __8.8 마치며 

     

    9장 추정과 검정

    __9.1 확률분포의 추정 

    __9.2 최대가능도 추정법 

    __9.3 베이즈 추정법 

    __9.4 검정과 유의확률 

    __9.5 사이파이를 사용한 검정 

    __9.6 마치며 

     

    10장 엔트로피

    __10.1 엔트로피 

    __10.2 조건부엔트로피 

    __10.3 교차엔트로피와 쿨백-라이블러 발산 

    __10.4 상호정보량 

    __10.5 마치며 

  • ★ <소문난 명강의>시리즈 소개

    이 시리즈는 단기간에 실무 능력을 갖추게 도와줍니다. 유튜브, 블로그, 학원, 대학 등에서 이미 검증된 강의 본연의 장점을 극대화하고 더 체계화해 책으로 담았습니다. 입문자 눈높이에서 설명하고 작고 실용적인 프로젝트를 수행해 실전 능력을 키워줍니다. 빠르게 개발 능력을 배우려는 입문자와 더 다양한 경험을 쌓으려는 기존 개발자에게 유용합니다.

     

    ★ 이 책의 모태 소문난 명강의 360만 뷰 ‘데이터 사이언스 스쿨’ 소개

    저자는 2016년부터 ‘데이터 사이언스 스쿨’(datascienceschool.net)에 데이터 분석과 관련된 글과 자료를 무료로 공개하고 있습니다. 2019년 10월 1일 현재까지 누적 사용자 60만 명 이상, 누적 페이지 뷰 360만 뷰 이상이며 많은 피드백을 받고 있습니다.

     

    ‘데이터 사이언스 스쿨’ 웹사이트는 데이터 분석에 필요한 A부터 Z까지의 모든 내용을 다루는 것을 목표로 합니다. 끊임없이 내용을 수정/보완하고 있으며 데브옵스, 프로그래밍 언어, 데이터 분석을 위한 수학, 회귀분석과 시계열분석, 머신러닝, 딥러닝을 주제로 다룹니다.

     

    이 책은 ‘데이터 사이언스 스쿨’ 웹사이트 중 ‘데이터 분석을 위한 수학’에 해당합니다. 대부분 책 내용은 웹사이트에 게재되어 있습니다. 다른 내용도 책으로 정리하여 출간될 예정입니다. 많은 관심 부탁드립니다.

    • 처음 이 책을 받았을 때, 데이터 사이언스 스쿨 어디서 많이 들어봤는데라는 생각이 들었습니다. 


       


      아니나 다를까, https://datascienceschool.net/ 항상 모르는 게 있으면 구글링을 통해 들어가 보는 


       


      유명한 사이트 중에 하나 더군요.


       


      사이트에서도 많은 도움 받았는데, 저자분의 책을 이렇게 서평 하게 돼서 영광입니다. 


       


      이 책의 특징으로는 크게 4가지가 있습니다. 


       


      1. 수학을 전공하지 않는 입문자와 비전공자를 위해 기초부터 시작


       


      2. 반복되는 실습 환경설정을 스타트업 파일로 한 번에 해결


       


      3. 6자기 데이터 사이언스용 파이썬 라이브러리 사용


       


      4. 300여 연습 문제 제공


       


      개발환경으로는 파이썬3.7버전을 기준으로 하며, 패키지로는 


       


      IPython, Scikit-Learn, Jupyter Notebook, matplotlib, Numpy, Seaborn, Scipy, Pgmpy 를 사용했습니다.


       


      ★ 이 책의 구성


       


      [0장 파이썬 설치와 사용법]


       


      [1장 수학 기호]


       


      [2장 넘파이(Numpy)로 공부하는 선형대수]


       


      [3장 고급 선형대수]


       


      [4장 심파이(SymPy)로 공부하는 미적분]


       


      [5장 사이파이(SciPy)로 공부하는 최적화]


       


      [6장 피지엠파이(pgmpy)로 공부하는 확률론]


       


      [7장 확률변수와 상관관계]


       


      [8장 사이파이로 공부하는 확률분포]


       


      [9장 추정과 검정]


       


      [10장 엔트로피]


       


       














      교과서처럼 '학습목표'로 시작하는게 인상적이다!


















      개념 정의 부터 시작 한 뒤


















      예제를 통해 적용 한뒤, 연습문제를 통해 제대로 알고 있나 확인한다.


















      마지막 정리및 다음차시 예고 까지


















      어려운 수학 개념들에는 그림을 이용하여 학습자의 이해를 도왔다.











      특히 10장 엔트로피 부분은 수학을 전공하는 사람들에게도 필수로 읽어봐야 한다고 생각한다.

       

      왜냐면 KL-divergence 나 정보 이론의 경우 배운 경험이 없기 때문에, 이러한 부분이 논문에 나오게 

       

      되면 교수님도 모르는 진풍경이 일어나기도 한다.(저가 경험해봤습니다 ㅠㅠ)

       



      상호정보량 같은 정보 이론을 내가 어찌알겠는가? 

       

      하지만 이 책에서는 이렇게 쉽게 설명해주어서 적어도 논문을 읽거나 수식이 필요한 부분에 있어 

       

      큰 도움을 받을 수 있다고 생각한다. 

       

      빅데이터, AI 분야로의  진학을 희망하는 모든 사람들에게 이 책을 추천한다. 




  • 내용이 없습니다.
닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?