한빛출판네트워크

IT/모바일

IT CookBook, R로 배우는 데이터 과학

분석에서 예측을 위한 모델링까지

한빛아카데미

집필서

판매중

좋아요: 0
  • 저자 : 양윤석 , 오일석 , 강래형
  • 출간일 : 2019-05-08
  • 페이지 : 440쪽
  • ISBN : 9791156644460
  • 물류코드 :4446
본 도서는 대학 강의용 교재로 개발되었으므로 연습문제 해답은 제공하지 않습니다.

합계 : 27,000

  • 다양한 생활 데이터로 쉽게 배우는 데이터 과학

     

    데이터에서 가치를 발견하고 이를 문제 해결에 활용하는 데 관심이 많은 사람들을 위한 데이터 과학 입문서입니다. 프로그래밍 경험이 전혀 없어도 시작할 수 있도록 R의 기본 사용법부터 데이터 과학의 주요 주제인 데이터 정제와 가공, 시각화, 모델링과 예측까지 충실히 설명합니다. 데이터 과학 학습을 위한 전형적인 데이터뿐만 아니라 현실감 있는 다양한 생활 데이터도 다양하게 실습해볼 수 있어 스스로 더 재미있는 데이터를 찾아 활용할 수 있는 기초 체력도 다질 수 있습니다. 

     

     

    부/장별 요약 

     

    1. 데이터 과학의 시작(1~2장) : 데이터 과학의 개념을 정립하고, 베이스 R과 R 스튜디오로 간단한 데이터를 실제로 다뤄봄으로써 데이터 과학의 세계로 들어갑니다.
    2. R의 데이터형과 연산(3장) : 변수, 데이터형, 연산자, 벡터, 데이터 프레임, 리스트를 배우며 R의 기본기를 다집니다.
    3. 데이터의 취득•정제•가공(4~5장) : 데이터 취득을 위한 파일 읽기와 쓰기, 데이터 정제를 위한 제어문과 결측값•이상값 처리, 데이터 가공을 위한 dplyr 라이브러리 사용법 등을 익힙니다.
    4. 데이터 시각화(6장) : 베이스 R과 ggplot2 라이브러리의 시각화 함수를 이용해 데이터를 이리저리 살피며 전체 데이터를 한눈에 직관적으로 알아볼 수 있게 만드는 방법을 익힙니다.
    5. 모델링과 예측(7~10장) : 7~ 9장에서는 데이터를 가장 잘 설명할 수 있는 모델을 만들고 이 모델로 예측하는 방법을 학습합니다. 10장에서는 모델의 성능을 평가하는 방법과 가장 좋은 모델을 선택하기 위한 기준을 알아봅니다.
    6. 텍스트 마이닝(11장) : 텍스트 데이터를 처리하는 방법을 익히기 위해 문서 단어 행렬을 구축하고 한국어와 영어에 대한 단어 구름을 그려봅니다.
    7. 프로젝트(12장) : 지금까지 학습한 전 과정을 구글 플레이 스토어 앱 데이터에 단계별로 적용해봅니다.

     

    R로 배우는 데이터 과학_960.jpg

     

  • [저자] 양윤석

    전북대학교 바이오메디컬공학부 교수로 재직 중이다. 서울대학교 제어계측공학과를 졸업하고, 2002년에 서울대학교 의용생체공학과에서 박사학위를 받았다. 2002~2005년에 ETRI에서 선임연구원으로 재직했다. 주요 연구 분야는 에너지 수확과 휴먼-컴퓨터 인터페이스, 그리고 바이오 공학을 이용한 적정기술이다. 전북대학교 교수들로 구성된 록밴드 Profs에서 베이스 기타를 맡고 있다.

    [저자] 오일석

    전북대학교 컴퓨터공학부 교수로 재직 중이다. 서울대학교 컴퓨터공학부를 졸업하고, KAIST 전산학과에서 박사학위를 받았다. 주요 연구 분야는 기계 학습, 컴퓨터 비전, 패턴인식이다. 저서로는 한빛아카데미의 『기계학습』(대한민국학술원 2018년 우수학술도서)과 『컴퓨터 비전』(대한민국학술원 2015년 우수학술도서), 교보문고의 『패턴인식』(문화체육관광부 2009년 우수학술도서) 등이 있다.

    [저자] 강래형

    전북대학교 유연인쇄전자공학과 교수 및 로스알라모스연구소-전북대학교 한국공학연구소 연구소장으로 재직 중이다. 경북대학교 기계공학부와 전자전기공학부를 졸업하고, KAIST 항공우주공학과에서 박사학위를 받았다. C 언어 기초, 컴퓨터 프로그래밍의 기초, 데이터 과학 기초 등의 강의로 2018년 전북대 참스승 수업분야 최우수상을 수상했다. 주요 연구 분야는 구조 동역학 및 비파괴 검사다.

  • Chapter 01 데이터 과학 알아보기

    01 데이터 홍수 시대

    02 데이터 과학 열풍

    03 데이터 과학이란?

    04 데이터 과학의 절차

    4.1 세상과 상호작용하는 데이터 과학

    4.2 이 책에서 다루는 범위와 내용

    05 데이터 과학 관련 분야

    06 데이터 과학 자원

    6.1 데이터 저장소

    6.2 온라인 교육 사이트

    6.3 소프트웨어 도구

    6.4 R 공식 문서

    역사 속의 데이터 과학

    단원문제

     

    Chapter 02 데이터 과학으로 풍덩

    01 도구 챙기기

    02 데이터와 친해지기

    03 데이터 시각화 맛보기

    04 데이터 과학 학습을 위한 좋은 습관 알아보기

    4.1 도움말 청하기

    4.2 익숙해지기

    4.3 점증적으로 생각하기

    4.4 좋은 도구 쓰기

    05 좋은 도구 익히기

    5.1 통합 개발 환경

    5.2 스크립트 창에서의 코딩

    5.3 작업 디렉토리의 지정

    5.4 라이브러리의 활용

    06 데이터와 더 친해지기

    6.1 사랑스런 iris 데이터

    6.2 돈을 벌어주는 tips 데이터

    나는 아마추어 데이터 과학자?

    단원문제

     

    Chapter 03 R의 데이터형과 연산

    01 데이터의 저장과 처리

    02 변수

    03 데이터형

    04 연산자

    05 벡터

    5.1 벡터 생성

    5.2 벡터 연산

    5.3 벡터 연산에 유용한 함수

    06 배열(행렬)

    6.1 배열 생성

    6.2 배열 연산

    6.3 배열에 유용한 함수

    07 데이터 프레임

    7.1 데이터 프레임 생성

    7.2 데이터 프레임 요소에 접근

    7.3 데이터 프레임에 유용한 함수

    08 리스트

    8.1 리스트 생성

    8.2 리스트 요소에 접근

    8.3 리스트에 유용한 함수

    유용한 R 스튜디오 사용법

    단원문제

     

    Chapter 04 데이터 취득과 정제

    01 파일 읽고 쓰기

    1.1 파일 읽기

    1.2 파일 쓰기

    02 데이터 정제를 위한 조건문과 반복문

    2.1 조건문

    2.2 반복문

    03 사용자 정의 함수 : 원하는 기능 묶기

    04 데이터 정제 예제 1 : 결측값 처리

    05 데이터 정제 예제 2 : 이상값 처리

    미국 명문 대학교의 데이터 과학에 대한 인식

    단원문제

     

    Chapter 05 데이터 가공

    01 데이터 가공이란?

    02 베이스 R을 이용한 데이터 가공

    03 dplyr 라이브러리를 이용한 데이터 가공

    04 데이터 가공의 실제

    4.1 방대한 데이터 요약

    4.2 모델링을 위한 가공

    4.3 데이터 구조 변경

    데이터 가공의 의의

    단원문제

     

    Chapter 06 데이터 시각화

    01 데이터 시각화란?

    1.1 데이터 시각화의 필요성

    1.2 시각화의 기본 요소

    02 시각화의 기본 기능

    2.1 많은 양의 데이터를 효과적으로 관찰

    2.2 데이터를 여러 관점에서 보게 함

    03 시각화 도구

    3.1 베이스 R

    3.2 시각화에 특화된 ggplot2 라이브러리

    04 시각화를 이용한 데이터 탐색

    시각화는 왜 할까?

    단원문제

     

    Chapter 07 모델링과 예측 : 선형 회귀

    01 모델링과 예측이란?

    1.1 간단한 예로 알아보기

    1.2 데이터 과학 세계의 모델링과 예측

    02 현실 세계의 모델링

    03 단순 선형 회귀

    04 단순 선형 회귀의 적용 : cars 데이터

    05 모델의 통계량 해석

    06 다중 선형 회귀

    07 다중 선형 회귀의 적용 : trees 데이터

    t-검정과 분산 분석

    단원문제

     

    Chapter 08 일반화 선형 모델

    01 일반화 선형 모델은 왜 필요한가?

    02 일반화 선형 모델

    2.1 단순 데이터에 적용

    2.2 실제 데이터에 적용 : Haberman survival 데이터

    2.3 특징 선택

    03 로지스틱 회귀

    04 로지스틱 회귀의 적용 : UCLA admission 데이터

    05 로지스틱 회귀의 적용 : colon 데이터

    과잉적합

    단원문제

     

    Chapter 09 분류를 위한 모델

    01 회귀와 분류

    02 결정 트리의 원리

    03 결정 트리 함수의 사용

    04 결정 트리의 해석

    05 랜덤 포리스트

    06 SVM과 k - NN

    07 분류 모델의 다양한 적용

    7.1 UCLA admission 데이터

    7.2 colon 데이터

    7.3 voice 데이터

    7.4 성능 측정에 대한 고찰

    기계 학습

    단원문제

     

    Chapter 10 모델의 성능 평가

    01 예측 오류는 왜 발생하나?

    02 정확률

    03 일반화 능력 측정

    04 교차 검증

    05 모델 선택

    06 정밀도와 재현율

    07 ROC 곡선과 AUC

    단원문제

     

    Chapter 11 텍스트 마이닝

    01 텍스트 마이닝 기초

    02 DTM 구축

    03 단어 구름

    04 문서 분류

    05 영어 텍스트 마이닝을 이용한 한국어 처리

    06 KoNLP를 이용한 한국어 텍스트 마이닝

    트위터 API를 이용한 말뭉치 얻기

    단원문제

     

    Chapter 12 구글 플레이 스토어 앱 데이터를 이용한 실전 프로젝트

    01 프로젝트 소개

    02 데이터 정제

    03 탐색적 데이터 분석

    04 모델링과 예측

    FAMILY 앱이 대세?

    단원문제

  •  

    • 엑셀만 알아도 할 수 있는 데이터 과학

      우와후지 이치로우 , 니시카와 히로아키 , 아사쿠라 마사미 , 모리모토 에이이치

    • 데이터 과학을 위한 통계

      피터 브루스 , 앤드루 브루스

    • 비즈니스를 위한 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고

      포스터 프로보스트 , 톰 포셋

    • 처음 배우는 데이터 과학

      필드 케이디

    • 헬로 데이터 과학 : 삶과 업무를 바꾸는 생활 데이터 활용법

      김진영

닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?