한빛출판네트워크

대학교재

IT CookBook, 데이터 과학 기반의 파이썬 빅데이터 분석

한빛아카데미

집필서

판매중

IT CookBook, 데이터 과학 기반의 파이썬 빅데이터 분석
좋아요: 4
  • 저자 : 이지영
  • 출간일 : 2020-12-30
  • 페이지 : 440쪽
  • ISBN : 9791156645078
  • 물류코드 :4507
본 도서는 대학 강의용 교재로 개발되었으므로 연습문제 해답은 제공하지 않습니다.

합계 : 28,000

  • 데이터 과학과 빅데이터 분석의 개념을 이해하고 빅데이터 분석에 필요한 핵심 파이썬 문법을 배울 수 있습니다.

    4차 산업혁명, 데이터 과학, 빅데이터의 관계를 이해하고 빅데이터 분석에 적용할 데이터 과학 방법론을 배웁니다. 빅데이터 분석에 필요한 핵심 파이썬 문법을 살펴보고 빅데이터 수집 방법으로 유용한 파이썬 크롤링 방법도 실습과 함께 살펴봅니다.

     

    기본 분석부터 머신러닝 기반의 프로젝트까지 14개 핵심 분석 방법을 실습으로 배울 수 있습니다.

    데이터 과학 방법론과 빅데이터에 대한 이해를 바탕으로 통계 분석, 텍스트 빈도 분석, 지리 정보 분석과 같은 기본적인 분석 프로젝트를 실습으로 배울 수 있습니다. 그리고 머신러닝의 지도 학습 방식인 회귀, 로지스틱 회귀, 결정 트리를 사용하는 분류 분석과 비지도 학습의 K-평균 군집화를 프로젝트로 다루고 텍스트 마이닝 프로젝트로 실습을 마무리합니다.

     

     

    도서 특징

     

    데이터 과학 방법론으로 배우는 파이썬 빅데이터 분석 프로젝트

     

    데이터 과학의 개념, 파이썬 기초, 데이터 크롤링 방법을 익힌 후 14개의 프로젝트를 ‘연구 목표 설정→데이터 수집→데이터 준비→데이터 탐색→데이터 모델링→결과 시각화’ 순의 데이터 과학 방법론에 따라 실습하는 책입니다. 통계 분석, 텍스트 빈도 분석, 지리 정보 분석부터 머신러닝 기반의 회귀 분석, 분류 분석, 군집 분석, 텍스트 마이닝 등의 핵심 분석 방법과 시각화 기법도 함께 익힐 수 있습니다.

     

    1.png

     

  • [저자] 이지영

    서경대학교 컴퓨터과학과를 졸업하고 동대학원에서 소프트웨어공학을 전공하였으며 연세대학교 대학원에서 머신러닝 빅데이터 분석을 전공하여 박사 과정을 수료하였습니다. 현재 서경대학교 소프트웨어학과(컴퓨터과학과) 겸임 교수로 재직 중이며 빅데이터&AI 프로젝트 컨설턴트와 프로젝트관리기술사로 활동하고 있습니다. 대표 저서로는 『자바로 배우는 쉬운 자료구조』(2009년 우수학술도서 선정), 『C로 배우는 쉬운 자료구조(개정3판)』이 있습니다. 주요 연구 분야는 소프트웨어공학, 머신러닝/딥러닝 알고리즘, 딥러닝 기반 자연어 처리 등이며 자료구조, 파이썬 프로그래밍, 데이터 크롤링, 빅데이터 분석 등을 강의하고 있습니다.

  • PART 01 빅데이터 분석 – 이해

    Chapter 01 4차 산업혁명과 데이터 과학

    01 4차 산업혁명의 이해

    02 4차 산업혁명을 실현하는 데이터 과학

    03 4차 산업혁명 서비스 사례

    요약/연습문제


    Chapter 02 빅데이터의 이해와 활용

    01 빅데이터의 이해

    02 빅데이터의 활용

    요약/연습문제

     

    Chapter 03 데이터 과학 기반의 빅데이터 분석

    01 빅데이터 산업의 이해

    02 빅데이터 분석 방법과 접근법

    03 빅데이터 분석을 위한 데이터 과학 방법론

    요약/연습문제

     

    PART 02 빅데이터 분석 – 준비

    Chapter 04 파이썬 프로그래밍 기초

    01 파이썬 시작하기

    02 변수와 객체

    03 자료형과 연산자

    04 조건문과 반복문

    05 함수

    06 파일 처리

    07 데이터 분석을 위한 주요 라이브러리

    요약/연습문제

     

    Chapter 05 파이썬 크롤링 - API 이용

    01 네이버 API를 이용한 크롤링

    02 공공데이터 API 기반 크롤링

    요약/연습문제

     

    Chapter 06 파이썬 크롤링 – 라이브러리 이용

    01 정적 웹 페이지 크롤링

    02 동적 웹 페이지 크롤링

    요약/연습문제


    PART 03 빅데이터 분석 – 기본 프로젝트

    Chapter 07 통계 분석

    01 [기술 통계 분석 + 그래프] 와인 품질 등급 예측하기

    02 [상관 분석 + 히트맵] 타이타닉호 생존율 분석하기

     

    Chapter 08 텍스트 빈도 분석

    01 [영문 분석 + 워드클라우드] 영문 문서 제목의 키워드 분석하기

    02 [한글 분석 + 워드클라우드] 한글 뉴스 기사의 키워드 분석하기

     

    Chapter 09 지리 정보 분석

    01 [주소 데이터 분석 + 지오맵] 지리 정보 분석 후 맵 생성하기

    02 [행정구역별 데이터 분석 + 블록맵] 행정구역별 의료기관 현황 분석하기

     

    PART 04 빅데이터 분석 – 머신러닝 프로젝트

    Chapter 10 회귀 분석

    01 [선형 회귀 분석 + 산점도/선형 회귀 그래프] 환경에 따른 주택 가격 예측하기

    02 [회귀 분석 + 산점도/선형 회귀 그래프] 항목에 따른 자동차 연비 예측하기

     

    Chapter 11 분류 분석

    01 [로지스틱 회귀 분석] 특징 데이터로 유방암 진단하기

    02 [결정 트리 분석 + 산점도/선형 회귀 그래프] 센서 데이터로 움직임 분류하기

     

    Chapter 12 군집 분석

    01 [K-평균 군집화 분석 + 그래프] 타깃 마케팅을 위한 소비자 군집 분석하기


    Chapter 13 텍스트 마이닝

    01 [감성 분석 + 토픽 모델링] 영화 리뷰 데이터로 감성 예측하기

    02 [감성 분석 + 바 차트] 코로나 뉴스 텍스트의 감성 분석하기

    03 [토픽 분석 + LDA 토픽 모델] 뉴스 텍스트에서 코로나 토픽 분석하기

     

    부록

    01 아나콘다 주피터 노트북 설치 및 사용하기

    02 개발자 모드 사용하기

    03 KoNLPy 라이브러리 설치하기

  •  

  • 내용이 없습니다.
닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?