한빛출판네트워크

IT/모바일

혼자 공부하는 R 데이터 분석

1:1 과외하듯 배우는 데이터 분석 자습서

한빛미디어

집필서

판매중

혼자 공부하는 R 데이터 분석
좋아요: 302
  • 저자 : 강전희 , 엄동란
  • 출간일 : 2022-01-17
  • 페이지 : 444쪽
  • ISBN : 9791162245019
  • 물류코드 :10501

합계 : 19,800

도서판매처

  • 혼자 해도 충분하다! 1:1 과외하듯 배우는 R 데이터 분석 자습서

    이 책은 독학으로 R 데이터 분석을 배우는 입문자가 ‘꼭 필요한 내용을 제대로’ 학습할 수 있도록 구성했다. ‘무엇을’, ‘어떻게’ 학습해야 할지조차 모르는 입문자의 막연한 마음을 살펴, 과외 선생님이 알려주듯 친절하게, 그러나 핵심적인 내용만 콕콕 집어준다. 책의 첫 페이지를 펼쳐서 마지막 페이지를 덮을 때까지, 혼자서도 충분히 데이터 분석을 배울 수 있다는 자신감과 확신이 계속될 것이다! 

     

    30명의 베타리더 검증으로, ‘함께 만든’ 입문자 맞춤형 도서

    30명의 베타리더와 함께 구성하여 입문자에게 맞는 난이도, 분량, 학습 요소 등을 적극 반영했다. 어려운 용어와 개념은 한 번 더 풀어쓰고, 복잡한 설명은 눈에 잘 들어오는 그림으로 풀어냈다. ‘혼자 공부해 본’ 여러 입문자의 초심과 눈높이가 책 곳곳에 반영된 것이 이 책의 가장 큰 장점이다.

     

     

    누구를 위한 책인가요?

    • 프로그래밍도 통계도 처음 배우는 입문자
    • R 언어로 데이터 분석을 시작하고 싶은 비전공자
    • 학부에서 R 언어를 수강했지만, 여전히 아쉬움이 남아 있는 통계 전공자
    • 학원이나 강의로 따로 데이터 분석을 배우기에는 시간과 여건이 부족한 직장인
    • 데이터 분석에 관심 있는 일반인 누구나

     

     

    혼공R_상세이미지(940).jpg

  • [저자] 강전희

    컴퓨터공학과 인공지능을 공부했으며, 게임회사를 거쳐 현재 TVING에 재직 중이다. AI, 빅데이터, 정보 보안, 온갖 Gadget과 업무 자동화 등에 관심이 많다. 국내 최초로 MCN 사업인 DIA TV를 론칭한 경험을 바탕으로 사업 개발, 광고 영업, 광고 데이터 분석을 해왔으며 현재 클라우드 엔지니어로 일하고 있다.

    [저자] 엄동란

    통계학을 공부한 후 컨설팅 회사에 입사하여 CRM 기반의 분석 업무를 경험하였다. L사에서 회원 기반의 빅데이터 분석 업무를 담당했고, 빅데이터 기획, 분석 외에 마케팅 분야에서도 다양한 경험을 보유하고 있다.

     

  • Chapter 01 빅데이터와 R

    : R 언어를 소개하고 데이터 분석에서 왜 R 언어를 사용하는지 알아봅니다.

    01-1 빅데이터와 R 언어

    __빅데이터 시대

    __R 언어를 소개합니다

    __R의 장단점

    [3가지 키워드로 정리하는 핵심 포인트]

    [확인문제]

     

    01-2 개발 환경 설치

    __R 설치 파일 다운로드하기

    __R 설치하기

    __R 실행하기

    __R 스튜디오 설치 파일 다운로드하기

    __R 스튜디오 설치하기

    [좀 더 알아보기] R 스튜디오 클라우드 

    [4가지 키워드로 정리하는 핵심 포인트]

    [확인문제] 

     

    01-3 R 스튜디오 인터페이스와 환경 설정 

    __R 스튜디오 인터페이스 

    __환경 설정하기 

    __필수 작업 환경 설정하기 

    __스크립트 생성 및 저장하기 

    __코드 실행하기 

    [좀 더 알아보기] 도움말 사용하기

    [5가지 키워드로 정리하는 핵심 포인트]

    [확인문제]

     

     

    Chapter 02 데이터 분석을 위한 기본 다지기

    : 데이터 분석 과정을 알아보고 데이터란 무엇인지 살펴봅니다.

    02-1 데이터 분석 과정 

    __1단계: 데이터 분석 설계하기 

    __2단계: 데이터 준비하기 

    __3단계: 데이터 가공하기 

    __4단계: 데이터 분석하기 

    __5단계: 결론 도출하기 

    [5가지 키워드로 정리하는 핵심 포인트] 

    [확인문제]

     

    02-2 데이터의 생김새 

    __데이터 구조 간 관계 및 데이터 유형 

    __벡터 

    __범주형 자료 

    __행렬과 배열 

    __리스트와 데이터 프레임 

    [6가지 키워드로 정리하는 핵심 포인트] 

    [확인문제] 

     

     

    Chapter 03 R 프로그래밍 익히기

    :  R 프로그래밍 기본 문법을 알아봅니다.

    03-1 변수와 함수 

    __변수 만들기 

    __함수 호출하기 

    __내장 함수 사용하기 

    __사용자 정의 함수 만들기 

    __return( ) 함수를 사용하는 이유 

    [5가지 키워드로 정리하는 핵심 포인트] 

    [확인문제] 

     

    03-2 패키지 

    __패키지 설치하기 

    __설치한 패키지 확인하기 

    __패키지 로드하기 

    __패키지 삭제하기 

    __주요 패키지 활용하기 

    [좀 더 알아보기] 필요한 패키지 찾아보기 

    [4가지 키워드로 정리하는 핵심 포인트]

    [표로 정리하는 핵심 함수] 

    [확인문제]

     

    03-3 조건문과 반복문 

    __연산자 

    __if-else 조건문 

    __반복문 

    [좀 더 알아보기] R 코드 오류 해결하기 

    [6가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

     

    Chapter 04 데이터 다루기

    : 데이터를 수집하고 관측하고 탐색하여 데이터 특성을 파악하는 방법을 알아봅니다.

    04-1 데이터 수집하기 

    __직접 데이터 입력하기 

    __외부 데이터 가져오기: TXT 파일 

    __외부 데이터 가져오기: CSV 파일 

    __외부 데이터 가져오기: 엑셀 파일 

    __외부 데이터 가져오기: XML, JSON 파일 

    [4가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

    04-2 데이터 관측하기 

    __데이터 전체 확인하기 

    __데이터 요약 확인하기 

    __기술통계량 확인하기 

    __데이터 빈도분석하기 

    [6가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

    04-3 데이터 탐색하기 

    __막대 그래프 그리기 

    __상자 그림 그리기 

    __히스토그램 그리기 

    __파이차트 그리기 

    __줄기 잎 그림 그리기 

    __산점도 그리기 

    [6가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

     

    Chapter 05 데이터 가공하기

    : 데이터 분석이 수월하도록 데이터를 추출하고 정렬하거나 구조를 변형해 봅니다.

    05-1 dplyr 패키지 

    __dplyr 패키지 설치 및 로드하기 

    __데이터 추출 및 정렬하기

    __데이터 추가 및 중복 데이터 제거하기

    __데이터 요약 및 샘플 추출하기

    __파이프 연산자: %>% 

    [2가지 키워드로 정리하는 핵심 포인트]

    [표로 정리하는 핵심 함수] 

    [확인문제]

     

    05-2 데이터 가공하기 

    __필요한 데이터 추출하기 

    __데이터 정렬하기 

    __데이터 요약하기 

    __데이터 결합하기 

    [4가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수]

    [확인문제] 

     

    05-3 데이터 구조 변형하기 

    __넓은 모양 데이터를 긴 모양으로 바꾸기: melt( ) 함수 

    __긴 모양 데이터를 넓은 모양으로 바꾸기: cast( ) 함수 

    [좀 더 알아보기] cast( ) 함수로 데이터 요약하기 

    [2가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

    05-4 데이터 정제하기 

    __결측치 확인하기 

    __결측치 제외하기 

    __결측치 개수 확인하기 

    __결측치 제거하기 

    __결측치 대체하기 

    __이상치 확인하기 

    __이상치 처리하기 

    [3가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

     

    Chapter 06 데이터 시각화: ggplot2 패키지

    : 데이터 시각화의 꽃, ggplot2 패키지를 활용하여 그래프를 그려봅니다.

    06-1 그래프 그리기 

    __그래프 기본 틀 만들기: ggplot( ) 함수 

    __산점도 그리기: geom_point( ) 함수 

    __선 그래프 그리기: geom_line( ) 함수 

    __막대 그래프 그리기: geom_bar( ) 함수 

    __상자 그림 그리기: geom_boxplot( ) 함수 

    __히스토그램 그리기: geom_histogram( ) 함수 

    [좀 더 알아보기1] 연산자로 이어진 코드 줄 바꿈하기 

    [좀 더 알아보기2] 그래프에 그래프 더하기 

    [3가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

    06-2 그래프에 객체 추가하기 

    __사선 그리기: geom_abline( ) 함수 

    __평행선 그리기: geom_hline( ) 함수 

    __수직선 그리기: geom_vline( ) 함수 

    __레이블 입력하기: geom_text( ) 함수 

    __도형 및 화살표 넣기: annotate( ) 함수 

    [좀 더 알아보기1] 그래프와 축에 제목 추가하고 디자인 테마 적용하기 

    [좀 더 알아보기2] 절편과 기울기 구하기: 회귀분석 

    [3가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

    06-3 지도 시각화: ggmap 패키지 

    __구글 지도 API 키 발급받기 

    __ggmap 패키지로 구글 지도 활용하기 

    [3가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

     

    Chapter 07 프로젝트로 실력 다지기

    : 앞에서 배운 내용을 바탕으로 공공 데이터를 직접 분석해 봅니다.

    07-1 지역별 국내 휴양림 분포 비교하기 

    __데이터 수집: 전국 휴양림 표준 데이터 다운로드하기 

    __데이터 가공: 엑셀로 전처리하기 

    __데이터 분석: 빈도분석하고 시각화하기 

    [분석 단계로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수]

    [확인문제] 

     

    07-2 해외 입국자 추이 확인하기 

    __데이터 수집: 입국 통계 데이터 다운로드하기 

    __데이터 가공(1): 엑셀로 전처리하기 

    __데이터 가공(2): 데이터 재구조화하기 

    __데이터 분석: 시각화하기 

    [분석 단계로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

    07-3 지도에서 코로나19 선별진료소 위치 확인하기 

    __데이터 수집: 코로나19 선별진료소 위치 정보 다운로드하기 

    __데이터 가공: 필요한 데이터 추출하기 

    __데이터 분석(1): 빈도분석하기 

    __데이터 분석(2): 지도 시각화하기 

    [분석 단계로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제]

     

    07-4 서울시 지역별 미세먼지 농도 차이 비교하기 

    __데이터 수집: 서울시 일별 미세먼지 데이터 다운로드하기 

    __데이터 가공(1): 엑셀로 전처리하기 

    __데이터 가공(2): 필요한 데이터 추출하기 

    __데이터 분석(1): 데이터 탐색하고 시각화하기 

    __데이터 분석(2): 가설 검정하기 

    [좀 더 알아보기] 세 개 이상의 집단 간 평균 차이 검정하기: 분산분석 

    [분석 단계로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수] 

    [확인문제] 

     

     

    Chapter 08 데이터 분석 보고서 공유하기

    : 데이터 분석 결과를 효과적으로 공유할 수 있는 방법을 알아봅니다.

    08-1 RPubs로 데이터 분석 결과 공유하기 

    __R 마크다운 문서 만들기 

    __R 마크다운 문서 미리보기 

    __R 마크다운 문서 저장 형식 변경하기 

    __RPubs에 배포하기 

    [좀 더 알아보기] R 마크다운 문법 

    [4가지 키워드로 정리하는 핵심 포인트] 

    [확인문제] 

     

    08-2 샤이니로 인터랙티브 웹 앱 만들기 

    __샤이니 파일 생성하기 

    __샤이니 앱 구조 살펴보기 

    __샤이니 앱 배포하기 

    __input 컨트롤 위젯 

    [4가지 키워드로 정리하는 핵심 포인트] 

    [표로 정리하는 핵심 함수]

    [확인문제] 

     

    부록 A 데이터 분석 툴 소개

    정답 및 해설 

    찾아보기

  • 도서 특징

     

    하나,  ‘입문자 맞춤형 7단계 구성’을 따라가며 체계적으로 반복하는 탄탄한 학습 설계!

    이 책은 R 데이터 분석의 핵심 내용을 7단계에 걸쳐 반복 학습하면서 자연스럽게 머릿속에 기억되도록 구성했다. 모든 절에서 [핵심 키워드]와 [시작하기 전에]를 통해 각 절의 주제에 대한 대표 개념을 워밍업한 후, 본격적인 데이터 분석 핵심 이론과 실습을 거쳐 마무리에서는 [핵심 포인트]와 [확인 문제]로 한 번에 복습한다. ‘혼자 공부할 수 있는’ 커리큘럼을 그대로 믿고 끝까지 따라가다 보면 프로그래밍과 통계 공부가 난생 처음인 R 데이터 분석 입문자도 무리 없이 책을 끝까지 마칠 수 있다!

     

    둘, 직접 해보는 193개 ‘손코딩’으로 핵심 문법을 익히고, 데이터 분석 감각은 ‘4가지 프로젝트’로 제대로!

    핵심 문법과 이론 설명은 두 눈과 머리로 술술 읽으며 넘어가고, R 코딩 감각은 직접 해보며 익힐 수 있는 193개의 엄선된 실습 예제를 담았다. 입문자에게 가장 필요한 반복 학습과 연습을 따라가다 보면 책에 담긴 코드를 ‘나의 코드’로 만들 수 있다. 마지막으로 R 언어로 공공 데이터 분석까지 직접 해보면 데이터 수집부터 분석 결과까지, 데이터 분석 전 과정을 몸소 익힐 수 있다. 

     

    셋, ‘혼공’의 힘을 실어줄 동영상 강의, 학습 사이트 지원

    http://hongong.hanbit.co.kr

    책으로만 학습하기엔 여전히 어려운 입문자를 위해 저자 직강 동영상도 지원한다. 또한 학습을 하며 궁금한 사항은 언제든지 질문할 수 있도록 학습 사이트를 제공한다. 저자가 질문 하나하나 직접 답변을 달아주고 있으며, R 언어 관련 최신 기술과 정보도 공유한다. 게다가 혼자 공부하고 싶지만 정작 혼자서는 자신 없는 사람들을 위해 혼공 학습단을 운영하여 마지막까지 포기하지 않고 독자가 완주할 수 있도록 최대한 지원한다.

     

    넷, 언제 어디서든 가볍게 볼 수 있는 혼공 필수 [용어 노트] 제공

    꼭 기억해야 할 핵심 개념과 용어만 따로 정리한 [용어 노트]를 제공한다. 처음 공부하는 사람들이 프로그래밍을 어려워하는 이유는 낯선 용어 때문이라는 것을 베타 리더를 통해 확인했다. 그러나 어려운 것이 아니라 익숙하지 않아서 헷갈리는 것이므로 용어나 개념이 잘 생각나지 않을 때는 언제든 부담 없이 용어 노트를 펼쳐보자. 제시된 용어 외에도 새로운 용어를 추가하면서 자신만의 용어 노트를 완성해가는 과정도 또 다른 재미가 될 것이다.

     

     

    먼저 읽은 베타리더들의 한 마디

    • 쉽게 따라하며 데이터 분석에 다가가기 좋은 ‘데이터 분석의 알파벳’같은 도서입니다. - 베타리더 곽경태 님
    • 데이터 분석을 물어볼 곳도 마땅치 않고 어떻게 시작해야 할지 난감할 때 이 책이 좋은 가이드가 됩니다. - 베타리더 박조은 님
    • 이 책을 모두 읽었을 때 데이터 분석 관련한 전 과정을 경험할 수 있습니다. - 베타리더 손지민 님
    • 실습 도중 발생하는 오류 해결 방법을 친절하게 설명하고 있어 오로지 학습에만 집중할 수 있습니다. - 베타리더 양민혁 님
    • 설명을 읽고 바로 코딩하며 익히고, 매 절 마지막에 나오는 마무리로 개념을 확인할 수 있습니다. - 베타리더 이동희 님
    • 초보자가 시작하기도 전에 좌절하지 않도록 개발 환경 설정, 용어, 코드를 상세하게 설명합니다. - 베타리더 임혁 님

    • 안녕하세요. 오늘은 R 프로그램을 활용한 통계, 데이터 분석에 관련한 책을 소개하려고 합니다. 


       


      데이터 분석, 통계에 대한 관심이 많은 요즘, 어떤 프로그램으로 공부를 시작할까 고민하시는 분들도 많으리라 생각됩니다. 저 또한 어떤 툴을 이용해서 학생들과 함께 공부하면 좋을지 고민이 많은데요, 엑셀, 파이썬 같은 프로그램도 틈틈이 공부하고 있지만 이제는 R 프로그램도 관심을 가지고 공부해보려고 합니다.


       



      서평단-001.png


       


       


       



      왜 R을 공부하는가?


      듣기에도 생소한 프로그램을 또 공부하려는 이유는 무엇일까요? 일단 통계, 데이터 분석을 공부하고 있다는 이야기를 하면 주변에서 R 프로그램을 많이 추천을 하셨습니다. 그 이유가 무엇인지 여쭤보면 크게 아래와 같은 장점들을 이야기해주시더라구요. (책에도 소개되어 있습니다.)


       


       


      • 통계 분석 등에 활용할 수 있는 패키지 수가 많다.

      • 사용자 간에 다양한 정보를 공유할 수 있다.

      • R은 무료이다.

      • 다양한 운영체제에서 동작한다.


       


      일단 여러 가지 장점들이 보입니다. 이제 R을 처음 공부하는 입장에서 새롭게 공부를 시작해야 할 텐데 어떤 책이 좋을까 고민이 많습니다. 그런데 오늘 소개해 드릴 "혼자 공부하는 R 데이터 분석"은 정말 처음 R 공부를 시작하는 분들에게 아주 좋은 책이라고 말하고 싶습니다.


       


       



      혼자공부하는R데이터분석_서평0.jpg


       


       



      책의 특성



      혼자 공부하기에 충분하다!


      이 책은 책 제목 "혼자 공부하는 ..." 시리즈의 자신감답게, 혼자 공부할 수 있도록 최적의 경로를 만들어 놓고 있습니다. 프프로그래밍도 통계도 처음, R 언어, 데이터 분석도 처음인 분들도 차근차근 따라하면서 쉽게 배울 수 있도록 친절한 설명과 이미지들이 가득합니다.


       



      혼자공부하는R데이터분석_서평1.jpg


       


       


      책 곳곳에 지금 공부하는 내용에서 중요한 부분은 무엇인지, 어떤 실수를 조심해야 하는지, 더 알아야 될 부분들은 무엇인지를 정확히 짚어주고, 마지막에는 핵심 포인트와 확인 문제를 짚어주며 반복해서 내용을 이해할 수 있도록 돕습니다. 


       



      혼자공부하는R데이터분석_서평2.jpg


       


       


       



      다양한 예제들이 제공된다.


      당연한 이야기지만, 눈으로만 책을 보아서는 안되고 손으로 직접 입력을 해 보면서 공부를 하는 것이 제일 좋은 방법입니다. 다양한 사례의 예제들이 제공되고 있어서 재미있게 입력해보며 눈으로 결과를 확인해볼 수 있습니다. 단계적으로 부담되지 않는 정도의 길이로 코드를 소개하고 있어서 눈으로 비교하며 공부하기에 아주 쉽습니다.


       



      혼자공부하는R데이터분석_서평3.jpg


       


       


      책에서 제공되는 예제들만 따라해보면 기초적인 R 사용법, 데이터 수집 및 관측, 탐색, 가공, 변형, 정제, 시각화, 분석 등 데이터 분석의 전 과정를 경험해볼 수 있습니다.


       


       



      실제적인 프로젝트로 실력이 한 단계 업!


      기본적인 개념 이해와 실습이 끝나면 4개의 실제적인 프로젝트를 경험해볼 수 있습니다.


       


      • 지역별 국내 휴양림 분포 비교하기

      • 해외 입국자 추이 확인하기

      • 지도에서 코로나19 선별진료소 위치 확인하기

      • 서울시 지역별 미세먼지 농도 차이 비교하기


       


      주제만 봐도 충분히 흥미롭습니다. 실제 공공데이터들을 다운로드 받아 다양한 방법으로 데이터를 분석하는 경험을 해 볼 수 있었습니다.


       



      혼자공부하는R데이터분석_서평4.jpg


       


       


       



      총평


      한빛미디어의 "혼자 공부하는..." 시리즈는 저 같이 독학을 하고 싶은 독자에게는 친절한 길잡이 같은 시리즈입니다. 예전에 "혼자 공부하는 첫 프로그래밍 with 파이썬"을 읽으면서도 파이썬 공부하는 데 도움을 많이 받았었거든요. 


       


      이번 혼자 공부하는 R 데이터 분석을 읽으면서도 혼공앓이(혼공에 빠져들어 헤어나올 수 없는 상태를 일컫는 신조어)에 빠져들 수 밖에 없었습니다. 새로운 것을 처음 배운다는 것은 설렘과 동시에 두려움도 있잖아요. 그 설렘을 기쁨으로 바꿀 수 있었던 시간이었습니다.


       


      그리고 마지막으로 하나만 더 이야기하자면, 정작 이 책은 혼자 공부하는 시리즈이지만 함께 공부하면 더 큰 시너지가 나는 책입니다. 그렇기 때문에 출판사에서도 혼공학습단이라는 이름으로 함께 공부할 수 있는 활동도 수시로 열어줍니다. 2022년 6월 중에 혼공학습단 8기를 모집할 예정이라는 소문도 있으니 함께 도전해보시면 어떨까요? (저는 도전 해보려구요!!! R 전문가가 되어보기 위해!!!)


       



      이 서평은 한빛미디어 <나는 리뷰어다 2022> 서평단 활동으로 무상으로 도서를 제공받아 작성하였습니다. 서평단 활동과 별개로 저의 관심과 필요에 따라 책을 읽고 객관적으로 서평을 작성하려고 노력하였습니다.


       



      출처: https://it4edu.tistory.com/180

    •  


       


       



      Chapter 01 빅데이터와 R



      챕터 1은 언어 소개개발 환경 설치를 다룹니다.






      Chapter 02 데이터 분석을 위한 기본 다지기



      챕터 2는 데이터 분석 준비, 데이터의 종류 행렬과 배열, 벡터 등이 있습니다.






      Chapter 03 R 프로그래밍 익히기



      챕터 3에서 변수와 함수, 패키지, 조건 문과 반복문을 다룹니다.






      Chapter 04 데이터 다루기



      데이터 수집하기, Txt 파일 읽기, CSV 파일 읽기, 엑셀, XML, JSON 파일 읽기



      데이터 관측하기 - 데이터 파일 요약하기, 데이터 빈도 분석하기






      Chapter 05 데이터 가공하기



      데이터 정렬, 요약, 결합






      chapter 06 데이터 시각화



      그래프 그리기, 그래프에 객체 추가하기, 지도 시각화하기






      Chapter 07 프로젝트로 실력 다지기


       



      지역별 국내 휴양림 분포 비교하기, 해외 입국자 추이 확인하기, 지도에서 코로나19 선별 진료소 위치 확인하기 등을 하면서 프로젝트를 경험해 볼 수 있습니다.


       



      서평 : 히스토그램, 막대그래프 등 각종 데이터를 비주얼 하게 만들어 낼 수 있다는 점이 좋았다.



      엑셀 파일만으로 데이터를 시각화할 수 있었고, 예제를 따라 쳐보는 것에서 그치지 않고 간단한 미니 프로젝트를 책에서 따라 진행해 볼 수 있다. 마지막에는 간단한 앱도 만들어 볼 수 있으니 데이터 시각화가 필요하신 분들에게 추천드리고 싶다!


       


       


       



      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

    • 처음 R을 만났을 때 생소한 문법과 기존 방식과 다른 형태의 프로그램으로 어려움이 있었습니다. 통계를 위한 데이터분석을 위해서 기존에는 SPSS등을 사용하였는데 R이 만들어지고부터 오픈 소스라서 그런지 더 많은 곳에서 사용이 되고 있는 것 같습니다.


      이 도서는 R을 이용해서 처음 배우는 사람들이 쉽게 R을 적응하고 분석을 할 수 있는 도서입니다.


      책은 8개의 큰 챕터로 이루어져 있습니다.


      • Chapter 1. 빅데이터와 R

      • Chapter 2. 데이터 분석을 위한 기본 다지기

      • Chapter 3. R 프로그래밍 익히기

      • Chapter 4. 데이터 다루기

      • Chapter 5. 데이터 가공하기

      • Chapter 6. 데이터 시각화: ggplot2 패키지

      • Chapter 7. 프로젝트 실력 다지기

      • Chapter 8. 데이터 분석 보고서 경유하기


      여타 다른 도서와 같이 R에 대한 설명과 설치 방법이 친절하게 설명되어 있습니다. 사소하게 지나갈 수 있는 문제들은 “여기서 잠깐” 같은 코너로 설명되어 있어 지나가면서 발생할 수 있는 어려움을 처리해 줍니다.


      올해 나온 도서라 예제로 사용된 홈페이지들이 화면과 동일하여 사용자가 다운 받으러 들어갈 때 이질감이 없이 따라하기를 하면 똑같이 데이터를 얻을 수 있었습니다.


      프로젝트로 실력 다지기 중에 하나의 내용입니다. 서울시 지역별 미세먼지 농도 차이를 다운 받은 데이터를 통해서 분석을 하는 예제입니다.



      reviewer_202205_04.png


       



      reviewer_202205_03.png



      데이터를 제공하는 파일에서도 볼 수 있지만 최근 데이터를 직접 홈페이지에서 받아서 결과를 수행해 보았습니다. 예제는 2021년 1월 이지만 2022년 1월의 데이터를 받아서 동일하게 검증을 수행해 보았습니다.


       


      t 검정으로 p-value가 0.05가 넘어서 통계적으로 유의하지 않다는 것을 확인 할 수 있었습니다.


       


      R로 분석을 하기 위한 데이터를 가져오는 방법부터 그 데이터를 필요한 형태로 정제를 하는 방법까지 자세히 나와 있습니다. 그 다음에 정제된 데이터를 바탕으로 분석하는 실습까지 자세히 나열되어 있어 혼자서도 할 수 있다고 하는 책 제목에 맞게 R을 익힐 수 있는 도서입니다. 





      * 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.





    • 책소개



      데이터분석 툴은 여러가지가 있다. 프로그래머에게 친숙한 파이썬이나 누구에게나 친숙한 엑셀,다양한 시각화 차트가 제공되는 태블로, 구글애널리틱스(Google Analytics) 등등..


       



      이 책은 그중에서 방대한 양의 데이터를 처리하기에 적합하고 포괄적인 통계분석 패키지이며오픈소스인 R에 대한 기초서이다.



      초보자에게 쉽게 설명하는 기초서이지만 데이터 분석을 위한 과정에 대해 설명하고,R프로그래밍에 대한 쉬운 설명과 더불어 빅데이터를 수집-확인->탐색->가공->정제->시각화의 전체과정을 CHAPTER별로 흐름에 따라 설명하고 있다.



      CHAPTER의 뒷부분에서는 예제 데이터를 이용하여 분석을 수행하는 방법에 대해 설명하고 있고최종적으로 분석된 정보에 대한 보고서를 공유하는 방법에 대해서도 설명하고 있다.


       



      책의 상세내용을 보면 데아터 분석 책에 걸맞게 디자인이 상당히 체계적으로 잘되어 있으며컬러풀하게 구성되어 있다.



      저자는 기본적인 설명을 하고 그에 따른 손코딩이라는 부분으로 구분하여 코딩을 설명하고결과의 그래프 또는 도표를 보여주는 방식으로 설명하고 있어 이해하기 쉬었다.CHAPTER의 마지막에는 마무리라는 페이지를 두어 최종적으로 핵심포인트를 다시 복습할 수 있게 하였고확인문제를 두어 그 chapter에서 습득한 내용에 대해 생각하고 수행해 볼 수 있게 하고 있다.


       



      혼자공부하는 시리즈를 처음보았는데 다른 책들에도 있는지는 모르겠지만 이 책에서는 별책부록으로혼공용어노트를 제공하고 있다. 핵심 용어에 대해 간단한 정리와 본문의 페이지 번호를 적어 두어서이후에도 혼공노트를 이용하여 확인하고 궁금한 내용이 생기면 해당 페이지를 찾아서 읽을 수 있겠다싶었다.


       


       



      KakaoTalk_20220528_151535159.jpg


       






       



      KakaoTalk_20220528_151534170.jpg






       


       



      총평


       



      정말 잘 구성되고 내용도 충실한 책이라 생각한다. 책을 읽으면서 책을 만드는데 여러 사람들이 많은노력을 했겠구나 하는 생각이 들었다.



      이 책은 최대한 천천히 설명하려 한다는 느낌을 받았다. 단계별로 잘 모르는 독자를 위해 천천히 알려주고설명하는 느낌이었다. oreilly의 헤드퍼스트 시리즈는 초보자를 위해 쉽게 설명을 책으로 유명한데 나는 조금 산만하다는 느낌을 많이 받았으나 혼자공부하는 시리즈 산만하지 않고 체계적으로 설명하고 있다고 생각한다.



      이 책으로 다음에도 관련 시리즈의 책들도 보고 싶어졌다.


       



      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."







    • "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


       


      * R 이란?


       


      R은 통계 수치분석할 때 많이 사용되는 언어로,


       


      대학원, 연구원 등 비 개발자인분들도 자료분석을 위해 많이 사용되는 언어이다.


       


      R은 개발언어가아니라 matlab과 같이 분석을 위한 언어로서,


       


      R만 잘한다고해서 어느분야에 두각을 낼 순 없지만,


       


      특정분야의 전문가가 자료분석을 할 때 보조적인 수단으로 사용될 때 강력한 도구로써 활용이 된다.


       


       


       


       



       


      * 권장 독자


       


      해당도서는 R에대해 전혀 모르고, 개발적 지식이 없는사람들이 읽으면 좋을 것 같다.


       


      이 책은 전문가들이 읽기에는 과하게 난이도가 낮고 설명이 과하게 친절하지만,


       


      반대로 입문자가 읽기에는 난이도가 적절하며 설명이 자세하게 되어있어 이해하기 쉽게 되어있다. 


       


      입문자가 읽기 좋다고 생각한 자세한 이유는 아래에서 설명하겠다.


       



       


      * [혼자 공부하는 ~]


       


      보통의 책을이 혼자보고서 공부하는게아닌가? 다른책과 별 다른게 없겠지 싶었지만


       


      책 내용을보고서 내 생각이 완전히 틀렸다는것을 알게되었다.


       


       


      위와같이 각 챕터마다 핵심키워드, 팁, 사용예제, 추가 학습내용, 확인문제가 들어있어


       


      자격증 시험 공부하는 느낌으로 공부할 수 있다.


       


      한빛미디어의 일반적인 IT도서들도 이런 구성이 있지만


       


      이런 구성들은 시험공부하는것에 더 익숙해져있다. (수험시절에 워낙 많이 접해서그런가;;)


       



       



       


       


      이렇게 단계별 학습방식을 제공해서


       


      처음부터 순차적으로 읽으면서 R에대해 학습할 수 있다.


       


      목차를보고 필요한부분을 찾아볼 수 있지만 학습을 위한다면 순차적으로 차근차근 보는게 좋을듯 하다.


       



       



       


       


      책이 전부 컬러본으로 되어 예시화면이나 강조된 설명을 더 잘 확인할 수 있었다.


       


      하지만 개인적인 생각으로는 R에서는 단순 데이터 통계를 산출하는게 전부라서 흑백이어도 학습하는데 문제없을꺼 같다는 생각이 든다 (괜히 책값만 상승하는 이ㅇ.....ㅠ.....)


       



       


       


      뒤쪽에 통계관련 용어부록이있어 간만에 수학을 접했던 사람이라면 복습하게 도와주는 배려가 아주 좋았다.


       


      R에대해 학습하기전에 기본이되는 용어를 충분히 학습한 후


       


      R에대해 공부하는것을 추천한다.


       


      (아무래도 R은 통계 수치분석을위한 언어이기 때문에)


       



       


      또한 홈페이지에서 혼자공부하는데 더 도움이되게 동영상강의, 실습예제, 용어노트 등을 제공하고 있다.


       


      https://hongong.hanbit.co.kr/r-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D/


       


       


      찾아보니 [혼자 공부하는] 이 시리즈로 되어있어서 


       


      R뿐만아니라, 머신러닝,  자바, 파이썬 등 여러시리즈가 존재하고있어


       


      관심이있으면 다른 시리즈의 책도 찾아보는것을 추천한다.


       



       



       



       


      예제소스를 다운받을 수있는 깃허브 주소는 아래와 같다.


       


      https://github.com/newstars/hongongR



       



       


      * 총평


       


      위에서 말했다싶이 이 책은 개발자에게 필요한 언어이기보단 


       


      비 개발자인자가 통계나 수치분석을 위해 사용하는 언어라서 


       


      쓰이는 분야에따라 다르겠지만 대학생이 자격증공부하듯


       


      R에대해 전혀 지식이 없는사람이 보기에 최적화 되어있는듯 하여


       


      R을 시작하는데 이 책을 보면서 학습하면 매우 좋을것이라 생각된다.


       



    • 제목 없음_2.png


       


    • "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


       


      혼자 공부하는 시리즈답게 짜임새가 굉장히 높습니다. 혼자 읽으면서 이론과 실습을 충분히 해낼 수 있고, 데이터분석을 이해 할 수 있는 좋은 책이라 생각되어집니다.


      저자 인터뷰에 초보자가 쉽게 이해하고 스스로 R언어를 스스로 코딩 해 볼 수 있도록 책이 구성되어 있고, 상세하게 알려주고 있어 책이 술술 잘 읽혔습니다.


      작업환경 또한 step by step으로 설치하여 입문자가 접하기도 매우 쉽게 느껴집니다. R프로그램의 유용한 기능을 자세히 알려주기 때문에, 코딩입문자들도 손쉽게 따라할수 있도록 잘 설계가 되어있습니다. 특히 각 챕터별로 확인문제가 제공되어 개념을 체크하면서 넘어가는 것도 매우 좋았습니다.


      데이터 분석과정에 대해 흐름도를 제시하여 이해력을 더 높을 수 있는 기회였고, 순환구조에 대해 도표가 잘 정리되어 있어 구조를 파악하기가 매우 쉬웠습니다.


      데이터 분석은 데이터 분석 설계 -> 데이터 준비 -> 데이터 가공 -> 데이터 분석 ->결론 도출 과정으로 단계적으로 설명이 잘 되어 있어, 흐름을 파악하기가 매우 쉬웠습니다.


      개념을 배우고 실습을 하면서 저자분의 팁이 있어 아하!라는 느낌을 많이 받으면서 읽었고, 에러가 발생되었다면 특정 페이지를 참고해보시면 도움이 됩니다라는게 있어 에러가 나도 보완이 가능하다는 장점이 있습니다.


      어려운 개념 및 헷갈리는 개념을 그림으로 설명하면서 독자들의 이해력을 높이려 하였습니다.


      R의 기초를 배우고 실습 프로젝트를 하며 통계적인 부분들이나 R코딩을 통해 프로젝트을 어떻게 진행하면 좋을지와 어떠한 코드를 적용하면 좋을지에 대해서 서술이 자세하게 되어있어, 입문자의 눈높이에 정말 잘 맞춰져 있다고 느껴졌습니다.


      저자분이 말씀해주셨지만, 데이터 분석가나 데이터 과학자를 꿈꾸는 분이라면 더욱 난도 높은 R 프로그래밍 및 다양한 언어에 대해 단계적으로 실습해 보기를 권한다고 쓰여있었는데, 입문자 눈높이를 맞추었기 때문이라고 생각되어졌습니다.


      마지막에 제공되는 혼공 용어노트가 들고다니기도 편하고 용어가 잘 정리가 되어 유용한 자료가 될 것 같아서 너무 좋았습니다.


      이 책을 읽으면서 단계적으로 너무나 잘 정리가 되었고, 실습 또한 잘 정리가 되어있어, 혼자 스스로 공부하기엔 정말 적합한 책이라고 생각했습니다. IT서적이 이렇게 술술 읽히는건 오랜만인거 같아서 저자분에게 너무 감사하다는 말씀을 드리고 싶고, 혼자 공부하시는 분들에게 정말 많은 도움이 될 것 같습니다.


    • 서평 및 발제


       


      작년 부터 한빛 미디어 책 리뷰를 많이 하고 있다. 실제도 많이 구매도 했었다. IT 분야에 입문을 하다보니 한빛 시리즈의 책들이 잘 정리도 되어있고, 초보부터 고급까지 두루두루 포괄할 수 있도록 책들이 구성되어 있다. 특히 혼공 시리즈는 유튜브 강의와 함께 들으면 백점 만점의 학습 효과를 볼 수 있다.


       


      지금까지 구매한 한빛 미디어 책들 중 혼공 (혼자 공부하는) 시리즈는 파이썬, 머신러닝/딥러닝, R 이고, 그 외에는 딥러닝 관련 책들도 포함하여 10권 가량의 책들을 구매했고, 서평 책들도 10권 이상 받았으니 이정도면 한빛 매니아라고 할 수 있겠다. 이중 안읽은 책들이 반이고, 읽은 책들이 반이다.


       


      2022년 1월~2월은 혼공 딥러닝 머신러닝 그룹 스터디를 진행하고 있지만, 중간에 잠간 쉬어가는 마음으로 잠간 이 책을 보았다. R은 원래 중급 이상으로 다룰 수도 있었고, 지금까지 빅데이터 분석 교육을 온/오프라인으로 들을때면 대부분 R로 진행을 했기 때문에 익숙하기도 하고 친근하다.


       











       



      목차 및 요약



      Chapter 01 빅데이터와 R


      01-1 빅데이터와 R 언어


      01-2 개발 환경 설치


      01-3 R 스튜디오 인터페이스와 환경 설정



      Chapter 02 데이터 분석을 위한 기본 다지기


      02-1 데이터 분석 과정


      02-2 데이터의 생김새



      Chapter 03 R 프로그래밍 익히기


      03-1 변수와 함수


      03-2 패키지


      03-3 조건문과 반복문



      Chapter 04 데이터 다루기


      04-1 데이터 수집하기


      04-2 데이터 관측하기


      04-3 데이터 탐색하기



      Chapter 05 데이터 가공하기


      05-1 dplyr 패키지


      05-2 데이터 가공하기


      05-3 데이터 구조 변형하기


      05-4 데이터 정제하기



      Chapter 06 데이터 시각화: ggplot2 패키지


      06-1 그래프 그리기


      06-2 그래프에 객체 추가하기


      06-3 지도 시각화: ggmap 패키지



      Chapter 07 프로젝트로 실력 다지기


      07-1 지역별 국내 휴양림 분포 비교하기


      07-2 해외 입국자 추이 확인하기


      07-3 지도에서 코로나19 선별진료소 위치 확인하기


      07-4 서울시 지역별 미세먼지 농도 차이 비교하기



      Chapter 08 데이터 분석 보고서 공유하기


      08-1 RPubs로 데이터 분석 결과 공유하기


      08-2 샤이니로 인터랙티브 웹 앱 만들기


       


      혼공 시리즈의 특징은 직관적으로 알기 쉽게 목차 구성이 되어있고, 설명 또한 간결하다. 학습 로드맵과 구성이 알차서 로드맵대로 한다면 두달 정도면 한권을 책을 끝낼 수 있다. 비록 마스터 한다고는 할 수 없지만 최소 50~70% 이상은 이해할 수 있다. 여러 언어가 있지만 하나의 언어를 배우기 위한 첫짹으로 이정도 수준으로 학습이 가능하니 훌륭한 책과 강이 콘텐츠를 가지고 있다. 저자에게 질문을 하면 직접 답을 받을 수도 있어서 저자와 커뮤니케이션도 가능한 부분과 혼공 학습단과 같이 공부를 할 수 있는 것이 큰 장점 중 하나다.


       









       


      학습 로드맵은 다음과 같다. 이론에 대한 부분, 실습에 대한 부분을 잘 알 수 있고 공부를 할때/진도를 점검할때 따라하기 좋다.









       


      각 챕터별로 이론 설명과 쉬운 손코딩 그리고 확인문제와 소스 코드 정리 및 요약으로 구성되어져 있고, 코드도 복잡하지 않아서 따라하기 쉽니다. 이론만 듣다보면 지루할 수 있지만, 모든 챕터마다 실습이 같이 병행되기 때문에 학습 효과가 좋다.


       


      첫 장은 빅데이터 개념과 초보자를 위해 R studio 설치 및 셋업부터 다루고 있다.









       


      이론~~









       


      실습!!









       


      확인문제









       


      마무리 및 요약









       


      2월 22일 기준 코로나 확진자가 171,452명이다. 작년 초기에 몇백명, 천명 단위만 넘어갔어도 난리였는데, 오미크론 이후에는 만단위가 넘어가면서 20만을 앞두고 있으며 기하급수적으로 급증하고 있기에, 아래의 책의 공공 데이터를 통해서 간단하게 선벌진료소 위차와 빈도, 시각화를 할 수 있다.



       
























    • 최근 프로그래머들이 귀해졌다. 자연스럽게 프로그래밍을 할 수 있는 이들에 대한 대우나 취업에 기회들이 많이 늘어나면서 프로그래밍을 배우려는 이들이 많아졌다. 그럼에도 불구 막연하게 프로그래밍이라고 하면 어렵게 느껴진다. 그런 점에서 '혼자 공부하는 R 데이터 분석'은 전공자가 아니더라도 누구나 쉽게 R 프로그래밍을 공부할 수 있는 책이다. R 언어라는 개념이 처음 접하는 이들에게는 생소할 수 있는데 주로 데이터를 다루는 프로그래밍 언어이며, 오픈소스 소프트웨어로 벨 연구에서 개발된 S 언어를 바탕으로 하고 있다. 통계와 시각화에 강점이 있으며, 머신러닝에도 활용되고 있을 만큼 확장성이 높다. 그럼에도 불구하고 프로그래밍을 잘 모르는 일반인도 쉽게 배울 수 있는 언어이다. '혼자 공부하는 R 데이터 분석'은 R 언어 입문자를 위해 쓰인 책이며, R 언어와 데이터 시각화에 많은 부분을 할애하고 있다.


       





      책의 외적인 부분은 전반적으로 깔끔한 것이 특징이며, 살짝 두툼하게 느껴진다. 첫인상은 대학시절 봐왔던 프로그래밍 전공서적이라는 느낌이 강하게 들었는데, 내부에 있는 내용도 외관과 크게 다르지 않았다. 기본에 충실하면서 친절한 설명이 인상적이었다.

       


       





      교과서 같은 느낌이 강하게 들었는데 개념과 함수에 대한 설명과 손 코딩과 그 결과를 보여주는 형태로 되어 있었다. 전공서적과 다른 느낌은 정답을 알려주고 있다는 점인데 아무래도 혼자 공부를 하다 보면 정답지를 찾게 되는데 그런 부분에 있어 지인이들의 배려가 느껴졌다.

       


       





      프로그래밍을 몰라도 쉽게 시작을 할 수 있을 만큼 구성이나 내용들이 쉽고 단계적으로 잘 구성되어 있다. R 언어에 대한 기본 개념부터 코딩을 하는 과정까지 꽤 자세하게 설명을 하고 있었다. 프로그래밍 언어를 접했던 이들의 입장에서 너무 자세하고 알지 않아도 되는 부분까지 과할 정도로 친절하고 개념적인 설명이 많게 느껴질 수 있다. 하지만 구현되는 원리나 어떻게 동작하고 결과물로 이어지게 되는지에 대한 자세한 설명은 R 언어를 이해하고 사용하는데 큰 도움을 준다. 확실히 이런 부분에 있어서는 다른 프로그래밍 언어를 다루고 있는 책들과 차별화되는 점이라고 생각된다. 두께가 다소 있는 편이지만 기능별로 챕터를 나누어 놓아서 단계별로 공부를 할 수 있게 분량을 나누어 둔 점 또한 좋았다. 프로그래밍도 통계도 처음일 때, R 언어를 이용해 데이터를 시각화하고 가공하려는 이들에게 입문서로 적극 추천한다.

       


       

    • 일을 하면서 각자의 분야가 있고 모든 일에는 다 연결이 되어 있기에 각 데이터를 어떻게 연결하고 어떻게 흘러가게 하는 것이 작업에 대한 성공에 대한 영향을 크게 작용하고 있습니다.


      특히, 프로젝트에 초반에 기획에서는 데이터 분석을 어떻게 시작하는냐에 따라서 프로젝트 성공이 좌우되곤 합니다.


      뭐... 엑셀을 이용해서 제공하는 그래프 같은 것을 이용해서 활용할 수 있지만 표현에 대한 한계가 있고 커스텀 하기에도 한계가 있기에 이런 데이터를 업체에 맡겨서 진행하곤 했습니다.


      요즘은 데이터를 구하기가 수월하기에 데이터를 구축하는 것보다는 이제는 데이터를 가지고 어떻게 활용하는 것이 중요한 시대가 됩니다.


      정부 데이터나 통계청 사이트를 이용하면 프로젝트에 필요한 데이터를 쉽게 얻을 수 있기에 방대한 데이터를 쉽게 활용하는 방법이 요즘은 이슈이긴 합니다.


      엑셀로 하거나 파이선으로 하는 방법이 있지만 오늘은 통계 분석에 특화된 R에 대해서 공부해 봤습니다.


      뭐... 공부를 해보니...  장단점은 분명 있습니다.


      R는 무료이면서 강력한 시각화를 제공하기에 요즘 데이터 분석 활용에 크게 이용하고 있습니다.


      무엇보다 시각화에 강점이 중요합니다.


      왜냐하면 아무리 데이터 분석이 좋아도 강력한 시각화를 통해서 사람들이 데이터를 이해하는데 큰 도움이 되기 때문입니다.


      데이터 분석을 하는데 한눈에 들어오지도 않고 이해하기 어려운 데이터 분석이라면 과연 실용성이 있을까 의문이 됩니다.


      하지만 R를 통해서 통계분석에 특화되고 강력한 시각화를 제공하여 한눈에 들어오고 이해하기 쉬운 시각화를 제공하기에 데이터 분석에 좋은 프로그램이라고 생각합니다.


      저는 코딩에 대해서 잘 모르지만 기존에 있던 데이터를 가지고 분석할 수 있는 방법을 알게 되어서 프로젝트 기획에서 많은 도움이 될 것 같습니다.


      오늘은 R를 알기 위해서 공부한 혼자 공부하는 R 데이터분석 도서를 리뷰해 보겠습니다. 


      그리고 유튜브 강좌도 같이 보면서 공부하시면 더 좋습니다.


      https://youtu.be/5ZyU0SigwZ8


       



      IMG_0655.jpg


      표지입니다. 


      혼공앓이라는 신조어를 설명해 주고 있네요^^


       



      IMG_0657.JPG


      누구나 시작할 수 있다고 합니다.


      뭐... 공부해 보니 쉽다고 할 수는 없지만 차근차근 정독해 보니... 엄청 어렵지는 않습니다.


       



      IMG_0658.JPG


      혼자 공부하는 시리즈는 개인적으로 좋아하는 이유는 혼자 공부한다는 전제하에 도서의 흐름을 잡고 있습니다.


       



      IMG_0659.JPG


      도서의 전체적인 흐름입니다. 


      마지막에는 실질적으로 활용할 수 있는 프로젝트로 실력 다지기와 데이터 분석 보고서 공유하기까지 디테일하고 흘러가고 있습니다.


       



      IMG_0661.JPG


      첫 시작은 R에 대한 이야기로 시작합니다.


      또한 데이터에 대한 전체적인 개요도 쉽게 설명하기에 초반을 좀 더 정독하시길 바랍니다.


       



      IMG_0662.JPG


      각 챕터의 시작에는 공부하는 핵심 키워드를 소개합니다.


      핵심 키워드를 숙지하시고 챕터를 시작하시면 됩니다.


       



      IMG_0663.JPG


      또한 핵심 키워드 아래에는 시작하기 전에 배울 주제 및 개념을 설명하고 있습니다.


       



      IMG_0664.JPG


      직접 코딩하는 부분을 설명하는 손코딩은 직접 컴퓨터를 이용하여 입력하시고 실행해 보시길 바랍니다.


       



      IMG_0665.JPG


      중간마다 귀여운 캐릭터가 설명을 해주는데 뭔가 쉬어가는 느낌입니다.


      자꾸 낙서하고 싶어지네요 ㅎㅎㅎ


       



      IMG_0666.JPG


      좀 더 알아보기는 디테일한 설명이나 깊이 있는 학습을 위해서 추가된 내용들이니 확인해 보시길 바랍니다.


      나중에 레벨업을 위해서 다른 공부를 하기에 도움이 되는 내용들입니다.


       



      IMG_0667.JPG


      각 챕터의 마지막 부분에는 마무리 부분이 있습니다.


      챕터를 공부한 내용들에 대해서 정리해 주는 부분입니다.


       



      IMG_0668.JPG


      그리고 마무리와 함께 확인 문제를 제공합니다.


      꼭 풀어보시고 복습해 보시길 바랍니다.


      문제를 풀다 보면 부족한 부분을 알 수 있기에 꼭 풀어 보시고 복습하시길 바랍니다.


       



      IMG_0669.JPG


      마지막 챕터에는 실질적인 프로젝트를 실습할 수 있습니다.


      기존에 활용 가능한 정부데이터를 가지고 활용할 수 있는 부분이니 공부해 보시길 바랍니다.


       



      IMG_0670.JPG


      지도 시각화도 가능하는 걸 보면 확실히 일반 엑셀보다는 차이가 있네요^^;


       



      IMG_0671.JPG


       



      IMG_0672.JPG


      또한 마무리로 데이터 공유나 웹 앱을 제작하는 방법까지 소개하기에 활용적인 면에서 잘 설명하고 있습니다.


       



      IMG_0673.JPG


      또한 책 속에는 용어 노트를 따로 제공하고 있기에 R를 구현하면서 필요한 부분을 참고하시고 공부한 내용들을 필기하시면 도움이 많이 됩니다.


       


      이번 도서는 개인적으로 색다른 공부였습니다.


      어려운 것은 아니지만 정말 처음 도전해 보는 공부였습니다.


      처음에는 코딩도 잘 모르는 사람이 겁도 없이 시작한 건 아닌가 걱정했지만 후반부로 갈수록 흥미가 생기더군요^^;


       


      다음 프로젝트 기획에서 데이터에 대한 회의를 할 때 한번 사용해 봐야겠습니다.


       


       


      한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.


    • 책의 장점은 정말 혼자서 공부할 수 있도록 자세하게 설명해 놓았다는 것과, R이라는 프로그램이 상당히 매력적이라는 겁니다. 책에서 사용하는 예제 파일이나 동영상 강의가 제공됩니다. 뿐만 아니라 혼공 학습 단도 모집하고 있어요. 혼자 공부하지만 서로 질문도 하고, 정보도 나누면서 학습할 수 있도록 꾸며진 카페이기 때문에 가입하셔서 도움받아 보시면 좋겠네요.



      책 처음에 프로그래밍도 통계도 처음일 때 라는 글귀가 있는데요. 처음 R공부하는 분에게 아주 좋은 입문서가 될 것 같아요.


    • 이 책을 한 줄로 표현하면 "코세라 내에 있는 입문 강의를 보고 있는 느낌"이다
      시각화가 잘 되어 친절히 가이드 해주고 있으며, 프로그래밍 책 중간에 온라인 강의에 있을 법한 퀴즈가 나와서 깜짝깜짝 놀랐다!!

      이 책은 데이터 분석을 처음 시작하는 사람에게 좋은 입문서이다. ADP, ADsP, 빅데이터분석기사를 준비하는 사람에게도 추천한다.

       


       




       


       



      혼자 R을 공부해보자!


      비전공자들은 파이썬? R? 무엇을 할까 고민을 많이 할 것이다.


      컴공 전공자는 프로그래밍 언어에 익숙하다 보니 당연히 파이썬통계, 산공 전공자는 학교에서 R을 배워서 R을 선택하는 경우가 많다.그럼 이도 저도 아닌 처음 배우는 사람들은??


      이 책에서는 



      프로그래밍에 익숙하지 않고 데이터 분석에 처음 도전하는 사용자라면 통계 분석과 그래프 형태의 시각화가 강점인 R로 데이터 분석을 시작하는 것을 추천한다.

       



      나도 이 말이 동의한다.통계를 공부할 때는 R이 훨씬 편리하다.또한 클라우드상에서도 이제 R스튜디오와 유사한 작업들이 가능해졌다.
      https://rstudio.cloud/



       


      RStudio Cloud - Do, share, teach, and learn data science


       


      rstudio.cloud




      무료로도 사용이 가능하니 로컬에서 R스튜디오 설치가 어렵다면 추천한다.


       



      이 책은 크게 기본편과 고급편으로 나누어져있다.


      • 기본편에서는 이론과 R 프로그래밍의 기본적인 내용, 탐색적 데이터분석, 데이터 전처리 등을 알려주고

      • 고급편에서는 시각화와 4개의 미니 프로젝트, 데이터 분석 보고서 공유하기 등으로 이루어져있다.


       



      이 책의 장단점



      이 책의 장점은 


      • 입문자에게 친절한 설명과 연습할 예제코드

      • 4개의 분석 프로젝트 (공공데이터 활용)

      • 간단하게 보고서 작성을 위한 마크다운과 웹앱 만들기 예제가 있음 (챕터8)

      • 데이터분석 관련 자격증을 공부하는 사람에게 도움이 클것 같음


      • 유튜브 강의 (21.2 현재 10개의 콘텐츠가 있음) https://bit.ly/3B3JTZf


       


       



      이 책의 단점


      • 예제코드 색상 구분 없어 아쉬움 (물론 책의 잘 디자인되었고, 코드 길이가 짧아 가독성에는 문제가 없음)

      • 머신러닝까지 다루지는 않음 


       



      입문자 눈높이에 맞는 프로젝트 가이드 


      프로젝트를 어떻게 진행하는지 자세히 살펴보았다.공공데이터포털 홈페이지에서 데이터를 찾고 필요한 데이터를 다운로드하는 방법부터 알려준다.데이터를 다루는 데 있어 데이터 전처리가 가장 많은 시간이 걸리고 입문자가 프로그래밍으로 하기 어려운 부분이 있는데 이 책에서는 이것을 엑셀로 처리하고 있다.


      내가 처음 머신러닝을 공부했을 때가 많이 생각이 났다. 그때 내가 썼던 방법과 동일했다. (개인적으로 입문자 눈높이에 잘 맞춘 방법이라 생각한다)


      부끄럽지만 그 당시 파이썬(판다스)로 데이터 전처리가 마음대로 되지 않아 엑셀로 내보내기를 하고 나서 클릭 몇 번으로 데이터 전처리를 하고 저장한 다음 다시 그 데이터를 불러들여왔다.


      이 책에서는 엑셀을 함께 사용해 보기도 하고 엑셀 없이 R에서 모두 전처리를 진행해 보기도 하는 등 다양한 방법을 프로젝트를 통해 보여주고 있다.


       



      R 마크다운
      문서를 정리하거나 보고서 작성에 필수적인 마크다운을 사용하는 방법을 마지막에 알려주고 있다.
      https://rpubs.com 


      이 책은 입문자가 혼자 공부를 시작할 수 있도록 알려주는 안내서와 같은 책이다.


      입문자는 전문가가 평소 사용하는 용어의 벽이 크다. 이를 위해 용어에 대한 부분은 별도 부록으로 정리를 해주고 있다. 


       


       


       



      본 글은 한빛미디어에서 책을 제공받고 리뷰하였습니다


    • 데이터 수집부터 가공하는 방법  다양한 데이터 분석 방법을 다루고 있어



      통계 자료들을 가지고   있는 실습 예제가 많아서 
      여러 방면으로 응용해볼  있게 해줍니다.


       



      특히 혼공R 장점은 용어 노트와 실습예제인데
      용어 노트로 헷갈리는 부분은 자세하게 공부할  있고 
      실습예제를 보며 직접 하지 않아도 흐름을 파악할  있습니다.

      게다가 유튜브 강의와함께 들을  있으며
      저자에게 질문할  있는 점이 가장 좋은  같습니다.


       



      R 입문하시는 분이라면 적극 추천합니다!


       



      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


    • R은 대학교 다닐 때 1학기 통계수업의 과제로 사용했던 것이 전부였다. 데이터 분석보다 DL을 많이 하다보니 접할 일도 별로 없었다.나는 리뷰어다 2022의 첫 도서로 받게되어 정말 오랜만에 R을 써보았다. 사실 거의 기본 지식 0에서 읽은거랑 다름 없었지만ㅋㅋㅋ



      프로그래밍 언어 혹은 툴에 대한 서적을 접했을 때 뭔가 훌훌 읽으면 다 아는 것 같다. 근데 막상 쓰려면 "엥 그거 어떻게 하는거였지.." 하고 다시 찾아봐야하는데 이 책의 장점은 이런 부분을 최소화 시킬 수 있게 도와준다는 것이었다.



      작은 챕터가 끝나면 마무리라는 페이지에 짧은 정리와 확인문제가 있다. 나도 책을 읽으면서 문제푸는게 재밌어서 꽤 많이 풀었는데 이거 한 번 풀고나면 기억이 오래간다. 사실 모든 함수명을 기억할 필요는 없다. 그렇기 때문에 대충 비슷하게라도 이 커맨드 혹은 함수가 뭘 의미하는지 파라미터가 뭐였는지 정도 기억하면 되는데 그 아이디어랑 비슷하게 빈칸 채우기, 객관식, 올바른 것 연결하기로 주로 구성되어있다.


       


      확인문제


       



       그리고 내가 생각한 또 다른 장점은 문제해결이라고 해서 실제로 R을 쓰면서 생기는 문제를 해결하는 방법에 대한 팁이 있다는 것이다. 초보 시절에는 어떻게 해야할지 잘 모르기 때문에 책을 그대로 따라쳐보는 경우가 많다. 그대로 똑같이 했는데 문제가 생기면 굉장히 당황스러울 것이다. 그럴 때 이런 해결팁이 있다면 입문자들에겐 큰 도움이 될 것이다. 


       


      문제해결


       


       



      내가 항상 중요하게 생각하는 것이 있다. mnist, Iris, 타이타닉과 같이 수 많은 입문서들과 블로그에서 사용하는 데이터 말고 내가 쓰고 싶은 데이터에 어떻게 적용하는지 가르쳐주는 글이 큰 도움이 될 것이라고 생각한다(물론 기본적인 예시도 필요하다고 생각한다! 하지만 그 다음 과정인 내것에 적용해보는 과정이 있어야 더 발전할 수 있을 것이다). 


       그런데 혼자 공부하는 R 데이터분석에는 챕터 07이 공공데이터포털의 데이터를 이용해 프로젝트를 만들어 보는 것이다. 코시국에 맞게 코로나19 선별진료소 위치 지도에 나타내보기, 서울시 지역별 미세먼지 농도 차이 비교하기 등의 프로젝트가 있다. 원하는 프로젝트가 있다면 이 프로젝트 예시들을 기반으로 더 많은 시각화를 해보고 다른 데이터를 적용해보는게 큰 도움이 될 것 같다.




    • 한빛미디어의 "혼공"시리즈인 혼자공부하는 시리즈 중 하나 답게 프로그래밍이나 데이터 분석이 초보를 대상으로 쓰여진 책이다.


      원래 파이썬을 주로 사용하지만 R책도 종종 참고를 하는 편인데 아무래도 주 사용언어가 R이 아니다 보니 R에 좀 더 익숙해지고자 베타리딩에 참여했던 책이다.


      파이썬의 판다스는 R에서 많은 영향을 받았다. 데이터프레임이라는 용어라든지 데이터의 요약 통계 등의 기능을 보면 R과 닮은 점을 많이 볼 수 있다.


      테이블 형태의 데이터를 자주 다룬다면 엑셀로는 속도, 용량, 자유도면에서 아쉬움을 느낄 수가 있는데 이때 R이나 파이썬과 같은 언어를 사용하면 날개를 달 수 있다.


      처음시작하는 입장에서 R이냐 파이썬이냐로 갑론을박이 이루어지기도 하는데 파이썬은 주로 사용하는 사람이지만 어떤 언어든 상관 없다고 생각한다.


      R의 tidy data 라든지 grammar of graphics 는 어떤 언어를 사용하든 이런 철학은 데이터 분석과 시각화를 이해하기에 좋다.


      그래서 내가 파이썬을 주로 다루고 있음에도 기회가 있으면 R과 관련된 이론이나 예제를 접해보려고 한다. 이 책의 베타리딩도 그러한 의미로 읽어보게 되었다.


      R에 대한 기본적인 사용법과 함께 현실 데이터에 어떻게 이런 개념들을 적용하면 좋을지 예제를 통해 설명하고 있다.


      이 책에 기대하면 좋은 내용은!


      • 통계가 처음인데 그 동안 배웠던 통계는 너무 복잡하고 어려웠다.

      • 예시데이터를 통해 통계를 쉽게 이해하고 R도 덤으로 익히고 싶다.

      • 데이터 시각화를 통해 데이터를 통해 인사이트를 얻고 싶다.

      • 실제 데이터를 통해 프로젝트처럼 데이터를 분석해 보고 싶다.

      • R의 명령어나 사용법을 좀 더 쉽고 친절한 언어로 익혀보고 싶다.


      시중에 나와있는 데이터분석책은 많고도 많다. 데이터분석이 처음이고 통계, 시각화도 처음일 때 쉽게 풀어쓴 책으로 익혀보고자 할 때 좋은 책이다.





      내용의 정리나 혼공노트처럼 곁에두고 참고해 볼 수 있는 요약노트를 제공해 주고 있어서 R의 입문자 혹은 데이터분석 입문자에게도 좋고 나처럼 파이썬을 주로 사용하지만 R도 배우고 싶은 사람에게도 친절한 안내를 해주는 책이다.





      이 리뷰는 한빛미디어에서 베타리딩을 통해 도서를 제공받아 작성했습니다.


    • IMG_2470.jpg


       



      보통 프로그래밍 관련 책은 툴의 설치, 해당 언어의 문법, 사용예들을 다룬다. 


      이 책도 마찬가지로 이런 목차를 가지고 있지만 초보자를 대상으로 하고 있어서 아주 자세하게 설명을 하고 있다.


      특히 툴의 설치 부분에서는 단계별로 화면을 캡쳐가 되어 있어서 실수를 방지한다. 기본적으로 윈도우즈를 기반으로 설명을 하는데,


      맥을 사용하는 나의 경우에도 큰 무리 없이 툴의 설치 및 예제를 따라서 할 수 있었고, 책에서 나온 같은 결과를 얻을 수 있었다.


      그리고 데이터 분석의 전 단계인 데이터 취득(준비), 가공등에 대해서도 잘 설명이 되어 있어서 유용했다.


       


      R을 처음 사용해 봤는데, R의 가장 큰 장점은 쉽다는 것이다.


      프로그래밍을 안해본 사람도 충분히 데이터 분석 및 데이터 시각화가 가능할 것 같고, 제공하는 라이브러리를 이용하는 수준에서 충분히 가능하다.


       


      새로운 툴, 언어를 배우는 가장 좋은 방법은 실제로 내가 해보고 싶은 것(내가 필요한 것)을 구현하는 것이다. 구현을 하면서 필요한 기능은 검색을 하거나 누군가 구현한 코드를 분석을 하면 자연스럽게 나의 것이 된다.



      책을 읽고나니 책의 마지막부분에서 언급한 마이크로 소프트 파워 BI, 태블로, 구글 데이터스튜디오등도  한번쯤은 경험해 보고 싶은 생각이 들었다.


       


       



      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

    • 한빛미디어의 나는 리뷰어다 활동을 위해서 책을 제공받아 작성했습니다. 


       


      개인 블로그에 작성한 리뷰의 주소입니다. 



      https://jhk0530.medium.com/리뷰-혼자-공부하는-r-데이터-분석-3cc17b78503e


       


      이 책을 리뷰하는 저는 


      CRAN에 R package도 개발해서 올려본 경험이 있는 사람 


      동시에 R과 Python을 비경험자 대상으로 교육해본 경험이 있는 사람 입니다.


       


      요약


      제목처럼 혼자서 R을 활용한 데이터 분석, 시각화의 쌩기초를 배울 수 있는 가이드 도서로는 충분하다고 생각합니다. 


      그러나 이 책만으로 R이나 데이터 분석, 시각화 중 하나를 마스터 하기에는 내용이 가벼운 편이라 해당 목적으로는 어려울 것 같아요. 


      교양 도서만큼 가벼운 편은 아니니 주말 하루 잡고 (3~6장만) 따라하는 원데이클래스의 내용 정도를 생각하면 충분할 것 같다고 생각합니다.


       


      권장 독자 


      데이터 관련 직무로 회사에 입사했는데 이전에 프로그래밍 경험이 없으며 팀에서 Python이 아닌 R을 사용하는 경우입니다. 그 이유는 이 책의 문제가 아니라 구직자의 관점에서 R은 별로 가성비가 좋지 않기 때문인데요. 사실상 프로그래밍 경험이 없이 데이터 관련 직무로 입사를 하긴 이상하니. 조직내에서 데이터 분석쪽으로 커리어 전환을 위해 업무를 경험하고 싶은 경우가 더 맞을 것 같습니다. 


       


      혹은 취미로 데이터 분석이란걸 해보고 싶은데 비싼 돈과 시간을 들여서 온라인 강의를 듣긴 조금 그런 경우. 


      특히 직장인보다는 데이터 분석 쪽을 생각하고 있는 저년차 학생들한테는 좋을 것 같습니다.


       


      이 책의 장점 


      프로그래밍 언어의 이론적인 설명을 넘어서서 실제로 R 개발하는 환경이나 과정들도 잘 설명되어 있습니다. 


      프로그래밍의 입구컷을 담당하는 부분들을 정말 잘 해결해주고 있어서 입문자들에게는 좋을 것 같아요. 


       


      Youtube에서 거의 그대로 따라하며 들을 수 있는 수준의 강의들을 제공해 주고 있습니다.(22년 2월 기준 업로드 진행 중) 


       


      데이터 분석의 흐름: 읽기-가공-시각화(EDA)-리포트 라는 흐름으로 책을 서술하고 있어서 한번 쭉 따라하면 아 이런 일들을 할 수 있겠구나 라는 걸 생각 해볼 수 있습니다. 


       


      ggplot2, dplyr, reshape2 , rmarkdown, shiny등 실제 많이 활용되는 패키지들도 개념 설명과 활용 예시를 포함하여 다뤄주고 있습니다.


       


      제목은 “혼공”이지만 공부하기에 동기부여가 있으면 좋은 사람들을 위해 스터디 그룹을 운영하고 있습니다. R은 신간이라 아직 없는 듯 하지만 곧 생길 것 같아요.


       


      개인적으로 아쉬운 점 


      중간중간 퀴즈들이 있는데 이게 의미가 있는지는 잘 모르겠습니다. 만약 이러한 이론적인 내용의 정답여부를 확인하는 것이 목적이라면 ADsP를 공부하는게 더 좋을 것 같다고 생각해요.


       


      다루는 내용들 중에 내 기준으로는 조금 더 깊게 다뤘어도 좋았을 것 같은데… 싶은 것들이 종종 있습니다. 넣자니 애매하고 안넣자니 아쉬워서 언급 정도만 했다고 생각하면 충분합니다. 


       


      내용 


      --- 1부: 저는 프로그래밍 경험이 없어요 


      1장: R 개요 -> 개발 작업환경을 설정할 수 있다. 


      2~3장: R 문법 -> 기초 R 문법들을 따라하며 배울 수 있다. 


       


      2부: 저는 R을 사용해본 적이 없어요 


      4~5장: txt, csv 등의 데이터를 R에서 읽고, 가공하는 과정을 설명하고 있다. 


      6장: ggplot2 를 위시한 데이터 시각화 


       


       


      3부: 이런 것도 알면 좋다 


       


      7장 ~ 8장: 프로젝트 예시 + 보고서 만들기 (안봐도 됨) 


       


      개인의 경험이나 목적에 따라 보면 좋을 것 같습니다.


    • R로 데이터분석을 해보고 싶다면 고민없이 혼공R데이터분석(ADsP준비에도 굿!)


       



      R을 활용하여 데이터 분석을 해 보고 싶거나



      데이터분석 준전문가(ADsP)를 공부해야 하는데 



      R언어나 R로 하는 데이터 분석을 모르겠다면



      이 책을 추천드려요^^.


       



      데이터분석 준전문가(ADsP) 수업을 해보니 실습은 없지만 



      R이란 언어도 모르는데 데이터분석을 공부하려고 하니



      힘들어 하는 학생도 있고 공부하다 보니 더 공부해보고 싶어하는 학생들도 있기에



      어떤 책을 기초서로 추천해주면 좋을까 하고 책을 찾아보다가 



      눈에 똭! 띄여서 펼치게 되었어요.


       


       


      R을 활용하여 데이터 분석을 해 보고 싶거나데이터분석 준전문가(ADsP)를 공부해야 하는데 R언어나 R로 하는 데이터 분석을 모르겠다면이 책을 추천드려요^^.데이터분석 준전문가(ADsP) 수업을 해보니 실습은 없지만 R이란 언어도 모르는데 데이터분석을 공부하려고 하니힘들어 하는 학생도 있고 공부하다 보니 더 공부해보고 싶어하는 학생들도 있기에어떤 책을 기초서로 추천해주면 좋을까 하고 책을 찾아보다가 눈에 똭! 띄여서 펼치게 되었어요.


       



      표지.jpg


       


       


       


       


      R 기초책을 보자니 데이터 분석쪽을 좀 다뤘으면 좋겠고


      데이터분석쪽을 보자니 기초도 어느정도 다뤄줬으면 좋겠다는....


      그런 마음을 적절하게 잘 섞은게 이 책이 아닌가 싶어요^^


       


      chapter 01. 빅데이터와 R


       - 빅데이터와 R에 대해 알아본 후 개발환경 구축(설치)


       ( R 설치 -> R Studio 설치, 꼭 2개 다 설치해야 합니다^^ 


         가끔 R 건너뛰고 설치하는 초보자 있어여^^;;)


       


      chapter 02. 데이터 분석을 위한 기본 다지기


       - 데이터 분석을 위해 필요한 과정을 개략적으로 중요 포인트 위주로 파악


       - R을 처음 하시는 분들 데이터 생김새부터 파악해보세요.


         (R을 알고 있다면 패스~)


       


      chapter 03. R프로그래밍 익히기


       - R을 알고 계신 분들은 패스~~~~


       - R이 처음이다 하시는 분들은 정말 기초 중의 기초 주요한 부분만 살펴보겠습니다.


       


      chapter 04. 데이터 다루기


       - 데이터를 수집/관측/탐색하는 데 필요한 내용들을 배웁니다.


       - R을 알고 있더라도 외부 데이터 어떻게 가져오는지 


        분석 전 해당 데이터를 이해하는 다양한 방법들을 배울 수 있는 부분이니 꼭 보고 가세요^^


        데이터분석 준전문가(ADsP) 준비하시는 분들 


        2과목 데이터 분석 기획이랑 3과목 1장에서 만나게 되는 탐색적 데이터 분석(EDA)을


        경험해볼 수 있어요^^


       



      분위수.jpg


      chapter 06. 데이터 시각화:ggplot2 패키지


      - 데이터 파악을 위한 좀 더 다양한 시각화를 배우게 됩니다.


      - 재미난 지도 시각화도 있어요^^


       


      chapter 07. 프로젝트로 실력 다지기


      - 데이터분석 준전문가(ADsP) 3과목 2장에서 통계 어려웠죠?


       그 통계파트에서 나오는 빈도분석, 가설 검정, 분산분석에 대한 좋은 예들이 있네요^^


      - 자격증 아니더라도 R로 데이터분석하는 것을 알아보고 싶으신 분들 참고하세요.


      *** 공공데이터들을 활용해서 데이터 분석을 진행하기에 


           공모전이나 대회 준비하시는 분들에게 도움되실꺼 같아요.


             통계에 대한 부분이 있지만 공식을 활용한 이론적 접근이기 보다는


           R에서 지원하는 함수들을 바탕으로 실제 활용에 대한 부분들을 다루기때문에


           오히려 이 코드들을 통해 원리를 이해하시고 이론서를 보시면 더 도움이 될듯 해요.


           여기 있는 코드들이 이해된다면 ADsP 자격증 문제집에 있는 


          각 이론별 활용 코드들을 보는데 도움이 될꺼예요^^)


       


      chapter 08. 데이터 분석 보고서 공유하기


      - RPubs로 데이터 분석 결과 공유하거나


        샤이니로 인터랙티브 웹 앱 만들어 볼 수 있도록 해줍니다.


      --> 데이터를 분석한 뒤 그 결과를 어떻게 활용할 수 있는지 예를 보여주는 거 같아요^^


         이렇게 보고서 또는 앱에 연동하여 결과를 공유할수도 있다라고 알고 계심 좋을꺼 같아요.


      이렇게 전반적으로 책을 살펴봤구요


       


      저는 이 책의 가장 좋은 점이 친절한 설명과 부족하지도 넘치지도 않는 구성인거 같아요.


      전반적으로 코드가 어려운 부분없이 설명이 잘 되어 있고


      얼마나 친절한지 p138에서 초보자들이 자주내는 오류들도  알려줘요.


      (에러가 났다면 한번 살펴보는 것도 도움될꺼 같아요)


      각 장별로 연습문제도 있어서 앞에서 배운 내용 확인해 볼 수도 있어요.


      깔끔한 정리와 함께 내용확인도 할 수 있는 마무리!


      혼공용어노트도 마음에 드네요^^ 


       



      혼공용어노트.jpg


       


       


       


      R이나 데이터분석에 대해 처음 배우는 분들은 제일 어려운게 용어인데


      용어를 이렇게 정리해두니 책을 보다가 어! 아까 앞에서 봤던 건데 이게 머지? 할때


      혼공노트보고 찾아보고 다시 내용보기 좋아요.


      만약 혼공노트의 요약된 내용을 보고도 이해가 잘 안된다면 페이지수도 적혀있기 때문에


      해당 페이지에 가서 다시 살펴보고 오면 되요.


       


      정말 혼자 공부하기 좋을만한 친절한 책인거 같아요.


      그래서...


       


      ​R을 활용하여 데이터 분석을 해 보고 싶거나


      (R를 활용해 데이터 분석을 한다면 기초서로서 아주아주 훌륭하다.)


       


      ​데이터분석 준전문가(ADsP)를 공부해야 하는데 


      R언어나 R로 하는 데이터 분석을 모르겠다면 이 책을 펼쳐보라고 추천해주고 싶습니다^^


       


      (하지만 데이터분석 준전문가(ADsP) 3과목이 이론으로 좀 방대하기에


      이 책으로 거기 3과목에 나온 통계나 데이터마이닝 부분을 다 이해할 순 없어요 ㅠㅅㅠ


      그렇지만 전반적으로 R코드를 이용해 이런식으로 데이터분석을 하는구나


      이렇게 활용하는 구나 라고 대략적으로 파악할 수 있어요.


       또한 여기 있는 코드들이 이해된다면 ADsP 자격증 문제집에 있는 


      각 이론별 활용 코드들을 보는데 도움이 될 꺼예요. ^^))


       


       


       








    • 이재현님의 소개로 2022년 한빛미디어 [나는 리뷰어다]에 선정되어 리뷰를 하게됬다. [나는 리뷰어다]는 여러 책 중 3권을 선택하여 그 중 한 권을 제공받고 특정기간까지 리뷰를 작성하는 이벤트인 것 같다. 


      리뷰어는?


      해당 리뷰를 작성한 리뷰어는 통계학 석사이며, AI 관련 업무를 하고 있는 2년차 직장인이다. Python과 R을 활용하며, R은 2016년부터 활용하였다. 리뷰를 읽을 때 참고하기 바란다.


      리뷰를 하기전에 하고싶은 말



      IT 공부를 함에 있어서 구글이 물론 최고의 스승님이지만, 정형화된 지식을 주지는 않는다. 그래서 나는 책을 많이 구매하는 편이고, 기술서적을 볼 때 내게 맞게 정형화되어 쓰여진 책을 위주로 읽는다. 개인적으로 이번 리뷰어 기회로 내게 맞는 책만 보는 것이 아닌 다양한 책을 접할 수 있는 기회를 얻을 수 있다는 점이 매우 좋다고 생각한다.




      혼자 공부하는 R 데이터 분석




      B6779219508_l.jpg



      독자는 누구인가?


      빅데이터에 대한 개요와 데이터 분석의 전반적 흐름 R에서 이를 수행하는 방법, 이를 통한 간단한 웹앱 생성을 다루고 있다. 빅데이터 관련한 입문자나 R을 통한 전반적인 분석을 수행하고 싶은 자라면 추천할만하다 생각된다.


      목차는 어떠한가?


      목차는 크게 아래와 같이 구성되어 있다.




      1. 빅데이터와 R언어
        - 빅데이터와 R에 대한 설명과 설치에 대한 내용


      2. 데이터분석을 위한 기초다지기
        - 데이터의 구조를 R의 자료구조에 맞게 설명


      3. R프로그래밍 익히기
        - 패키지 및 조건문과 반복문에 대한 설명


      4. 데이터 다루기
        - 데이터 불러오기, 기술통계량, 데이터 시각화 예제


      5. 데이터 가공하기
        - dplyr, reshape2 패키지를 통한 데이터 핸들링


      6. 데이터 시각화
        - ggplot을 통한 데이터 시각화 및 ggmap을 통한 지도 시각화


      7. 프로젝트로 실력다지기
        - 간략한 프로젝트 수행


      8. 데이터 분석 보고서 공유하기
        - Markdown 및 웹앱 만들기


      이책은 친절한가?


      동영상 강의


      책 서두에 학습 사이트 100% 활용하기 링크가 있어 해당 링크를 따라가보니 동영상 강의 등 다양한 정보들을 제공하고 있다. 강의 위주의 학습을 하는 사람이라면 도움이 될 것 같다.





      화면 캡처 2022-02-16 174916.png





      [한빛미디어] 혼자 공부하는 R 데이터 분석

      이 책은 독학으로 R 데이터 분석 배우는 입문자가 ‘꼭 필요한 내용을 제대로’ 학습할 수 있도록 구성하였습니다. ‘무엇을’ ‘어떻게’ 학습해야 할지 막막한 입문자의 마음을 살펴, 과외 선생님이 알려주듯 친절하게, 핵심만 콕콕 짚어 알려드립니다.







      깃허브 제공


      Github는 Code를 저장해 두는 저장공간이라 생각하면 된다. 처음 공부하는 사람들은 하나씩 타이핑하면서 따라하는 것을 추천하지만, 오탈자가 많이 발생하므로 git을 설치하여 코드를 받아서 따라하는 것도 나쁘지 않아보인다.




      GitHub - newstars/hongongR: 혼자 공부하는 R 데이터 분석

      혼자 공부하는 R 데이터 분석. Contribute to newstars/hongongR development by creating an account on GitHub.







      무엇이 좋았는가?



      1. 간략한 예제를 통해 작성되어 응용하기 편할 것 같다.

      2. 핵심적인 내용위주로 작성되어 초심자가 데이터 분석 전과정을 거시적으로 보는 눈을 기르기에 좋을 것 같다.

      3. 개발 및 문서화 부분에 취약한 전공자들에게 도움이 될 것 같다.


      무엇이 아쉬운가?



      1. 핵심 내용을 위주로 다루다보니 통계적 설명이 생략된 부분이 있는 것 같다.





      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."




    • 혼자공부하는R데이터분석_표지.jpg


       


      이 책은 혼자서도 충분히 데이터 분석을 해볼 수 있도록 체계적으로 학습 내용 방법을 전달하고 있다.


       


      기본적으로 R을 소개하고 설치하는 법을 시작으로 데이터 분석을 위한 기초를 다지기 위한 학습법을 알려준다. 데이터 분석을 잘 하기 위해서 어떠한 분석 과정을 통하여 학습을 진행하면 좋은지 친절하다.


       


      이후에는 R을 이용한 프로그래밍 방법을 설명한다. 변수와 함수 등 기본적인 프로그래밍을 처리하기 위하여 혼자서 독학으로 충분하게 학습을 할 수 있도록 체계적인 설명으로 유도하기 때문에 특별한 어려움은 없다.


       


      다양한 데이터 시각화를 위한 라이브러리를 활용하는 방법과 설치하는 법을 쉽고 다양한 그림으로 설명하기에 학습 효과가 상당히 좋다고 느껴진다.


       


      그리고 본격적으로 데이터를 다루어 보는 실습들이 이루어진다. 다양한 패키지를 활용하고 다양한 데이터를 직접 손코딩을 통하여 가공해보고 혼자서 충분히 다양한 데이터 시각화를 해볼 수 있다. 


       


      데이터 시각화를 위한 R에서 제공하는 다양한 패키지 함수를 활용하여 실습을 하고 있기에 학습 효과가 너무 좋게 느껴지는게 이 책의 가장 큰 장점이라고 할 수 있다.


       


      그리고 이 책에서 제공하는 마무리 챕터는 아주 좋다. 기본적인 학습을 하고 다양한 키워드를 통하여 핵심 포인트를 제공하고 확인 문제를 풀게 함으로써 개인이 혼자가 아닌 누군가 학습을 친철하게 알려주는 느낌을 제공해서 아주 좋다. 


       


      혼자서 공부하는 R 데이터 분석은 초보자부터 다른 언어를 알고 있는 누구라도 읽어 볼만한 추천 도서이다.


       


       



      "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."







    • · "나는 문과출신 비전공자에다가 코딩에 대해 무지한데 과연 잘 할 수 있을까?"


      인공지능에 발을 디딛는 입문자 분들에게 이런 이야기를 심심치 않게 들을 수 있습니다.   


      무언가를 새로이 시작한다는 것은 거부감과 두려움을 동반하는 일임을 자연스레 깨닫게 됩니다.


      그래서 작심삼일이 많은데 여기에 더해 문과출신 비전공자에 코딩 경험 부족이라는 백그라운드는 입문자 분들에게 높은 진입장벽을 만들기에 이르는 것을 봅니다. 


       


      · 이것은 본 리뷰를 작성하는 필자의 경험담이기도 합니다. 


      그래서 책을 고를 때 많은 사람들의 리뷰를 찬찬히 살펴보고, 일단 내가 소화할 수 있는 책인가를 열심히 살폈던 것 같습니다. 내가 이해하고 소화할 수 있어야 재미도 따라붙게 마련이니까요.


       


      · 많은 사람들은 커뮤니티 교류나 스터디를 조직해서 공부하는 것이 효과적이라고 말합니다.  


      하지만 사람마다 공부의 방법이 다 다릅니다. 특히 같이 공부하기에는 진도가 빨라서 따라가지 못할 것 같거나 오히려 함께 공부하는 이들에게  방해가 될까 두려운 분들이 있습니다. 아니면 혼밥, 혼술처럼 조용히 혼자 공부하는 것을 선호하는 많은 혼공족들이 있습니다.  


       


      · 그런 의미에서 한빛미디어의 혼자 공부하는 시리즈를 예전부터 주목해오고 있었습니다.   


      저 또한 함께 공부하기 보다는 혼자서 찬찬히 내용을 음미하고, 받아들이는 것을 선호하기 때문이었습니다.


      이 책을 보면서 느낀 점은 '정말 책 제목 그대로 혼자 공부할 수 있도록 쉽고 상세하고 쓰여졌구나' 하는 점이었습니다. 처음부터 끝까지 오롯이 나의 힘으로 소화할 수 있겠다는 확신과 자신감을 불어넣어줄 수 있는 책입니다.   


       


      · 인공지능이라는 용어만 접하여 여러 책을 사보다보면 처음에는 머신러닝, 딥러닝 알고리즘 공부를 하다가


      자신도 모르는 새에 데이터 전처리나 시각화를 포함하는 데이터 과학의 길로 접어들게 되는 것을 보게 됩니다.  인공지능 모델을 만들기 위해서는 결국 잘 정제된 데이터를 필요로 하고, 데이터를 이리저리 돌려보고 그려보고 탐색하면서 데이터의 중요한 특성을 찾아내서, 학습을 위해 맞춤형 데이터를 잘 주무를 줄 아는 역량이 필수적임을 알게 되기 때문입니다. 


       


      · R이라는 언어를 다루고 싶어 이 책에 접근하는 분들이 많이 있을 듯 합니다. 


      하지만 되려 R이라는 언어를 다룬다고 하기에 이 책을 공부하는 것을 주저하는 분들이 있을 겁니다. 


       


      · 저는 파이썬을 활용한 데이터 분석의 학습 경험이 있었고, R을 활용한 데이터 분석은 처음이었습니다.


      그래서 처음엔 주저하게 되었지만, 한 장 한 장 읽다보니 이 책은 R이라는 언어보다 '데이터 분석'에 방점이 찍혀있는 책임을 알게 되었습니다. 즉, 이 책은 R의 사용법에 매몰되어 있는 것이 아니라 데이터 분석의 프레임워크와 흐름을 집어내어 주고, 이를 R이라는 언어가 가진 장점을 도구로 명징하게 풀어냅니다. 


       


      · 또한 30명의 베타리더와 함께 구성하여 입문자에게 맞는 난이도, 분량, 학습 요소 등을 적극 반영한 노력의 결과가 책의 곳곳에 여실히 묻어납니다. 


       


      · 그렇기에 R에 관심있어 입문하고자 하는 분들 뿐 아니라 기존의 파이썬을 활용한 데이터 분석의 경험이 있는 학습자, 데이터 분석 자체에 관심있어 입문하고자 하는 독자들에게도 좋은 학습의 선택지가 되리라 확신합니다. 


       


      · 데이터 시각화와 통계 분석이라는 또 다른 강점을 가진 R을 활용한 데이터 분석의 세계에 입문하길 원하는 분들에게 '혼자 공부하는 R 데이터분석(강전희 엄동란, 2022)'을 추천합니다.


       


      · "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."





       



    • 혼공 시리즈답게 기본을 탄탄하게 다루면서도 활용도 높은 필수 패키지인 dplyr과 ggplot2를 추가로 잘 설명하고 있으며, 개인적으로는 코드 뒤에 추가로 설명한 오류 조치 팁들이 인상깊었습니다. 


       


      혼자 공부하면서 가장 어려운 부분이 예기치 못한 오류를 만나고 해결 방법을 찾기 어려운 경우인데, 코드에서 발생 가능한 오류에 대해 미리 설명하고 있어 혼공족 분들에게는 꿀팁이 될 것이라 생각됩니다. 


       


      유튜브 강의, 별책부록 등 개인 학습을 위해 제공되는 추가 자료들까지 전반적으로 만족하는 책이지만, 고급편에서 설명되는 구성에 부족함을 느껴 0.5점을 제외하였습니다. 


       


      기초편에서 dplyr 패키지까지 설명하고 고급편은 ggplot2부터 시작하길래 좀 더 다양한 분석 사례를 다룰 것이라 예상했는데, rmarkdown, shiny 등 활용성을 높이는 방향으로 설명 되어있어 개인적으로 아쉬웠던 것 같습니다. 


       


      그럼에도 혼자 R 공부를 시작하려는 분들에게 추천드리는 책이며, 분석에 대한 깊은 이해가 필요하신 분들은 타 도서를 추가로 학습하시면 좋을 것 같습니다.


       




  • 내용이 없습니다.
닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?