리얼타임 eBook
번역서
판매중
합계 : 8,910원
R을 제대로 활용하는 방법! R 병렬 프로그래밍
SNS 데이터, 연구자료 등 빅데이터를 분석하고 싶은가? 그럼 분석 도구 중 R을 사용하기를 권한다. R을 써야 하는 이유는 자명하다. 고성능이며 다양한 플랫폼에서 사용할 수 있는데다 오픈 소스로 개발된 통계 소프트웨어다. R은 데이터를 잘 살펴보기 위한 대화형 인터페이스를 갖추고 있으며, 원하는 분석과정을 반복하기 위하여 스크립트 언어처럼 사용할 수도 있다. 게다가 대부분의 통계적인 분석 알고리즘이 내장되어있어 직접 코드를 짜지 않아도 된다. 무엇보다도 R은 공짜다. 만약 기본적으로 제공된 함수들로 충분하지 않다면, 다른 사용자가 만든 수많은 애드온 패키지와 GUI 환경 등을 추가로 다운로드받아 사용할 수 있다. 이런 특징이 R을 빅데이터 시대의 화두로 만들어주었다.
하지만 R을 이용한 병렬 프로그래밍 방법을 모른다면, 빅데이터를 분석하기 어려울 것이다. 빅데이터를 분석을 위해서 수십 분 혹은 수 시간을 기다리다 지쳐 쓰러질 수도 있을 것이다. 빅데이터 분석과 같은 분석시간이 많이 걸리는 작업을 하려면, R 병렬 프로그래밍은 선택이 아니라 필수다. 이 책은 R이 무엇인지, 어떻게 사용하는지 알고 있는 독자를 대상으로 R 병렬 프로그래밍 방법을 소개한다. 이 책은 빅데이터 분석과 R 사용 스킬을 업데이트하기 위한 가이드가 되어줄 것이다. 이 책에서 다루는 내용은 다음과 같다.
대상 독자
빅데이터 분석을 위한 최고의 분석도구인 R을 병렬로 사용하는 방법!
요즘 빅데이터에 대한 관심은 "어떻게 대용량 데이터를 처리하는가"에서 "무수히 많은 데이터에서 의미 있는 데이터를 어떻게 끌어내는가"로 이동하고 있다. 그래서 데이터 분석이나 통계 관련 기술이 요즘 부각되고 있는데, 그 중 하나가 R이다. R은 오픈 소스 통계분석 엔진으로 다양한 통계 기법과 수치 해석 기법을 지원하며, 패키지를 통해 기능을 확장할 수 있다.
R을 가지고 어떻게 빅데이터를 분석할까? 그 해답은 이 책에 담겨 있다. R을 병렬로 사용하기 위한 패키지를 소개하고 활용 방법을 알려준다. 이를 통하여 데이터 처리 및 분석 작업을 여러 CPU에 분산하거나 여러 기계에 분산함으로써, R의 메모리 한계 문제나 single-thread만을 사용하여 연산속도가 느려지던 문제의 해결할 수 있다. 그리고 R과 하둡을 연계할 수 있는 패키지를 어떻게 사용하고, 어떤 상황에 적합한지 알려준다. 이 도서는 빅데이터 분석을 위한 가이드가 되어 줄 것이다.