한빛출판네트워크

IT/모바일

실시간 분석의 모든 것: 스트리밍 데이터 분석 및 시각화 시스템 구축 가이드

한빛미디어

번역서

절판

실시간 분석의 모든 것: 스트리밍 데이터 분석 및 시각화 시스템 구축 가이드
좋아요: 33
  • 저자 : 바이런 엘리스
  • 역자 : 이상훈
  • 출간일 : 2015-12-11
  • 페이지 : 480쪽
  • ISBN : 9788968482298
  • 물류코드 :2229

합계 : 31,500

  • 실시간 분석 솔루션을 구축하기 위한 가장 완벽한 지침서 


    빠른 비즈니스 의사결정을 위해 실시간 분석에 대한 관심이 고조되고 있다. 이 책은 스트리밍 데이터의 분석에서 시각화까지 전 단계를 망라하는 가성비 높은 솔루션을 제시한다. 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 구성하고 데이터를 처리 및 저장하는 방법을 다룬다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고 모니터링하고 실시간에 맞게 최적화하는 방법을 살펴본다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.

     

     

    빅데이터 분석의 새로운 패러다임 실시간 분석 솔루션 구축 가이드 


    많은 기업이 실시간으로 발생하는 데이터로부터 빠른 비즈니스 인사이트를 얻기 위해 부단히 노력하고 있다. 데이터를 저장한 후 분석하는 기존 배치 방식은 인사이트 확보 타이밍을 제대로 맞추기 어려웠다. 이에 적시에 신속히 중대 의사결정을 내릴 수 있도록 프로세스 시간을 획기적으로 단축해주는 실시간 분석 솔루션에 대한 관심이 고조되고 있다. 
    이 책은 이러한 트렌드에 맞춰, 스트리밍 데이터의 수집, 전달, 처리, 저장, 시각화까지 실시간 분석의 전 단계를 망라하는 가성비 높은 솔루션을 구축하는 지침을 제공한다. 스트리밍 데이터의 특성을 살펴본 다음(1장), 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 설계 및 구성하고(2~3장) 데이터를 처리 및 저장(4~6장)하는 방법을 알아본다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고(7~8장), 데이터를 표집하고 추정값을 얻어내는 데 사용하는 통계 기법과 알고리즘을 살펴본다(9~10장). 끝으로 실시간 데이터를 모니터링하고 실시간에 맞게 최적화하는 고급 기법을 살펴본다(11장). 
    관련 기술이 워낙 많고 빨리 변하다 보니 개별 기술은 알아도 그것을 실무에서 어떻게 사용할지 곤혹스러워하는 경우가 많다. 이에 실시간 처리에 꼭 필요한 기술이 어떤 흐름에 따라 유기적으로 활용되는지 길을 제시해주는 이 책의 가치가 더 크다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.

     

     

  • [저자] 바이런 엘리스

    Byron Ellis
    광고 기술 기업인 스펀지셀(Spongecell)의 CTO. 연구와 개발뿐만 아니라 스펀지셀의 컴퓨팅 인프라의 유지 관리를 담당하고 있다. 스펀지셀에 입사하기 전에는 온라인 연결 기술의 선두 업체인 라이브퍼슨(Liveperson)의 최고 데이터 과학자(Chief Data Scientist)였다. 세계 최대의 광고 거래 플랫폼 중 하나인 애드브라이트(adBrite)에서 다양한 직급을 역임하기도 했다. 하버드 대학교에서 통계학 박사학위를 취득했다.

     

    [역자] 이상훈

    빅데이터 및 실시간 분석 전문가. 연세대학교에서 패턴인식으로 석사학위를 받았고, 수년간 KIST (한국과학기술연구원)에서 데이터 분석과 기계학습 관련 업무를 담당했다. 현재는 SK주식회사에서 빅데이터 처리 및 분석을 하고 있다. 스파크와 R을 이용한 실시간 처리와 분석을 주제로 정부 기관 및 기업에서 강의를 하고 있으며, 한국 스파크 사용자 모임(facebook.com/groups/SparkKoreaUser) 운영진으로 활동 중이다.

  • 1. 스트리밍 데이터 소개
        1.1 스트리밍 데이터의 원천
        1.2 스트리밍 데이터만의 특징
        1.3 인프라 및 알고리즘
        1.4 마치며


    1부. 스트리밍 분석 아키텍처


    2. 실시간 스트리밍 아키텍처 설계
        2.1 실시간 아키텍처의 구성요소
        2.2 실시간 아키텍처의 특징
        2.3 실시간 프로그래밍을 위한 언어
        2.4 실시간 아키텍처 체크리스트
        2.5 마치며


    3. 서비스 구성 및 조정
        3.1 구성 및 조정 시스템의 출현 배경
        3.2 분산 상태 유지
        3.3 아파치 주키퍼
        3.4 마치며


    4. 스트리밍 분석에서의 데이터 흐름 관리
        4.1 분산 데이터 흐름
        4.2 아파치 카프카: 높은 처리량을 가지는 분산 메시징
        4.3 아파치 플룸: 분산 로그 수집
        4.4 마치며


    5. 스트리밍 데이터 처리
        5.1 분산 스트리밍 데이터 처리
        5.2 스톰을 이용한 데이터 처리
        5.3 삼자를 이용한 데이터 처리
        5.4 마치며


    6. 스트리밍 데이터 저장
        6.1 일관된 해싱
        6.2 NoSQL 저장 시스템
        6.3 기타 저장 기술
        6.4 기술 선택하기
        6.5 웨어하우징
        6.6 마치며


    2부. 분석 및 시각화


    7. 스트리밍 메트릭 전달
        7.1 스트리밍 웹 애플리케이션
        7.2 데이터 시각화하기
        7.3 모바일 스트리밍 애플리케이션
        7.4 마치며


    8. 정확한 집계와 전달
        8.1 특정 시점 카운팅과 합계
        8.2 다중 해상도 시계열 집계
        8.3 확률적 최적화
        8.4 시계열 데이터 전송
        8.5 마치며


    9. 스트리밍 데이터의 통계적 근사
        9.1 수치 라이브러리
        9.2 확률과 분포
        9.3 분포 살펴보기
        9.4 난수 생성
        9.5 표집 절차
        9.6 마치며


    10. 스케치를 이용한 스트리밍 데이터 근사
        10.1 레지스터와 해시 함수
        10.2 집합
        10.3 블룸 필터
        10.4 고유 값 스케치
        10.5 카운트-최소 스케치
        10.6 다른 애플리케이션
        10.7 마치며


    11. 단순 집계를 넘어서는 고급 기법
        11.1 실시간 데이터를 위한 모형
        11.2 모형 예측
        11.3 모니터링
        11.4 실시간 최적화
        11.5 마치며

  •  

  • 내용이 없습니다.
    • 데이터 시각화를 위한 데이터 인사이트 : 빅데이터를 바라보는 통찰의 눈

      헌터 휘트니

    • 엔지니어를 위한 데이터 시각화 : D3.js로 배우는 데이터 시각화 이론과 12가지 사례

      모리후지 다이치 , 안티베이지안

    • 하둡 완벽 가이드 : 클라우드 컴퓨팅 구축을 위한 실전 안내서(개정3판)

      톰 화이트

    • 실전 하둡 운용 가이드 : 대규모 하둡 클러스터 관리를 위한 필수 노하우

      에릭 새머

    • HBase 완벽 가이드: 하둡 환경에서 실시간 빅데이터 랜덤 엑세스를 제공하는 클라우드 NoSQL

      라스 조지

닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?