한빛출판네트워크

IT/모바일

처음 시작하는 임팔라 : SQL로 하둡을 다루는 가장 쉬운 방법

리얼타임 eBook

번역서

판매중

처음 시작하는 임팔라 : SQL로 하둡을 다루는 가장 쉬운 방법
좋아요: 33
  • 저자 : 존 러셀
  • 역자 : 양원국
  • 출간일 : 2015-04-21
  • 페이지 : 141쪽
  • ISBN : 9788968487262

합계 : 9,900

리얼타임 eBook은 PDF 형식으로 제공되며, 다운로드한 eBook은 PDF 포맷을 지원하는 디바이스 또는 프로그램에서 제한없이 열람할 수 있습니다. 또한 eBook 내의 텍스트 검색 및 인쇄도 가능합니다.

  • 빅데이터를 여는 열쇠, SQL온하둡(SQL-on-Hadoop)의 선두주자, 임팔라!


    아파치 하둡 에코시스템은 데이터에 중점을 두고 있어 SQL 경험이 있는 데이터베이스 개발자에 안성맞춤이다. 하둡 애플리케이션 개발 작업의 많은 부분이 데이터 파일을 복사하고 변환하고 재조직화하여 분석하는 프로그램을 작성하는 일로 이루어져 있다. 이러한 일들을 대규모 병렬 방식의 네트워크 장비로 묶인 클러스터에서 신뢰성 있게 수행하려면 엄청난 노력이 필요하다.
    임팔라는 이러한 활동을 쉽고 빠르게 해주기 때문에 분산 컴퓨팅에 관한 전문적인 지식이나 새로운 API를 배울 필요도 없다. 심지어 수행하려는 작업이 단일 SQL 문장으로 표현할 수 있을 정도라면 프로그램을 작성할 필요조차 없다.


    이 책은 데이터베이스 경험은 있지만 아파치 하둡 소프트웨어 스택 경험은 없는 사람을 대상으로 임팔라 아키텍처와 사용법 측면에서 사례를 알려준다. SQL 예제는 이해를 돕는 단순한 예제를 시작으로 고성능과 확장성을 보여주는 모범사례를 다루는 예제로 확장해 나간다.


    이 책의 대상독자

    이 책은 데이터베이스, 데이터 웨어하우스, 빅데이터에 관한 지식이 있는 독자를 대상으로 한다. 따라서 CREATE TABLE, SELECT, INSERT 같은 구문과 주요 절에 관한 설명이 따로 필요 없을 정도로 독자는 SQL에 충분히 경험이 있다고 가정한다. 또한, 리눅스 경험이 있으면 더욱 좋다. 아파치 하둡 소프트웨어 스택 경험이 있으면 유용하나 필수는 아니다.

  • [저자] 존 러셀

    존 러셀은 소프트웨어 개발자이면서 테크니컬 라이터로, 현재 클라우데라 임팔라 프로젝트의 문서화를 이끌고 있다. 산업을 선도하는 팀의 구성원으로 데이터베이스와 SQL 분야를 경험했다. DB2의 초기 정보센터(Information Center)를 설계하고 제작했다. 오라클 데이터베이스에서 애플리케이션 개발 관련 주제를 문서화하고 프로젝트 타히티(Project Tahiti) 문서 검색 엔진을 설계하고 코딩했으며, MySQL에선 InnoDB 스토리지 엔진을 문서화했다. 캐나다의 뉴펀들랜드(Newfoundland) 출생으로 현재는 미국의 캘리포니아 주 버클리(Berkeley)에 산다.

    [역자] 양원국

    티맥스소프트에서 APM 솔루션을 개발했고, 그 후 빅데이터 전문회사 KT NexR에 재직하면서 빅데이터 처리에 오픈 소스 기술을 적용하고 운용하는 일을 했다. 현재는 프리랜서로 일하고 있다.
    역서로는 『하이브 완벽 가이드』(한빛미디어, 2013, 공역), 『아파치 Kafka 따라잡기』(에이콘 출판사, 2014), 『Hadoop과 Solr를 이용한 기업용 검색 시스템 구축』(에이콘 출판사, 2014)이 있다.

     

  • 1  왜 임팔라인가 
      1.1 빅데이터 에코시스템에서 임팔라의 지위
      1.2 빅데이터 워크플로우 유연성
      1.3 고성능 분석
      1.4 탐색적 비즈니스 인텔리전스


    2  임팔라 준비와 구동
      2.1 설치
      2.2 임팔라 접속
      2.3 첫 임팔라 질의


    3  데이터베이스 개발자를 위한 임팔라
      3.1 SQL 언어
      3.2 빅데이터 고려사항
      3.3 임팔라가 데이터 웨어하우스와 유사한가
      3.4 물리적이고 논리적인 데이터 레이아웃
      3.5 분산 질의
      3.6 정규화와 비정규화 데이터
      3.7 파일 포맷
      3.8 집계


    4  임팔라 개발 기본 작업
      4.1 임팔라 테이블에 데이터 입력하기
      4.2 코드를 임팔라 SQL로 포팅하기
      4.3 JDBC 또는 ODBC 애플리케이션에서 임팔라 사용하기
      4.4 스크립트 언어로 임팔라 사용하기
      4.5 임팔라 성능 최적화
      4.6 사용자 정의 함수
      4.7 관리자와 협업


    5  튜토리얼과 깊이 파고들기
      5.1 튜토리얼: 유닉스 데이터 파일을 임팔라 테이블로
      5.2 튜토리얼: 테이블 없는 질의
      5.3 튜토리얼: 수십억 로우로의 여행
      5.4 깊이 파고들기: 통계의 역할과 조인
      5.5 안티 패턴: 수백만의 작은 조각
      5.6 튜토리얼: 4차원을 넘어
      5.7 튜토리얼: 자술과 침묵 impala-shell 출력
      5.8 튜토리얼: 스키마가 진화할 때
      5.9 튜토리얼: 추상화 단계

  •  

  • 내용이 없습니다.
  • 내용이 없습니다.
닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?