한빛출판네트워크

IT/모바일

살아 움직이는 머신러닝 파이프라인 설계

텐서플로와 함께하는 머신러닝 프로젝트 자동화

한빛미디어

번역서

판매중

살아 움직이는 머신러닝 파이프라인 설계
좋아요: 1
  • 저자 : 하네스 하프케 , 캐서린 넬슨
  • 역자 : 송호연
  • 출간일 : 2021-10-11
  • 페이지 : 416쪽
  • ISBN : 9791162244814
  • 물류코드 :10481

합계 : 28,800

도서판매처

  • 효율의 끝판왕, 머신러닝 파이프라인으로 가장 손쉽게 자동화를 구축하는 방법!

     

    많은 기업이 머신러닝 프로젝트에 수백억씩 투자한다. 안타깝지만 모델을 효과적으로 배포하지 못하면 엄청난 투자가 성과로 이어지기 어렵다. 이 책은 텐서플로 생태계를 사용하여 머신러닝 파이프라인으로 자동화하는 실용적인 방법을 단계별로 안내한다. 배포 시간을 며칠에서 몇 분으로 단축하여 레거시 시스템을 유지하고 관리하는 대신 새로운 모델 개발에 집중할 수 있도록 돕는 기술과 도구를 소개한다.

    데이터 과학자, 머신러닝 엔지니어 및 데브옵스 엔지니어는 모델 개발을 넘어 데이터 과학 프로젝트를 성공적으로 제품화하는 방법을 배울 수 있으며, 관리자는 팀을 지원하는 데 필요한 역할과 업무를 더 잘 이해할 수 있을 것이다.

     

     

  • [저자] 하네스 하프케

    SAP Concur의 Concur Labs 수석 데이터 과학자이다. 머신러닝을 사용하여 비즈니스 여행자의 경험을 개선하는 혁신적인 방법을 연구한다. SAP Concur에 합류하기 전에는 의료, 소매, 채용, 재생 에너지 등 다양한 산업 분야의 머신러닝 인프라 문제를 해결했다. 또한, 자연어 처리와 딥러닝에 관한 출판물을 공동으로 집필했으며 다양한 콘퍼런스에서 딥러닝과 파이썬에 대해 발표했다. 그는 wunderbar.ai의 창시자이기도 하다. 또한 오리건 주립 대학교에서 전기공학 석사 학위를 받았다.

    [저자] 캐서린 넬슨

    SAP Concur의 Concur Labs 수석 데이터 과학자이다. 특히 개인 정보 보호 머신러닝과 기업 데이터에 딥러닝을 적용하는 데 관심이 있다. 이전에는 지구물리학자로서 고대 화산을 연구하고 그린란드에서 석유를 탐사했다. 더럼 대학교에서 지구물리학 박사 학위를 받았고 옥스퍼드 대학교에서 지구과학 석사 학위를 받았다.

    [역자] 송호연

    현재 인공지능 튜터 산타토익을 개발한 뤼이드의 VP of AIOps로 머신러닝 파이프라인 구축을 총괄한다. 네이버에서 AI 연구 엔지니어로 근무했으며, 카카오에서 데이터 엔지니어로 일한 경력이 있다. 국내 최대 인공지능 커뮤니티인 텐서플로 코리아와 머신러닝 옵스 코리아 운영진이다.

  • CHAPTER 1 머신러닝 파이프라인

    1.1 머신러닝 파이프라인의 필요성

    1.2 머신러닝 파이프라인을 고려해야 할 시기

    1.3 머신러닝 파이프라인 단계

    1.4 파이프라인 오케스트레이션

    1.5 예제 프로젝트

    1.6 요약

     

    CHAPTER 2 TFX - 텐서플로 익스텐디드

    2.1 TFX 소개

    2.2 TFX 설치

    2.3 TFX 컴포넌트 개요

    2.4 ML 메타데이터

    2.5 대화형 파이프라인

    2.6 TFX의 대체 솔루션

    2.7 아파치 빔 소개

    2.8 요약

     

    CHAPTER 3 데이터 수집

    3.1 데이터 수집의 개념

    3.2 데이터 준비

    3.3 수집 전략

    3.4 요약

     

    CHAPTER 4 데이터 검증

    4.1 데이터 검증의 필요성

    4.2 TFDV – 텐서플로 데이터 검증

    4.3 데이터 인식

    4.4 GCP를 사용한 대용량 데이터셋 처리

    4.5 TFDV를 머신러닝 파이프라인에 통합하기

    4.6 요약

     

    CHAPTER 5 데이터 전처리

    5.1 데이터 전처리의 필요성

    5.2 TFT를 사용한 데이터 전처리

    5.3. 요약

     

    CHAPTER 6 모델 학습

    6.1 예제 프로젝트의 모델 정의하기

    6.2 TFX Trainer 컴포넌트

    6.3 대화형 파이프라인에서 텐서보드 사용하기

    6.4 분산 학습 전략

    6.5 모델 튜닝

    6.6 요약

     

    CHAPTER 7 모델 분석 및 검증

    7.1 모델 분석 방법

    7.2 텐서플로 모델 분석

    7.3 공정성을 위한 모델 분석

    7.4 모델 설명 가능성

    7.5 TFX에서의 분석과 검증

    7.6 요약

     

    CHAPTER 8 텐서플로 서빙을 사용한 모델 배포

    8.1 간단한 모델 서버

    8.2 파이썬 기반 API를 사용한 모델 배포의 단점

    8.3 텐서플로 서빙

    8.4 텐서플로 아키텍처 개요

    8.5 텐서플로 서빙용 모델 내보내기

    8.6 모델 서명

    8.7 내보낸 모델 검사하기

    8.8 텐서플로 서빙 설정

    8.9 텐서플로 서버 구성

    8.10 REST 대 gRPC

    8.11 모델 서버에서 예측하기

    8.12 텐서플로 서빙을 사용한 A/B 모델 테스트

    8.13 모델 서버에서 모델 메타데이터 요청

    8.14 추론 요청 배치 처리

    8.15 배치 예측 구성

    8.16 기타 텐서플로 서빙 최적화

    8.17 텐서플로의 대체 서비스

    8.18 클라우드 공급자를 통한 구축

    8.19 TFX 파이프라인을 사용한 모델 배포

    8.20 요약

     

    CHAPTER 9 텐서플로 서비스를 사용한 고급 모델 배포

    9.1 배포 주기 분리

    9.2 배포를 위한 모델 최적화

    9.3 텐서플로 서빙에서 TensorRT 사용하기

    9.4 TFLite

    9.5 텐서플로 서빙 인스턴스 모니터링

    9.6 텐서플로 서빙과 쿠버네티스를 사용한 간편한 확장

    9.7 요약

     

    CHAPTER 10 고급 TFX

    10.1 고급 파이프라인 개념

    10.2 휴먼 인 더 루프

    10.3 사용자 지정 TFX 컴포넌트

    10.4 요약

     

    CHAPTER 11 파이프라인 1부: 아파치 빔 및 아파치 에어플로

    11.1 오케스트레이션 도구 선택

    11.2 대화형 TFX 파이프라인을 프로덕션 파이프라인으로 변환하기

    11.3 빔과 에어플로를 위한 대화형 파이프라인 변환

    11.4 아파치 빔 소개

    11.5 아파치 빔으로 TFX 파이프라인 조정

    11.6. 아파치 에어플로 소개

    11.7 아파치 에어플로를 사용한 TFX 파이프라인 설정

    11.8 요약

     

    CHAPTER 12 파이프라인 2부: 쿠베플로 파이프라인

    12.1 쿠베플로 파이프라인 소개

    12.2 쿠베플로 파이프라인을 사용한 TFX 파이프라인 조정

    12.3 구글 클라우드 AI 플랫폼 기반 파이프라인

    12.4 요약

     

    CHAPTER 13 피드백 루프

    13.1 명시적 피드백과 암묵적 피드백

    13.2 피드백 수집 패턴 설계

    13.3 피드백 루프를 추적하는 방법

    13.4 요약

     

    CHAPTER 14 머신러닝을 위한 데이터 개인정보 보호

    14.1 데이터 개인정보 보호 문제

    14.2 차등 개인정보 보호

    14.3 텐서플로 개인정보 보호 소개

    14.4 연합 학습

    14.5 암호화된 머신러닝

    14.6 기타 데이터 개인정보 보호 방법

    14.7 요약

     

    CHAPTER 15 파이프라인의 미래와 다음 단계

    15.1 모델 실험 관리

    15.2 모델 배포 관리에 관한 생각

    15.3 미래의 파이프라인 능력

    15.4 다른 머신러닝 프레임워크와 함께 사용하는 TFX

    15.5 머신러닝 모델 테스트

    15.6 머신러닝을 위한 CI/CD 시스템

    15.7 머신러닝 엔지니어링 커뮤니티

    15.8 요약

     

    APPENDIX A 머신러닝에 유용한 인프라 소개

    A.1 컨테이너 소개

    A.2 도커 소개

    A.3 쿠버네티스 소개

    A.4 쿠버네티스에 애플리케이션 배포하기

     

    APPENDIX B 구글 클라우드에 쿠버네티스 클러스터 설정하기

    B.1 시작하기 전에 수행해야 할 작업

    B.2 구글 클라우드의 쿠버네티스

    B.3 쿠베플로 파이프라인을 위한 영구 볼륨 설정

     

    APPENDIX C 쿠베플로 파이프라인 조작 팁

    C.1 사용자 지정 TFX 이미지

    C.2 영구 볼륨을 사용한 데이터 교환

    C.3 TFX 명령줄 인터페이스

  • 파이프라인으로 머신러닝 자동화를 구축하는 명확한 가이드!

     

    이 책에서 처음부터 끝까지 단계별로 구체적인 예제 프로젝트를 안내하는 방식이 마음에 들었습니다. 많은 코드 예제와 명확하고 간결한 설명 덕분에, 여러분의 머신러닝 파이프라인을 가동하고 자신의 사용 사례에 맞게 조정하는 데 필요한 개념적 도구를 사용할 수 있을 것입니다. 노트북을 가지고 여러분이 배운 내용을 실제로 사용해보기를 강력히 추천합니다.

    이제 전문적인 머신러닝 파이프라인을 만들 때입니다!

     

     

    대상 독자

     

    기본적인 머신러닝 개념을 이해하고 하나 이상의 머신러닝 프레임워크(예: 파이토치, 텐서플로, 케라스)에 익숙한 독자님께 추천합니다. 이 책의 머신러닝 예시는 텐서플로와 케라스를 기반이지만, 핵심 개념은 어떤 프레임워크에도 적용할 수 있습니다. 

    • 일회성 머신러닝 모델 학습을 넘어 데이터 과학 프로젝트를 성공적으로 출시하고자 하는 데이터 과학자와 머신러닝 엔지니어
    • 프로젝트 관리자, 소프트웨어 개발자, 데브옵스 엔지니어

     

    주요 내용 

    • 머신러닝 파이프라인 구축 단계 이해
    • 텐서플로 익스텐디드(TFX)를 사용한 파이프라인 구축
    • 아파치 빔, 아파치 에어플로, 쿠베플로 파이프라인을 사용한 머신러닝 파이프라인 조정
    • 텐서플로 데이터 검증 및 변환을 사용한 데이터 작업
    • 텐서플로 모델 분석을 사용하여 모델 세부 분석
    • 모델 성능의 공정성과 편향성 조사
    • 모바일 장치용 텐서플로 서빙 또는 텐서플로 라이트(TFLite)로 모델 배포
    • 개인 정보를 보호하는 머신러닝 기술

     

    추천사

     

    이 책은 일반적인 프로덕션 머신러닝 시스템, 특히 TFX에 대한 포괄적인 관점을 알려주는 뛰어난 리소스입니다. 명확하게 설명하며 다양한 예시와 함께 사용 가능한 가장 정확한 정보도 제공합니다.

    로버트 크로, 구글 데이터 과학자

  • 내용이 없습니다.
  • 내용이 없습니다.
닫기

해당 상품을 장바구니에 담았습니다.
장바구니로 이동하시겠습니까?