나에게 필요한 지식과 기술을 검색해 보세요.

대표이미지

머신러닝: 컴퓨터 비전과 생성형 AI로 구현하는 이미지 인식·객체 탐지

Machine Learning – Modern Computer Vision & Generative AI

강사

게으른 프로그래머

강의

38강

시간

6h 06m

수강기간

6개월

레벨

중급

정가

110,000

총 결제 금액

110,000

적립 예정

3,300P

평생교육이용권 사용안내

이 강의는 평생교육바우처로 결제할 수 있습니다.

KerasCV로 완성하는 모던 컴퓨터 비전의 모든 것: 기초 이미지 분류부터 나만의 데이터셋을 활용한 객체 탐지, 그리고 Stable Diffusion 생성형 AI까지 한 번에 마스터하세요


KerasCV · Object Detection · Stable Diffusion

머신러닝: 컴퓨터 비전과 
생성형 AI로 구현하는 이미지 인식·객체 탐지

6시간 만에 전이학습 기반 분류 → 커스텀 객체 탐지 파인튜닝 → 스테이블 디퓨전까지 실제 구현 흐름으로 연결하는 실전 강의입니다.

한 눈에 강의 보기

 

핵심 가치
복잡한 수식 없이 KerasCV로 최신 비전 파이프라인 구축
결과물
커스텀 데이터 기반 객체 탐지 모델 + AI 이미지 생성기
학습 방식
개념 최소화, 실습 중심으로 빠르게 완성
핵심 역량
1
KerasCV 기반 분류 & 객체 탐지 구현 역량
 
2
스테이블 디퓨전 기반 생성형 AI 이해 및 실행 역량
총 러닝타임
총 6시간 내외 핵심 압축
구성
8개 섹션 · 38개 강의

AI 비전/생성형 AI, 이런 고민이 있으신가요?

😰 예제 데이터로 이미지 분류는 해봤는데 막상 실제 데이터로 객체 탐지하려니 막막해요
😞 S스테이블 디퓨전을 배우고 싶은데 구현까지 이어지는 강의가 드물어요
😓 TensorFlow/PyTorch/JAX… 프레임워크가 너무 많아 뭘 선택해야 할지 모르겠어요
😔 작동하지 않는 예전 코드가 아니라 현업에서 사용 가능한 최신 코드를 보고 싶어요

이런 분들을 위해 만들었습니다

AI 개발자 지망생
최신 라이브러리로 포트폴리오를 만들고 싶은 사람
현업 엔지니어
커스텀 데이터셋 구축/파인튜닝을 실무에 적용하고 싶은 사람
크리에이티브 아티스트
스테이블 디퓨전의 원리를 이해하고 실제 결과물을 보고 싶은 사람

이 강의를 듣고 나면 무엇이 달라지나요?

✅ KerasCV 실전 활용
전이학습/파인튜닝 흐름을 표준화된 API로 빠르게 구현하고, 실무형 학습 루프를 구성할 수 있습니다.
✅ 커스텀 데이터셋 구축
LabelImg로 라벨링부터 데이터 포맷 정리, 학습/검증 분리까지 “현실 데이터 파이프라인” 구축할 수 있습니다.
✅ 생성형 AI 구현
스테이블 디퓨전으로 텍스트 프롬프트 기반 이미지 생성부터, 디퓨전 모델 구조 이해를 바탕으로 실전에서 활용 가능한 역량을 기를 수 있습니다.
완성 포트폴리오 (3개 프로젝트)
1
전이학습 이미지 분류기
내 이미지 데이터로 분류 모델을 학습하고 추론까지 구현
핵심 기능
  • 데이터 증강 파이프라인 구성

  • Freeze/Unfreeze 기반 파인튜닝

  • 평가(지표/혼동행렬) 및 개선

산출물
  • 학습/추론 코드 + 모델 파일

  • 실험 로그/결과 리포트

2
커스텀 객체 탐지 모델
LabelImg로 라벨링한 데이터로 바운딩 박스 탐지 구현
핵심 기능
  • 라벨링 → 데이터셋 구성(Train/Val)

  • IoU/NMS/Confidence 결과 해석

  • 파인튜닝 및 성능 개선

산출물
  • 커스텀 데이터셋 + 학습 코드

  • 탐지 결과 시각화 이미지

3
스테이블 디퓨전 AI 이미지 생성기
프롬프트/시드/스텝으로 결과 재현 가능한 생성 워크플로 구축
핵심 기능
  • 텍스트 프롬프트 기반 생성 실행

  • 시드/가이던스/스텝 튜닝

  • UNet/스케줄러 흐름 이해

산출물
  • 생성 스크립트 + 프롬프트 템플릿

  • 조건별 결과 갤러리

실무 활용 예시
💼 보안/관제: 사람·차량 탐지 후 알림 조건 설정(신뢰도/영역)
💼 제조/품질: 결함 영역 탐지 및 현장 데이터 기반 성능 개선
💼 콘텐츠 제작: 텍스트 프롬프트로 이미지 생성 및 스타일 실험

커리큘럼 로드맵

전체 구성: 8개 섹션 | 38개 강의 | 약 6시간 내외 | 3단계 핵심 프로젝트
STEP 1 · 기초 다지기 및 분류 (섹션 1-2)
  • 섹션 1: Welcome & Setup — 실습 환경/코드 확보, 학습 가이드

  • 섹션 2: 이미지 분류와 전이학습 — Pre-trained 모델 이해, Fine-tuning 흐름

  • 🛠️ 실습 1: 파이썬으로 이미지 분류기 파인튜닝 구현

STEP 2 · 객체 탐지 마스터 (섹션 3)
  • IoU, NMS, Confidence Score 등 탐지 핵심 개념 완성

  • Focal Loss / Smooth L1 Loss 등 학습 손실 함수 이해

  • LabelImg 설치 및 데이터 라벨링 실습

  • 커스텀 데이터셋으로 객체 탐지 모델 파인튜닝

  • 🛠️ 실습 2: 나만의 객체 탐지기 만들기

STEP 3 · 생성형 AI로 도약 (섹션 4)
  • 파이썬으로 스테이블 디퓨전 이미지 생성

  • 확산 모델 아키텍처 및 UNet 구조 분석

  • 심화: 확산 모델 소스 코드 레벨로 이해

STEP 4 · 보충/전략 (섹션 5-8)
  • 초보자용 환경 설정(Anaconda, TensorFlow) 가이드

  • 파이썬 코딩 팁 및 효율적인 실습 전략

  • 학습/추론 파이프라인 정리 및 실무 적용 팁

대표 실습 프로젝트: 커스텀 데이터셋 객체 탐지

무엇을 만드나요?

LabelImg로 직접 수집한 이미지에 라벨을 부여하고, KerasCV로 사전학습된 탐지 모델을 내 데이터에 맞게 파인튜닝하여 실제로 동작하는 객체 탐지기를 완성합니다.

Data Annotation
LabelImg 툴 실습 및 라벨 품질 관리
Model Fine-tuning
사전학습 모델을 내 데이터로 재학습
Evaluation
IoU/Confidence 기반 성능 평가 및 개선
실무 활용도: ⭐⭐⭐⭐⭐
현업 데이터는 ‘깨끗한 예제’가 아니라 노이즈가 존재합니다. 이 프로젝트를 통해 데이터 가공 → 라벨링 → 학습 → 평가까지 전 과정을 경험합니다.

왜 이 강의를 선택해야 할까요?

1. 모던 기술 스택 (KerasCV)
❌ 구식 예제 중심
KerasCV 기반의 모던 워크플로로 빠르게 구현
2. 생성형 AI 포함
❌ 전통 비전에서 종료
스테이블 디퓨전으로 생성형 AI까지 확장
3. 커스텀 데이터 중심
❌ MNIST/CIFAR-10 반복
LabelImg로 직접 만드는 데이터셋 기반 실습
4) 검증된 전문가
✅ 통계학/컴퓨터공학 석사 기반의 개념 정리
✅ 온라인 교육 경험을 바탕으로 실습 흐름 최적화
📦 제공 자료
  • GitHub 소스 코드 전체 제공

  • 추가: 파이썬 기초 및 환경 설정 가이드

자주 묻는 질문 (FAQ)

Q1. 초보자도 들을 수 있나요?
A. 파이썬과 머신러닝 기초(텐서, 학습/검증 개념)가 있다면 수강 가능합니다. 초보자를 위한 환경 설정(Anaconda/TensorFlow)과 코딩 팁을 보너스 섹션으로 제공합니다.
Q2. 완강까지 얼마나 걸리나요?
A. 영상은 약 6시간 내외입니다. 하루 1시간씩 학습하면 1주 내 완강이 가능하며, 실습 프로젝트까지 포함하면 2주 플랜을 추천합니다.
Q3. 완강 후 어느 수준이 되나요?
A. 분류/객체탐지/생성형 AI의 핵심 원리를 이해하고, KerasCV로 커스텀 데이터 기반 애플리케이션을 구현할 수 있는 수준을 목표로 합니다.
Q4. 실습 환경은 어떻게 되나요?
A. 파이썬, 텐서플로우, KerasCV를 사용합니다. 아나콘다를 기준으로 설치/환경 구성을 상세히 안내하며, 무료 도구(LabelImg 등)로 실습 가능합니다.

학습 시 사전 요구 사항

✅ 아래 목록이 준비되어 있나요?
  • 파이썬 기초 문법

  • 머신러닝 기본 개념(학습/검증, 손실 함수, 과적합 등)에 대한 이해

  • 실습 가능한 PC(Anaconda 설치 가능)

❌ 이런 분께는 추천하지 않아요
  • 코딩 없이 이론만 보고 싶은 분 (실습 중심)

  • 파이썬을 전혀 모르는 분 (기초 학습 후 권장)

지금, 모던 컴퓨터 비전과 생성형 AI를 
한 번에 완주하세요

구식 예제에서 벗어나 내 데이터로 학습하는 객체 탐지
스테이블 디퓨전 기반 이미지 생성을 실제로 구현합니다.

✅ 전체 코드 제공 · ✅ 실습 자료 제공 · ✅ 업데이트 반영
“가장 좋은 시작 시점은 어제였고, 두 번째로 좋은 시점은 바로 오늘입니다.”

강사

게으른 프로그래머

게으른 프로그래머

게으른 프로그래며(Lazy Programmer)는 머신러닝·딥러닝 분야에서 10년 이상의 경험을 보유한 온라인 교육자로, 컴퓨터공학과 통계학 석사 학위를 바탕으로 실무 중심의 강의를 제작해 왔습니다. 복잡한 데이터 사이언스와 AI 개념을 쉽게 전달하며, 다양한 소프트웨어·응용 분야를 아우르는 폭넓은 전문성을 갖춘 교육자입니다.

커리큘럼

1-1차시 소개 및 개요

04:25

02

1-2차시 이 강의를 성공적으로 수강하는 방법

03:04

03

1-3차시 코드를 어디서 받을 수 있나요?

01:17

04

2-1차시 분류 섹션 개요

03:37

05

2-2차시 개념: 사전 학습된 이미지 분류기

08:34

06

2-3차시 Python에서의 사전 학습된 이미지 분류기

10:14

07

2-4차시 전이 학습 및 파인튜닝

08:50

08

2-5차시 이미지 분류기 파인튜닝 with 파이썬

20:24

09

2-6차시 분류 연습

01:04

10

2-7차시 강의 관련 피드백 안내

03:10

11

3-1차시 객체 탐지 개요

08:15

12

3-2차시 개념: 객체 탐지

05:31

13

3-3차시 출력 해석: IoU, 비최대 억제, 신뢰도 점수

09:29

14

3-4차시 Python에서의 사전 학습된 객체 탐지

12:24

15

3-5차시 Focal Loss 및 Smooth L1 Loss

08:10

16

3-6차시 객체 탐지 데이터셋 포맷 (COCO & Pascal VOC)

04:39

17

3-7차시 LabelImg 설정

01:48

18

3-8차시 LabelImg 데모

19:27

19

3-9차시 데이터 증강

05:19

20

3-10차시 KerasCV 객체 탐지 데이터셋 포맷

05:38

21

3-11차시 파이썬 객체 탐지 파인튜닝: 내장 데이터셋

22:04

22

3-12차시 파이썬 객체 탐지 파인튜닝: 사용자 정의 데이터셋

19:46

23

3-13차시 객체 탐지 연습

01:47

24

4-1차시 스테이블 디퓨전 개요

04:11

25

4-2차시 스테이블 디퓨전으로 이미지 생성하기

15:57

26

4-3차시 디퓨전 모델은 어떻게 작동하나요? (선택)

09:52

27

4-4차시 디퓨전 모델 아키텍처: Unet

05:48

28

4-5차시 디퓨전 모델의 프롬프트 조건 설정

04:18

29

4-6차시 디퓨전 모델 소스 코드 살펴보기 (선택)

16:00

30

5-1차시 아나콘다 환경 설정

20:21

31

5-2차시 Numpy, Scipy, Matplotlib, Pandas, IPython, Theano, TensorFlow 설치 방법

17:30

32

6-1차시 초보자를 위한 코딩 팁

13:22

33

6-2차시 기초 프로그래밍: 머신러닝 알고리즘

15:55

34

6-3차시 기초 프로그래밍: TDD의 개념 테스트 코드 설계

09:23

35

6-4차시 Jupyter Notebook으로 학습해야 할까요?

12:29

36

7-1차시 머신러닝 학습 로드맵 소개-1

11:19

37

7-2차시 머신러닝 학습 로드맵 소개-2

16:07

38

8-1차시 강의 관련 부가 자료 안내

05:31

수강 후기

첫번째 리뷰어가 되어주세요.

소중한 후기가 다른 분들께 도움이 될 거에요.

110,000

110,000