한빛출판네트워크

기획연재

[파이썬으로 웹 크롤러 만들기] 고급 HTML 분석(3/4)

한빛미디어

|

2016-12-21

by 한선용

2.2.2 기타 BeautifulSoup 객체

이 책에서는 지금까지 BeautifulSoup 라이브러리의 두 가지 객체를 설명했습니다.

 

| BeautifulSoup 객체 |

이전 코드 예제에서는 bsObj와 같은 형태로 사용했습니다.

 

| Tag 객체 |

리스트 호출 또는 BeautifulSoup 객체에 findfindAll을 호출해서 또는 다음과 같이 탐색해 들어가서 얻습니다.

 

bsObj.div.h1

 

하지만 두 가지 객체가 더 있습니다. 널리 쓰이지는 않지만 알아둘 가치는 있습니다.

 

| NavigableString 객체 |

태그 자체가 아니라 태그 안에 들어 있는 텍스트를 나타냅니다. 일부 함수는 NavigableStringsStrings를 다루거나 반환합니다.

 

| Comment 객체 |

주석 태그 안에 들어 있는 HTML 주석(<!-- like this one -->)을 찾는 데 사용합니다.

 

이 책을 쓰는 시점에서 BeautifulSoup 라이브러리에는 이 네 가지 객체가 전부입니다.

 

 

댓글 입력