파이썬 공부(뷰티풀 수프 기초)

파이썬 공부(뷰티풀 수프 기초)

Summary:

본 포스팅은 서진수님의 <왕초보! 파이썬 배워 크롤러 DIY 하다!>를 통해 공부한 내용을 정리하기 위해 작성했습니다. 오늘은 Day8 뷰티풀 수프 입니다.


Overview


Beautiful Soup 기초

find( )와 find_all( )

from bs4 import BeautifulSoup
bs=BeautifulSoup(html, "html.parser")
bs.find("title")
bs.find("p", align="left")
bs.find("p", class_="text")

bs.find_all("p")
bs.find_all("p", limit=2)
bs.find_all(text="text contents 1")
bs.find_all(text=re.compile("text +"))

string과 strings

body_tag = bs.find("body")
p_tag = body_tag.find_all("p")

string = body_tag.find("p")

strings = p_tag.strings
for strings_comp in strings :
  print(string_comp)

get_text

body_tag.get_text()
body_tag.get_text(strip=True)
body_tag.get_text(',', strip=True)

find_parent와 find_parents

p_tag.find_parent("body")
parents = p_tab.find_parents()
for parent in parents:
  print (parent.name)

Hyeyeon

A Blog about E-Commerce and Product Management

comments powered by Disqus

    rss facebook twitter github youtube mail spotify instagram linkedin google google-plus pinterest medium vimeo stackoverflow reddit quora