본문 바로가기
Programming/Python

[Python] web scraping

웹브라우저 패키지

 

import webbrowser

 

naver_search_url = "주소/?q="

search_word = "검색어"

url = naver_search_url + search_word

 

webrowser.open_new(url)          <- 검색어로 입력한 주소로 창을 열어줌

 

 

 

 

 

여러 url 검색하기

urls = ['주소1', '주소2', '주소3']           <-뒤에 검색어 인자 입력해놔야함

search_words = ['검색어1', '검색어2']

 

for url in urls:

     for search_word in search_words:

          webbrowser.open_new(url + search_word)

 

 

 

html을 python에서 쓰기

 

 

<!doctype html>   <-로 시작

<html>

 

 

</html>

 

 

 

 

import requests  <-웹사이트에 홈페이지 추출하는 패키지

 

 

 

웹스크롤링 관련은

webscraping.ipynb 참조

 

 

 

 

 

요즘은 막힌 사이트가 너무 많아서 활용도도 떨어지고

조작방법도 노가다가 많고

그래서 웹스크롤링에 대한 활용이 떨어짐

긁어내도 허위정보 긁을 수도 있고

 

 

 

 

728x90
반응형