소품집

[python] bs4 패키지를 이용해 네이버 날씨 crawling 연습해보기 본문

Web crawling

[python] bs4 패키지를 이용해 네이버 날씨 crawling 연습해보기

sodayeong 2021. 4. 5. 16:00
728x90

 

 

# 웹 크롤링 프로젝트
# https://sodayeong.tistory.com

import datetime
from bs4 import BeautifulSoup
import urllib.request

now = datetime.datetime.now()
nowDate = now.strftime('%Y년 %m월 %d일 %H시 %M분 입니다.')

print("\n       ※ Python Webcrawling Project 1 ※ \n ")
print('   환영합니다, ' + nowDate)
print('      오늘의 주요 정보를 요약해 드리겠습니다.\n')

# 오늘의 날씨
print(' >> # 오늘의 #날씨 #요약 \n')

# page1. in seoul
webpage = urllib.request.urlopen('https://search.naver.com/search.naver?sm=top_hty&fbm=0&ie=utf8&query=%EC%84%9C%EC%9A%B8%EB%82%A0%EC%94%A8')

soup = BeautifulSoup(webpage, 'html.parser')
temps = soup.find('span',"todaytemp")
cast = soup.find('p',"cast_txt")
print('--> 서울 날씨 : ' , temps.get_text() , '℃' , cast.get_text())

# page2. in gongju
webpage = urllib.request.urlopen('https://search.naver.com/search.naver?sm=tab_hty.top&where=nexearch&query=%EA%B3%B5%EC%A3%BC+%EB%82%A0%EC%94%A8+&oquery=%EC%84%9C%EC%9A%B8%EB%82%A0%EC%94%A8&tqi=hbqVJsp0J1ZsslfrR8ossssss4K-373030')

soup = BeautifulSoup(webpage, 'html.parser')
temps = soup.find('span', 'todaytemp')
cast = soup.find('p', 'cast_txt')
print('--> 공주 날씨 : ' , temps.get_text() , '℃' , cast.get_text())

R이랑 크롤링하는 게 비슷해서 쉽게 이해할 수 있었다.

html 구조만 다시 공부하면 수월할 것 같다. 

 

동적 웹 페이지 크롤링해서 데이터 베이스로 구조화 하는 방법도 공부하려고 해본다. 

 

 

 

 

 

 

 

Python) 파이썬 BeautifulSoup4를 이용해 웹 크롤링 예제 만들어 보기

저번 포스팅에서는 이미지 크롤링 프로그램을 만들어 보았다. Python) 파이썬을 이용한 이미지 크롤링 프로그램 만들기 어쩌다보니 티스토리 블로그를 이용한 첫 번째 포스팅이 파이썬 코딩 관련

h-glacier.tistory.com

위의 포스팅을 보고 연습해보았습니다. 

728x90
Comments