IT 개발 프로그래밍/파이썬
파이썬 공지사항 크롤링 하기
dope123
2019. 3. 31. 20:26
import requests
from bs4 import BeautifulSoup
# 특정 url에 접속하는 요청(Request) 객체를 생성합니다.
request=requests.get("http://www.dowellcomputer.com/main.jsp")
# 접속한 이후의 웹 사이트 소스코드를 추출합니다.
html=request.text
# HTML 소스코드를 파이썬 객체로 변환합니다.
soup=BeautifulSoup(html, 'html.parser')
# <a> 태그 포함하는 요소를 추출합니다.
links=soup.select('td > a')
# 모든 링크에 하나씩 접근합니다.
for link in links:
#링크가 href 속성을 가지고있다면
if link.has_attr('href'):
#href 속성의 값으로 notice문자열이 포함되어 있다면
if link.get('href').find('notice') !=-1:
print(link.text)