파이썬 공지사항 크롤링 하기

dope123 2019. 3. 31. 20:26

import requests
from bs4 import BeautifulSoup

# 특정 url에 접속하는 요청(Request) 객체를 생성합니다.
request=requests.get("http://www.dowellcomputer.com/main.jsp")

# 접속한 이후의 웹 사이트 소스코드를 추출합니다.
html=request.text

# HTML 소스코드를 파이썬 객체로 변환합니다.
soup=BeautifulSoup(html, 'html.parser')

# <a> 태그 포함하는 요소를 추출합니다.
links=soup.select('td > a')

# 모든 링크에 하나씩 접근합니다.

for link in links:

#링크가 href 속성을 가지고있다면
if link.has_attr('href'):

#href 속성의 값으로 notice문자열이 포함되어 있다면
if link.get('href').find('notice') !=-1:
print(link.text)

불러오는 중입니다...