본문 바로가기

파이썬으로 퀀트 프로그램 만들기 project/웹 크롤링

웹 크롤링 실습_4 - 금융 속보 제목 추출하기

728x90

금융 속보 제목을 추출해보겠습니다. 네이버 증권 사이트 -> 뉴스 -> 실시간 속보로 가주세요. (링크)

해당 페이지에서 제목에 해당하는 부분을 알아내기 위해 개발자도구를 열어줍니다.

제목에 해당하는 부분에 우클릭 -> 검사 클릭 해줍니다.

이미지_1

여기서 제목 부분은 dl태그 -> dd 태그, class = articleSubject - > a 태그 -> title 속성의 속성값

 

import requests as rq
from bs4 import BeautifulSoup

url = 'https://finance.naver.com/news/news_list.naver?mode=LSS2D&section_id=101&section_id2=258'
data = rq.get(url)
html = BeautifulSoup(data.content, 'html.parser')

html_select = html.select('dl > dd.articleSubject > a')
html_titles = [i['title'] for i in html_select]
print(html_titles)