웹 크롤링 실습_4 - 금융 속보 제목 추출하기

728x90

금융 속보 제목을 추출해보겠습니다. 네이버 증권 사이트 -> 뉴스 -> 실시간 속보로 가주세요. (링크)

해당 페이지에서 제목에 해당하는 부분을 알아내기 위해 개발자도구를 열어줍니다.

제목에 해당하는 부분에 우클릭 -> 검사 클릭 해줍니다.

여기서 제목 부분은 dl태그 -> dd 태그, class = articleSubject - > a 태그 -> title 속성의 속성값

import requests as rq
from bs4 import BeautifulSoup

url = 'https://finance.naver.com/news/news_list.naver?mode=LSS2D&section_id=101&section_id2=258'
data = rq.get(url)
html = BeautifulSoup(data.content, 'html.parser')

html_select = html.select('dl > dd.articleSubject > a')
html_titles = [i['title'] for i in html_select]
print(html_titles)

저작자표시 (새창열림)

'파이썬으로 퀀트 프로그램 만들기 project > 웹 크롤링' 카테고리의 다른 글

웹 크롤링 실습_6 - POST (0)	2023.09.04
웹 크롤링 실습_5 - 테이블 데이터 크롤링 하기(pandas) (0)	2023.09.04
웹 크롤링 실습_3 (0)	2023.09.04
웹 크롤링 실습_2 - find_all(), select() (0)	2023.09.04
UnicodeEncodeError: 'cp949' codec can't encode character 해결 (0)	2023.09.04

Park's WorkSpace

웹 크롤링 실습_4 - 금융 속보 제목 추출하기

'파이썬으로 퀀트 프로그램 만들기 project > 웹 크롤링' 카테고리의 다른 글

티스토리툴바

웹 크롤링 실습_4 - 금융 속보 제목 추출하기

'파이썬으로 퀀트 프로그램 만들기 project > 웹 크롤링' 카테고리의 다른 글

관련글

티스토리툴바