728x90
금융 속보 제목을 추출해보겠습니다. 네이버 증권 사이트 -> 뉴스 -> 실시간 속보로 가주세요. (링크)
해당 페이지에서 제목에 해당하는 부분을 알아내기 위해 개발자도구를 열어줍니다.
제목에 해당하는 부분에 우클릭 -> 검사 클릭 해줍니다.
여기서 제목 부분은 dl태그 -> dd 태그, class = articleSubject - > a 태그 -> title 속성의 속성값
import requests as rq
from bs4 import BeautifulSoup
url = 'https://finance.naver.com/news/news_list.naver?mode=LSS2D§ion_id=101§ion_id2=258'
data = rq.get(url)
html = BeautifulSoup(data.content, 'html.parser')
html_select = html.select('dl > dd.articleSubject > a')
html_titles = [i['title'] for i in html_select]
print(html_titles)
'파이썬으로 퀀트 프로그램 만들기 project > 웹 크롤링' 카테고리의 다른 글
웹 크롤링 실습_6 - POST (0) | 2023.09.04 |
---|---|
웹 크롤링 실습_5 - 테이블 데이터 크롤링 하기(pandas) (0) | 2023.09.04 |
웹 크롤링 실습_3 (0) | 2023.09.04 |
웹 크롤링 실습_2 - find_all(), select() (0) | 2023.09.04 |
UnicodeEncodeError: 'cp949' codec can't encode character 해결 (0) | 2023.09.04 |