728x90
웹 페이지에서 테이블 데이터를 크롤링 하는 방법을 알아보겠습니다.
먼저 예시 웹 사이트로 위키피디아에 [List of countries by stock market capitalization]을 검색해줍니다. (링크)
이 웹사이트에 있는 테이블 데이터를 크롤링 해보겠습니다.
#테이블 데이터를 다룰 때는 pandas를 사용해준다.
import pandas as pd
url = 'https://en.wikipedia.org/wiki/List_of_countries_by_stock_market_capitalization'
tbl = pd.read_html(url)
print(tbl)
이처럼 테이블 데이터는 기존의 크롤링 방식과 달리 매우 간단하게 pandas를 크롤링 할 수 있습니다.
'파이썬으로 퀀트 프로그램 만들기 project > 웹 크롤링' 카테고리의 다른 글
동적 크롤링 - 셀레니움 (0) | 2023.09.05 |
---|---|
웹 크롤링 실습_6 - POST (0) | 2023.09.04 |
웹 크롤링 실습_4 - 금융 속보 제목 추출하기 (0) | 2023.09.04 |
웹 크롤링 실습_3 (0) | 2023.09.04 |
웹 크롤링 실습_2 - find_all(), select() (0) | 2023.09.04 |