본문 바로가기

파이썬으로 퀀트 프로그램 만들기 project/웹 크롤링

웹 크롤링 실습_5 - 테이블 데이터 크롤링 하기(pandas)

728x90

웹 페이지에서 테이블 데이터를 크롤링 하는 방법을 알아보겠습니다.

먼저 예시 웹 사이트로 위키피디아에 [List of countries by stock market capitalization]을 검색해줍니다. (링크)

이 웹사이트에 있는 테이블 데이터를 크롤링 해보겠습니다.

#테이블 데이터를 다룰 때는 pandas를 사용해준다.
import pandas as pd

url = 'https://en.wikipedia.org/wiki/List_of_countries_by_stock_market_capitalization'
tbl = pd.read_html(url)
print(tbl)

이처럼 테이블 데이터는 기존의 크롤링 방식과 달리 매우 간단하게 pandas를 크롤링 할 수 있습니다.