한국 주식 시세 데이터를 얻을 수 있는 파이썬 라이브러리 3종 (FinanceDataReader, marcap, PyKrx)

한국 주식 시세 데이터를 얻을 수 있는 파이썬 라이브러리의 종류

주식 시세는 퀀트 투자에 있어 필수적인 기초 데이터입니다. Yahoo Finance가 전세계 주식에 대해 시세 데이터를 제공하지만, 한국 주식에 한해서는 신뢰할 수 있을 만큼 정확하지 않습니다.

Yahoo Finance가 왜 한국 주식 데이터 소스로 적절하지 않은지는 국내장 주가정보와 재무정보를 가져올 수 있는 파이썬 라이브러리 (FinanceDataReader, OpenDartReader)를 참고하기 바랍니다.

실용적으로 사용 가능한 한국 주식 시세 데이터를 얻을 수 있는 파이썬 라이브러리로는 FinanceDataReader, marcap, PyKrx가 있습니다. 각기 장단점이 있으니 사용 용도에 적절한 라이브러리를 선택하는 것이 좋습니다.

FinanceDataReader

가장 무난한 선택입니다. 한국 주식 시세는 KRX(한국거래소) 또는 NAVER(네이버)에서 가져오며, YAHOO(Yahoo Finance)를 데이터 소스로 지정할 수도 있습니다.

YAHOO 데이터 소스를 사용할 수 있기에, 미국, 일본 등 다른 나라 주식 시장의 종목에 대해서도 접근이 가능합니다.

한국 주식 시세는 배당이 고려된 수정 주가가 제공됩니다. 지수(index)에 대한 데이터도 얻을 수 있습니다.

기초적인 사용법은 라이브러리 페이지(GitHub)에 설명되어 있습니다.

구체적인 사용법으로는 아래 글을 참고하기 바랍니다.

marcap

marcap은 거래된 모든 종목의 일별 주가 데이터를 담고 있는 데이터셋입니다. 1995년도 데이터부터 제공되며, 일반적으로 거래일 다음날 아침 6시에 업데이트 됩니다.

데이터 용량이 상당하므로 git 명령으로 로컬 머신에 다운로드 받아 사용하는 방식입니다.

상장 폐지된 종목을 포함하여 해당 기간 동안 거래되었던 모든 종목의 일일 데이터를 손쉽게 얻을 수 있지만, 아쉽게도 이 데이터셋은 비수정 주가로만 (즉 당시 거래되었던 가격으로) 제공합니다.

기초적인 사용법은 라이브러리 페이지(GitHub)에 설명되어 있습니다.

구체적인 사용법으로는 아래 글을 참고하기 바랍니다.

PyKrx

PyKrx는 KRX와 NAVER에서 웹 스크래핑 방식으로 다양한 주식 관련 데이터를 가져오는 라이브러리입니다.

실시간으로 웹 스크래핑 하는 방식이기에 대량의 데이터를 가져오는데는 적절하지 못하지만, 매일 매일 당일 데이터를 가져와서 데이터베이스를 업데이트 하기에는 편리합니다.

기초적인 사용법은 라이브러리 페이지(GitHub)에 설명되어 있습니다.

구체적인 사용법으로는 아래 글을 참고하기 바랍니다.


댓글

이 블로그의 인기 게시물

주가는 기업 이익(EPS)에 어느 정도 선행하는가? (개별 기업의 사례)

레버리지, 인버스 주요 종목 수익률과 비용

GitHub(깃허브) 블로그에 애드센스 수동 광고 넣기