한국 주식 시세 데이터를 얻을 수 있는 파이썬 라이브러리 3종 (FinanceDataReader, marcap, PyKrx)
한국 주식 시세 데이터를 얻을 수 있는 파이썬 라이브러리의 종류
주식 시세는 퀀트 투자에 있어 필수적인 기초 데이터입니다. Yahoo Finance가 전세계 주식에 대해 시세 데이터를 제공하지만, 한국 주식에 한해서는 신뢰할 수 있을 만큼 정확하지 않습니다.
Yahoo Finance가 왜 한국 주식 데이터 소스로 적절하지 않은지는 국내장 주가정보와 재무정보를 가져올 수 있는 파이썬 라이브러리 (FinanceDataReader, OpenDartReader)를 참고하기 바랍니다.
실용적으로 사용 가능한 한국 주식 시세 데이터를 얻을 수 있는 파이썬 라이브러리로는 FinanceDataReader, marcap, PyKrx가 있습니다. 각기 장단점이 있으니 사용 용도에 적절한 라이브러리를 선택하는 것이 좋습니다.
FinanceDataReader
가장 무난한 선택입니다. 한국 주식 시세는 KRX(한국거래소) 또는 NAVER(네이버)에서 가져오며, YAHOO(Yahoo Finance)를 데이터 소스로 지정할 수도 있습니다.
YAHOO 데이터 소스를 사용할 수 있기에, 미국, 일본 등 다른 나라 주식 시장의 종목에 대해서도 접근이 가능합니다.
한국 주식 시세는 배당이 고려된 수정 주가가 제공됩니다. 지수(index)에 대한 데이터도 얻을 수 있습니다.
기초적인 사용법은 라이브러리 페이지(GitHub)에 설명되어 있습니다.
구체적인 사용법으로는 아래 글을 참고하기 바랍니다.
- 주가 데이터 가져오기 (FinanceDataReader)
- 주가 데이터를 가져와서 그래프로 그려보는 예제입니다.
- 상장사 비율 통계 (섹터, 결산월, 지역)
- 코스피 또는 코스닥 상장 회사의 섹터, 지역 등의 분포를 원 그래프로 그려보는 예제입니다.
- 주가 수익률은 어떤 분포일까? (지수)
- 지수의 일일 수익률을 히스토그램으로 그려보는 예제입니다.
marcap
marcap은 거래된 모든 종목의 일별 주가 데이터를 담고 있는 데이터셋입니다. 1995년도 데이터부터 제공되며, 일반적으로 거래일 다음날 아침 6시에 업데이트 됩니다.
데이터 용량이 상당하므로 git 명령으로 로컬 머신에 다운로드 받아 사용하는 방식입니다.
상장 폐지된 종목을 포함하여 해당 기간 동안 거래되었던 모든 종목의 일일 데이터를 손쉽게 얻을 수 있지만, 아쉽게도 이 데이터셋은 비수정 주가로만 (즉 당시 거래되었던 가격으로) 제공합니다.
기초적인 사용법은 라이브러리 페이지(GitHub)에 설명되어 있습니다.
구체적인 사용법으로는 아래 글을 참고하기 바랍니다.
- 시가총액 데이터셋(marcap)을 사용해 보자 (파이썬)
- marcap 소개와 간단한 사용 예를 보이고 있습니다.
- 시총과 지수간의 관계 (코스피, 코스닥)
- marcap의 데이터셋을 이용하여 시총과 시장 지수 변화에 차이가 나는 이유를 분석합니다.
- 자회사 신규 상장이 시총과 지수에 어떤 영향을 주었는지 LG에너지솔루션의 예로 분석합니다.
PyKrx
PyKrx는 KRX와 NAVER에서 웹 스크래핑 방식으로 다양한 주식 관련 데이터를 가져오는 라이브러리입니다.
실시간으로 웹 스크래핑 하는 방식이기에 대량의 데이터를 가져오는데는 적절하지 못하지만, 매일 매일 당일 데이터를 가져와서 데이터베이스를 업데이트 하기에는 편리합니다.
기초적인 사용법은 라이브러리 페이지(GitHub)에 설명되어 있습니다.
댓글
댓글 쓰기