이지훈님의 블로그
Python 종목코드 가져오기 다음 금융의 코스피 시가총액 페이지에 있는 종목과 코드를 긁어온다. sudo pip3 install urllib3 sudo pip3 install beautifulsoup4 Code urllib로 html문서를 가져왔고, beautifulsoup을 사용해 필요한 데이터를 찾았다. 종목코드와 종목이름을 list에 넣어 파일로 저장한다. numpy의 savatxt를 사용하려고 했지만 atom에서 자꾸 인코딩 에러가 나서 codecs를 사용해 저장했다. #-*- coding: utf-8 -*- from bs4 import BeautifulSoup import numpy as np import urllib.request import sys import io import os imp..
Python 주가데이터 가져오기 yahoo finance가 historical data를 제공해주지 않아 URL을 사용해 csv파일을 받는 방법이나, 파이썬의 yahoo_finacne 패키지로 데이터를 가져오는 방법 등을 더 이상 사용할 수가 없게 되었다. 열심히 구글링을 하는 중 fix_yahoo_finance 패키지를 발견했다. fix_yahoo_finance : https://github.com/ranaroussi/fix-yahoo-finance Requirements Python >=3.4 Pandas (tested to work with >=0.18.1) Numpy >= 1.11.1 requests >= 2.14.2 multitasking >= 0.0.3 Install pip3 install f..
Linear Regression1. 개요통계학에서, 선형 회귀는 종속 변수 y와 한 개 이상의 독립변수 X와의 선형 상관관계를 모델링하는 회귀분석 기법 - 위키피디아 X = [1, 2, 3, 4, 5]Y = [1, 2, 3, 4, 5] Y = aX + b로 가정, 이것을 hypothesis라고 한다.위처럼 X와 Y의 값을 가질 때, 사람은 Y = X 관계이며 만약 X가 6일때 Y가 6의 값을 가지는 것도 알 수 있음. 하지만 컴퓨터는 Y = X의 관계를 바로 찾을 수 없음. 즉 컴퓨터로 학습을 통해 독립변수 X가 들어왔을 때, Y가 어떤 값을 가질수 있는지 구하는 가장 간단한 방법이 선형회귀임. 2. 방법0) 데이터총 4개의 데이터가 있고 각각 (x, y) 2차원 좌표로 이루어짐. 우리의..