분류 전체보기
-
머신 러닝으로 금 시세를 예측 해보자 - 모델 평가&활용모델 평가 2020. 4. 27. 14:16
1. 모델 검증 방법 2. 모델 검증 & 개선 3. 모델 활용 시뮬레이션 & 개선 과거의 포스팅에서 ARIMA, Prophet, LSTM의 간단한 설명과 모델 구축의 기본에 대해서 알아봤다. 본 포스팅에서는 모델의 평가와 활용법에 대해 알아보도록 하겠다. 결론부터 말하면, LSTM 모델을 사용하여 2015년 10월부터 현재까지(2020년 4월 23일) 금을 투자하였다면, 221%의 수익률(2015년부터 안 팔고 보유했을 경우의 수익률 153%)을 올렸을 것으로 나타난다. 1. 모델 검증 방법 먼저 모델의 검증 방법으로는 one-step forecast방법을 사용하였다. 시계열 데이터는 일반적 cross validation 방법으로는 검증이 불가능하다. 이는 일반적인 데이터와 다르게 시계열 데이터에는 순서..
-
머신 러닝으로 금 시세를 예측해 보자 feat. LSTM모델 구축 2020. 4. 13. 14:44
1. LSTM에 대한 간략한 설명 2. 데이터 전처리 3. 모델 구축 4. 모델 평가 1. LSTM에 대한 간략한 설명 LSTM은 뉴럴 네트워크의 한 종류로 기존의 음성, 글 등과 같이 순차적인 데이터(Sequence)를 다루기 위한 RNN 알고리즘을 바탕으로 하고 있다. 하지만 RNN는 Sequence의 길이가 길어지면, 다소 떨어진 데이터의 정보가 사라진다는 단점이 있다. 이를 보완하기 위해 나온 알고리즘이 LSTM이다. 딥러닝을 기반으로 하고 있어 앞서 설명한 ARIMA나 prophet 보다 복잡한 패턴을 찾아내는 것이 가능하다. 자세한 설명은 훌룡한 설명을 하고 있는 많은 사이트들이 있기 때문에 그 링크를 남긴다. https://brunch.co.kr/@chris-song/9 LSTM(RNN) 소..
-
머신 러닝으로 금 시세를 예측 해보자 feat. Prophet모델 구축 2020. 4. 1. 10:56
1. Prophet에 대한 간단한 설명 2. Prophet 모델 구축 3. Prophet 파라미터 조정 1. Prophet에 대한 간단한 설명 Prophet은 Facebook에서 만든 시계열 예측 package이다. 장점은 간단하고, 성능이 좋다는 점이다! ARIMA와 같이 데이터의 정상성을 확보할 필요도 없으며, 파라미터가 직관적이라 튜닝이 편리하다. 또한 자동으로 변경 포인트를 찾아 fitting을 하기 때문에 주기가 일정하지 않은 데이터에 대해서도 예측이 가능하다. https://facebook.github.io/prophet/ Prophet Prophet is a forecasting procedure implemented in R and Python. It is fast and provides ..
-
머신 러닝으로 금 시세를 예측 해보자 feat. ARIMA모델 구축 2020. 3. 31. 10:34
0 - 1. 시계열 데이터란 무엇인가? 0 -2. Time series model 이란 무엇인가? 1. ARIMA에 대한 간단한 설명 2. 금 값 데이터의 분석 3. ARIMA모델의 구축 4. 모델의 평가 5. 모델의 활용 0-1. 시계열 데이터란 무엇인가? 시계열 데이터는 일정한 시간 간격으로 출력된 데이터이다. 우리가 돈을 벌기 위해 관심을 가지는 주식, 유가, 채권 금리, 집 값 등 모든 것이 시계열 데이터이다. 시계열 데이터는 추세-주기, 계절성, 잔차의 합 혹은 곱으로 볼 수가 있다. 추세(trend)는 장기적으로 증가 혹은 감소를 설명하는 부분이며, 계절성(seasonality)은 특정 기간(일별, 분기별, 10년 별 등) 마다 나타나는 패턴을 설명하는 부분이다. 주기(cycle)는 계절성과 ..
-
Python과 네이버 API로 뉴스 데이터를 수집 해 보자!데이터 수집 2020. 3. 18. 12:06
"개가 사람을 물면 뉴스가 안되지만, 사람이 개를 물면 뉴스가 된다" 뉴스란 현재에 대한 보고서들의 모임이다. 현재의 수많은 일 중에서 다소 특이한 일들 혹은 주목해야 할 일들이 주로 뉴스가 된다. 정확도 여부를 떠나서 우리는 뉴스를 보고 미래를 추론할 수 있을 것이다. 데이터 분석 분야에서도 뉴스 데이터를 주식 분석, 집값 예측 등 많은 분야에서 활용하고 있다. 기본적으로 이러한 뉴스를 수집하기 위해서는 크롤링을 이용하여 수 많은 HTTP에 접속하여 필요한 부분을 데이터화 하는 것이 일반적이나 각 신문사마다 포맷이 다르며 신문사의 사이트 포맷이 바뀌면 코드를 변경해야 하는 단점이 있어 오늘은 네이버에서 제공하는 API와 Python을 이용하여 네이버 뉴스를 수집하고 결과를 엑셀 파일로 저장하는 방법을 ..