논문 링크 : https://arxiv.org/pdf/1903.12258.pdf
github 링크 : https://github.com/rosdyana/Going-Deeper-with-Convolutional-Neural-Network-for-Stock-Market-Prediction
- Taiwan 50 종목에 대한 차트 이미지 생성 및 레이블링
- Image features : OHLC, Volume
- Image size : 50x50
- Labeling(binary) : 상승 시 1, 하락 시 0으로 레이블링
- Tradind period : 20 days
- Forecasting interval : + 1 day
- Train 기간 : 2000.01.01 ~ 2016.12.31 (총 190,433개의 이미지)
- Label 0 : 105,374개의 이미지
- Label 1 : 85,059개의 이미지
- Test 기간 : 2017.01.01 ~ 2018.06.14 (총 15,788개의 이미지)
- Label 0 : 8,826개의 이미지
- Label 1 : 6,962개의 이미지
사용 모델 : VGG16, DeepCNN(15 Layers), ResNet50, Pretrained VGG16, Pretrained ResNet50
- Pretrained 모델의 경우 ImageNet으로 학습된 모델 사용
Taiwan50을 이용하여 DeepCNN, VGG16, ResNet50 세 가지 모델에 대하여 실험을 진행하였고, 동일 조건의 모든 결과에서 VGG16이 가장 좋은 성능을 보였음.
0/1 Class 간 Unbalance -> Random + Balance (0/1)
=> Label class 간 imbalance 문제 해결
1 거래일 후 -> 5 거래일 후
=> Transaction 수를 줄임으로써 수수료 절감으로 수익률 향상
50 x 50 -> 224 x 224
=> Pretrained CNN 모델의 input size와 동일하게 했을 때 좋은 성능 보임
상승 4% 이상 '1' 나머지 '0' -> 상승 4% 이상 '1' 0% 미만 '0'(상승 0~4%는 무시)
=> 명확한 상승 구간의 데이터를 학습하여, Buy 에 대한 변별력 향상
Batch size, Dropout -> 모델마다 dropout, batch size 변경하며 학습
=> Bacth size, Dropout 이 가장 큰 영향을 끼침
Accuracy, Precision, Recall, F1 score 값에 집중 -> Profit에 집중
=> 매수 예측 성공 여부를 수익률 기준으로 변경





