Skip to content

HaoningChen/Houfang-Cup

Repository files navigation

首届厚方杯二等奖方案(重制版)

目录:

数据分析和特征工程: data_insight, 因子为alpha360, 即原始数据滞后项除掉单位
模型: lightGBM; hybrid
(说明: hybrid的weight=[0, 1]时, 相当于xgboost模型; weight=[1, 0]时, 相当于线性回归模型)
NN Models: 使用神经网络进行因子挖掘, 但实际效果还是没有lgbm和hybrid好
经典版(技术因子): 使用145个技术因子 + 6个利率因子, 145个因子中有79个来自qlib的alpha158.
策略: strategy

ps:

数据和数据说明
工具包: scutquant(v0.3.3及以上); qlib(v0.8.4及以上)
如要复现, 请下载数据后依次运行data_insight, lightGBM, hybridstrategy

一个很奇怪的结论:
data_insight中的i8因子表达式改成 $$\frac{high + low}{2 \cdot R_f \cdot close}$$ 时, i8的因子质量会大幅提升, 且模型的IC也有所提升, 但使用相同的策略回测会降低$\alpha$