华为digix算法大赛2020机器学习赛道-ctr预估初赛/决赛rank1
队名:忑廊埔大战拗芭码(决赛更名为风犹惊入萧独夜)
分数:初赛A榜0.820305/B榜0.822074,决赛A榜0.822590/B榜0.814384
排名:初赛A榜rank1/B榜rank1,决赛A榜rank2/B榜rank1
项目的blog分享链接
南京之旅圆满结束,首冠到手,感谢队友!
补:初赛搜索相关性开源链接
Python 3.8
lightgbm
gensim
sklearn
pandas
numpy
tqdm
networkx
在ctr下创建data文件夹,并将训练集、测试集A、测试集B的csv文件放在ctr/data/
运行reduce/reduce.py进行数据压缩
运行full.py进行全特征模型的训练和推理,决赛B榜分数813
运行win.py进行滑窗模型的训练和推理,决赛B榜分数811
运行nounique.py进行部分特征模型的训练和推理,决赛B榜分数811
运行result/fusion.py得到三个模型结果的融合,决赛B榜分数814
result文件夹中可得到最终结果文件submission_f.csv