- 赛题类型:结构化数据挖掘、金融风控
https://www.datafountain.cn/competitions/530
本赛题要求利用已有的与目标客群稍有差异的另一批信贷数据,辅助目标业务风控模型的创建,两者数据集之间存在大量相同的字段和极少的共同用户。此处希望大家可以利用迁移学习捕捉不同业务中用户基本信息与违约行为之间的关联,帮助实现对新业务的用户违约预测。
- baseline1:阿水0.86单表思路
- baseline2:恒哥0.87多表思路
- 赛题类型:NLP、情感分类
https://www.datafountain.cn/competitions/518
本赛题提供一部分电影剧本作为训练集,训练集数据已由人工进行标注,参赛队伍需要对剧本场景中每句对白和动作描述中涉及到的每个角色的情感从多个维度进行分析和识别。该任务的主要难点和挑战包括:1)剧本的行文风格和通常的新闻类语料差别较大,更加口语化;2)剧本中角色情感不仅仅取决于当前的文本,对前文语义可能有深度依赖。
- basline1:恒哥 Bert 0.682
- basline2:强哥 Bert多任务 0.67
- 赛题类型:结构化数据挖掘
https://www.datafountain.cn/competitions/520
利用机器学习、深度学习,UEBA等人工智能方法,基于无标签的用户日常上网日志数据,构建用户上网行为基线和上网行为评价模型,依据上网行为与基线的距离确定偏离程度。
-
通过用户日常上网数据构建行为基线;
-
采用无监督学习模型,基于用户上网行为特征,构建上网行为评价模型,评价上网行为与基线的偏离程度。
-
baseline:CquptDJ
- 赛题类型:NLP、NER
https://www.datafountain.cn/competitions/529
观点提取旨在从非结构化的评论文本中提取标准化、结构化的信息,如产品名、评论维度、评论观点等。此处希望大家能够通过自然语言处理的语义情感分析技术判断出一段银行产品评论文本的情感倾向,并能进一步通过语义分析和实体识别,标识出评论所讨论的产品名,评价指标和评价关键词。
- baseline:恒哥
- 赛题类型:计算机视觉、姿态估计
https://www.datafountain.cn/competitions/519/
基于现实场景的应用需求以及图深度学习模型的发展,本次比赛旨在通过征集各队伍建立的高精度、细粒度、意义明确的动作识别模型,探索基于骨骼点的时空细粒度人体动作识别新方法。本次比赛将基于评价指标Accuracy对各队伍提交结果的评测成绩进行排名,Accuracy得分越高,则认为该模型的动作识别效果越好。
- baseline:飞浆
- 赛题类型:NLP、文本匹配
https://www.datafountain.cn/competitions/516/
问题匹配(Question Matching)任务旨在判断两个自然问句之间的语义是否等价,是自然语言处理领域的一个重要研究方向。问题匹配同时也具有很高的商业价值,在信息检索、智能客服等领域发挥着重要作用。
- baseline:飞浆