随机森林 KNN
朴素贝叶斯
决策树 SVM GDBT
Adaboost
...
线性回归
逻辑回归
Kmeans DBSCAN
层次聚类
关联规则 序列规则
...
标签传播
解决机器学习问题都是从建模开始。首先需要收集问题的资料,深入理解问题,然后将问题抽象成机器可预测的问题。
在这个过程中要明确业务指标和模型预测目标,根据预测目标选择适当的评估指标用于模型评估。接着从原始数据中选择
最相关的样本子集用于模型训练,并对样本子集划分训练集和测试集,应用交叉验证的方法对模型进行选择和评估。
完成问题建模,对数据进行筛选和清洗之后的步骤,就是对数据抽取特征,即特征工程。此时就要对模型的算法有深入的理解。
特征工程的目的是为了将特征输入给模型,让模型从数据中学习规律。但模型有很多,不同的模型差别很大,使用场景不同,
能够处理的特征也会不同。