有人可以建议我从机器学习的数据集中选择更好的功能的方法吗?

我是机器学习的新手,我一直在练习很少的数据集,并使用相关值为数据集选择了特征,但令人惊讶的是,当我尝试各种组合以提高模型精度时观察到的是,相关值较小的特征提高了准确性(例如:0.7的相关功能优于0.85)。 因此,有人可以建议我从回归分析和分类问题中选择更好的特征的其他方法吗?

评论
单于语海
单于语海

(如果我正确理解您的问题...)

似乎您正在选择彼此相关的功能。实际上,这是选择功能的非常不好的方法。假设您有两个最大相关的功能。这基本上意味着知道其中一个功能的价值也会告诉您另一个功能的价值。这继而意味着第二个功能基本上是无用的。

相反,您应该使用与目标值相关的特征,但是,最好彼此之间不相关。

点赞
评论