多类分类:概率和校准

我正在使用不同的分类器处理多类分类问题,并使用Python和scikit-learn。我想使用预测概率,基本上是针对特定情况比较不同分类器的预测概率。

I started reading about 'calibration' (here and here for example) and I became confused.

据我了解:一个经过良好校准的概率意味着该概率还反映了某个类别的分数。

1)这是否意味着如果我有10个平均分布的类,则理想情况下,每个类的校准概率约为0.1?

2)我可以将predict_proba的概率(不进行校准)解释为“关于此分类器是否正确的分类器有多确定”?

希望有人可以帮我澄清一下! :)

评论