神经网络是查看输入之间的组合还是单独查看每个输入?

这是关于神经网络理论的问题。

这是关于为您提供数字图片并且必须在图片中返回数字的示例。令A,B为28x28网格中的像素。对于此示例,任何给定的像素为开(255)或关(0)。 A和B的结果是否等于A on和B on的平均值?

换句话说:神经网络可以查看输入之间的组合,还是可以个别查看每个输入?

谢谢。

评论
  • snihil
    snihil 回复

    多层感知器(MLP)会分别查看每个像素,但是CNN会整体查看图片并提取特征,然后学习这些特征,这与MLP会学习整个像素不同。

    例如,如果您正在训练数字识别器神经网络,则MLP仅适用于最著名的MNIST数据集,因为它们全部都位于同一位置,但是对于其实际应用来说,例如您要构建一个老师的数字识别器系统,这样您的老师就不必为整个班级手动将这些标记放在excel表中-CNN的效果最好,因为在现实生活中,数字可以位于图片的顶部或右侧或左侧或任何位置,因此CNN将从给定图片中检测到学习到的特征并预测数字的类别。