RCN应用了实验神经科学的结论,就是哺乳动物在识别物体的时候,大脑视觉皮层对于物体的轮廓和表面的识别,机制是不一样的,它们属于协同工作。科学家根据这个结论提出了新模型,递归皮层网络,简称 RCN。这是一种整合了实验神经科学结论的概率生成模型,但重点并不是说概率生成模型超越了神经网络,而是在于RCN创新的把很多东西综合起来,首先在局部还是会用到神经网络,先用深度学习进行预处理,然后RCN 对一个物体的轮廓和表面分别是进行建模的,表面用的是条件随机场,轮廓用的是特征组合层级结构。这样置信传播(BP)可以用来求近似解,采用近似动态规划算法,算法复杂度是线性的,最终形成一个概率图模型。
这个模型的目的同样在于提高计算机识别图像中字母的准确度,最终目的是让计算机像人一样高效率地辨认任何图像中的字母,正确处理字母的形状扭曲、颜色变化、组合、遮挡等这些复杂情况。除了准确率高,还有一个亮点,就是所用的数据量比 CNN 少得多,这对于提高数据使用效率也是个很好的办法。
总结起来,就是两点: