
Marr视觉计算理论:
目的:通过视觉系统,重建三维物体的形状和位置
初始省略(2维):过零点(zero-crossing)短线段、端点等基元特征
维:对物体形状的一些粗略描述
3维:对物体的三维描述

计算机视觉的早期图像表示模型是Part-based,这样就可以通过Part这种组合式的方法表示物体。但很多自然场景的物体没有这么强的结构。

80年代,特征检测和机器学习同时也开始组合应用,但对物体结构有严格限制(指定对象类型)
2000-2012年,局部特征描述得到迅速发展,如SIFT/HOG
特征描述具有通用性,结合SVM等机器学习方法。但效果有限。

从2012后,深度学习方法兴起。特征->自动提取;层数->很深。
e.g. MS的ResNet 152层(2015,ImageNet) |