Home > Categories > OpenCV > 数学家告诉你“纪念碑谷”中的视觉奥秘

数学家告诉你“纪念碑谷”中的视觉奥秘

2019.09.8 No Comments

一个人穿成矿工的样子，戴着头灯拿着镐一跃跳上舞台。他向观众挥舞几下镐，假装发现了超强磁铁（supermagnet，磁力超强甚至可以吸引木头）。但舞台上的视频似乎证明了他是正确的：视频里几个木球似乎无视重力，沿着四个斜坡向上滚。

奇异之球杉原的获奖视错觉作品。木球看上去是沿着斜坡向上滚动。右边是另外一个角度。

此人其实并不是矿工，而是数学家，他是日本明治大学的杉原厚吉(Kokichi Sugihara)。他正在参加美国佛罗里达年度最佳幻觉比赛（Best Illusion of the Year Contest）的决赛。接着，人们从视频中可以看到，球并没有真的沿着坡向上滚。观察斜坡的背面就能发现，前端看上去垂直的柱状物其实是假象，斜坡的方向实际上是下坡而不是上坡。这个表演（获得了当年的大奖）是一个视错觉，它是由杉原和一个特别的合作者——一台电脑一起设计的。

杉原最开始并不想成为一个视错觉魔术师。1980年的时候他还是个年轻的数学家，对机器人视觉和计算机辅助设计比较感兴趣。他设计了一个计算机程序，能够读取多边形的线条画，然后根据线条画设计出一系列的三维物体来，这些三维物体在平面上的投影就是前面讲到的线条画（类似于从投影来倒推可能的立体物体）。

为了测试他的程序，杉原将看起来不可能的物体（比如M. 埃舍尔的无尽的楼梯）输入进去。他本来预计计算机程序无法输出相应的三维物体，但是令他意想不到的是，有时候计算机程序能够给出解答：看上去就像是原画的三维物体。“我还以为软件出错了”，杉原表示。

仔细检查后他发现，出错的是他的假设，即这些“不可能”的二维物体不可能存在于三维世界。他开始为这些三维模型设计制作纸质模型。渐渐地，他发现机器人和设计程序不适合做这件事，它们和他的计算机程序不太匹配。他转而开始钻研那些被他的程序轻易算出来的奇怪结构，用人类的视角看它们真是太令人费解了。他建造了一台视错觉机器。

此后的34年来，杉原用他的视错觉机器创造出了超过100个视错觉，比如埃舍尔阶梯的不可能立体模型，还有反直觉的运动(比如上坡的球)。“杉原创造出了颠覆视觉规则的系统方法。”美利坚大学的神经科学家Arthur Shapiro表示，杉原既是科学家，也是艺术家，他的研究帮助阐明了大脑构建世界的基本数学原理。

让不可能成为可能来源于艾舍尔的不可能的阶梯一画。杉原用他的视错觉机器来设计了该画的真实三维模型。左边是这个立体模型呈现出的错觉，楼梯似乎不断地向上蜿蜒。右边是从另一个角度拍摄的模型，视错觉的本来面目一目了然。（图片来源：Ito Photo, Inc）

对于接收到的视觉信息，人类大脑通常会忽略许多可行的解释。由于人脑的资源有限，它需要快速地理解视觉信息，而无法接纳每条古怪的解释。根据过去的经验和天生的视觉处理机制，大脑仅仅挑选最有可能的解释。纽约州立大学南部医学中心（SUNY Downstate Medical Center）的神经科学家Susana Martinez-Conde表示，大多数情况下（虽然不是总是），从实用性上来讲这种解释足够接近现实了。她和同事Stephen Macknik一同运营这个错觉竞赛。“从进化的角度来说，100%正确的代价高昂很多。”

杉原相信，他的视错觉虽然看上去那么令人困惑，背后的原理应当非常简单：我们倾向于感知直角，即使实际上直角并不存在。许多最具说服力的、看似不可能的图片包括这样一种结构，里面只含有三种不同方向的线条。在那种情况下，我们似乎不可避免地将三个方向的线条看作是相互垂直的。

杉原通过让电脑程序选择带最多直角的三维解的方式来验证他的假设。他说，计算机通常会选择和人类感知物一样的三维物体，这相当于验证了以上的假设。如果计算机发现了好几个带有最多直角的物体，杉原认为人类视觉系统会用明暗线索来挑选最可能的候选解释。他说，人类视觉系统倾向于将明亮的表面视为朝上的，灰暗的表面视为朝下的。杉原希望最终能够给自己的程序构造一个模块来验证这个假设。

Macknik表示，就算整体上感觉不对，但是一旦我们做出直角的感知，我们的大脑就不太容易转过弯来了。这是因为我们对图像进行的是局部处理，这让我们能够“看见”那些不可能的结构。“在艾舍尔的阶梯这幅画中，我们可以看见楼梯永远向上，因为从局部来讲阶梯间连接的角度差不多是正确的。”他说，“我们无法看出局部的小错误。这些错误累积构成了整体上不可能的图像。”

杉原系统地制造错觉图的能力为我们提供了探索视觉系统的新机遇。杉原表示，许多心理学家提出的另一个视觉理论是，视觉系统会为看到的图像选择最对称的解释。他和研究视错觉的日本立命馆大学心理学家北冈明佳（Akiyoshi Kitaoka）合作，研究到底杉原的哪幅视错觉图最能体现这个理论和直角理论间的差异。这项研究能帮助人们理解各种不同视觉捷径的优先级。Martinez-Conde表示，一般来说，处理视错觉信息的视觉层级越低，处理的结果越难被排斥。深度错觉的视觉处理层级位于中层，也是杉原大多数作品的核心。Martinez-Conde表示深度错觉“非常难于破解”。

杉原的多产不仅仅依靠他的程序，还依赖于那些作为输入材料的不可能图画。他的作画的一个方法是将物体的一部分从背景移到前景中，通过这种方式创造出一个物理上不可能的图画。另外一个方法是把画切割成几部分，然后将各个部分重组，使得连接角看上去是垂直的，但是整体在现实生活中却又是不存在的。他用这些以及其他的简单方法创造出了大量的不可能图画。它们中的大多数在三维世界中是不存在的，但是杉原的程序却发现有一些可以存在。

小餐厅上面的两张图被对半分割，然后用新的方法重新连接起来，产生了两张“不可能”的图画。（图片来源：Kokichi Sugihara）

最近几年，他为他的“演出剧目”增加了不可能的运动。他建造了一些立体结构，这些三维物体本身在视觉上并不是不可能的，但是其中的物体却似乎以违反物理规律的方式运动。杉原的程序用直线和平面创造出了一些立体图形。分析物体在这些结构中的运动是件简单的事，杉原给程序添加了一个模块来执行。比如，为了建造出那个获奖的球上山错觉装置，杉原仅仅画了一张斜坡装置的草图，然后让程序根据这张草图设计三维结构，然后找出其中几个能让球“上坡”的结构。

当我们注视着这些不可能的物体或者运动时，我们认知系统做出的判断（“有什么不对”）并不足以抵消大脑对于三维几何学的直觉解释。“对于三维物体图像的解释不受大脑逻辑部分的控制。”杉原表示。

折梯杉原的新作品，在这里第一次面世。在这个视错觉中，直杆似乎以不可能的方式穿过一个折起来的梯子的开口。换个角度看就一目了然。（图片来源：Image Science, Inc）

杉原最新的视错觉表现的就是这个现象。在这张图中，一根直杆在一个折叠的梯子状物体的横档间运动。但是，如果这根直杆不能弯曲的话，这个运动应该是不可能发生的。为了创造这个视错觉，杉原先画出了梯子，然后运行程序让它选择和人类直觉区别最大的那个三维解。我们的直角偏好让我们将梯子的顶部看成是平的，因为这会让它和梯子的所有支架形成直角。但实际上梯子的顶部并不是平的：一些支架的位置高于水平面，使得直杆能够以不可能的方式穿过。

杉原的程序可能让你以为，我们能创造出复杂的计算机视觉系统，它们不会像人类的视觉那样容易受骗上当。但是，杜克大学的神经科学家Dale Purves表示，在不经过进化演变的情况下计算机程序不太可能媲美人类的视觉。“我们的视觉是靠几百万乃至几十亿年的进化得来的（时间的长短看你怎么理解了）”，他说，“我不认为一台机器能够和人类视觉比肩，除非它的连接性是由进化塑造的，而非工程师的逻辑。”

如果机器人能通过进化发展出视觉，它们将会和人类一样不可避免地被视错觉欺骗。英国伦敦大学学院的神经科学家Beau Lotto，以及罗伯特戈登大学的David Corney创造出了一种机器人，它能够通过试错来学习预测人工合成自然景色中的灰度。和人类一样，这些机器人也会被“怀特错觉”（White’s illusion）欺骗。怀特错觉是指，当一些相同的灰色色块被放置在黑色或者白色的条纹边上时，从视觉上看这些完全相同的灰色色块的亮度是不同的。但是Macknik表示，经进化锤炼的计算机视觉系统可以联合一些程序（如杉原的），来提供两套视觉世界中最优的解。“我有信心，最终计算机视觉系统会超过人类。”

就目前而言，类似于杉原创造的程序对人类的视觉还是望尘莫及。但是它们却不会被人类的视觉弱点所牵制——这也是杉原想要充分利用的一点。不管怎么说，对于杉原来说视错觉不仅仅是职业兴趣。他说，“我喜欢让别人大吃一惊。”（作者：ERICA KLARREICH 编译：徐寒易）

原文链接：
http：//nautil.us/issue/32/space/the-illusion-machine-that-teaches-us-how-we-see-rp

Erica Klarreich是美国加州伯克利的数学家和科学作家。她的作品曾被《最佳数学文摘》（The Best Writing on Mathematics）的2010和2011卷收录。

华人数学家解开视觉奥秘：一切都是大脑假装让人看见Posted on 2019.09.8
CV界的明星人物们Posted on 2013.07.19
分析视觉场景：枪为什么总是正对你？Posted on 2013.04.11

PleaseV's blog

数学家告诉你“纪念碑谷”中的视觉奥秘

Tags

文章分类

文章归档