当前位置:主页 > 视觉

麦克阿瑟天才奖得主解码计算机视觉“原罪”:AI 如何认识人类世界

2017-10-25 17:16 来源:鸥鸟拉文

  【新智元导读】麦克阿瑟“天才奖”获得者Trevor Paglen训练AI算法,他的展览项目“看不见的图像的研究”(A Study of Invisible Images),反向展示AI如何认识世界。在此过程中,他注意到一些问题,比如作为业界标准的ImageNet数据集中,有很多图像带有奇怪的标签,如今计算机视觉界中使用最多的一张女性图像来自《花花公子》,类似这样的数据问题以不显眼但深刻的方式影响着AI研究、应用和AI元素越来越多的整个社会。

  日前,一系列令人着迷的图像显示了计算机在被输入西方文学、哲学和历史作品中的图像和符号后,能够“看到”的东西,这些内容简直太令人熟悉——原来,人工智能里有卡拉瓦乔,有维米尔、有弗朗西斯·培根、达利……如果你努力,甚至还能看到爱德华·霍普。

  虽然看上去与古典大师作品十分类似,但这些奇怪而生动的场景并非出自人类大师之手。它们是我们未来的主人——人工智能算法的产物。而这些AI算法则出自艺术家Trevor Paglen之手,他上周刚刚获得了50万美元的麦克阿瑟“天才”奖。

  计算机视觉中使用最广泛的一张女性图像,是《花花公子》的“11月小姐”

  现年43岁Paglen认为,他的使命是聚焦我们周围的数据交换、监控和自动化数据结构。他最近尝试将相机对准世界的观察者——各种监控摄像头,Paglen深入了自动化系统的大脑,揭示了AI系统“眼中所见的事物”。

  Paglen在纽约市Metro Pictures画廊的新展览,揭示了“云的内部是什么样的?”“人工智能系统实际看到的世界是什么样的?”

“彗星”(由AI创作,它被训练来识别与历史上的预示、征兆有关的事物,例如彗星、日食、彩虹、黑猫、人脸形状的云)(Courtesy of Trevor Paglen and Metro Pictures, New York)

 
  “彗星”(由AI创作,它被训练来识别与历史上的预示、征兆有关的事物,例如彗星、日食、彩虹、黑猫、人脸形状的云)(Courtesy of Trevor Paglen and Metro Pictures, New York)

  他的展览项目,称为“看不见的图像的研究”(A Study of Invisible Images),显示了研究人员用来训练算法进行标注、分类的图像,展现了AI是如何处理风景、脸部或手势的,以及AI生成的巴洛克风格的艺术。

  Paglen将AI训练图像集称为计算机视觉的“亚当和夏娃”。这些图像中包括了美军在上世纪90年代开始收集整理的,面部识别技术(FERET)计划中的肖像,这是美军用于教授计算机识别人脸的图像,并成为此后计算机视觉研发的基础。

美军在上世纪90年代开始收集整理的,面部识别技术(FERET)计划中的肖像,最初是一个军事计划,后来成为计算机视觉研究的基础。

 
  美军在上世纪90年代开始收集整理的,面部识别技术(FERET)计划中的肖像,最初是一个军事计划,后来成为计算机视觉研究的基础。

  计算机视觉已经广泛应用于人们的生产和生活中,从在机场登记到监控工场生产管理。所有的这一切都始于像FERET这样的训练数据库,而这里库里的图像标签可能带有少数研究人员无意识的偏见,还由可能来自于未经训练的Mechanical Turk外包人员,以及实习生的偏见。

  在去年发表在 New Inquiry上的一篇文章中,Paglen描述了CNN的识别误差:

  将印象派与写实派大师马奈的作品“Olympia”喂给在ImageNet训练的CNN,这个CNN将这幅画分类成立“卷饼”(burrito)。

马奈的作品“Olympia”

 

马奈的作品“Olympia”

  或许,值得一提的还有计算机视觉中最着名的“夏娃”:Lenna,一名瑞典女性,其形象被《花花公子》杂志撕毁,并于1972年被南加州大学的工程师扫描复原。后来《花花公子》杂志授权,Lenna的形象获得许可,出现在了世界各地的研究中,成为图像处理测试的行业标准。自此,《花花公子》一张“11月小姐”的图片已经成为计算机视觉研究中使用最广泛的女性图像之一。这也正是Paglen希望提醒公众注意的“研究者选择偏见”。

莱娜图(局部):莱娜图(Lenna)是指刊于1972年11月号《花花公子》上的一张裸体插图照片的一部分,是一张大小为512x512像素的标准测试图。该图在数字视频处理学习与研究中颇为知名,常被用作数字视频处理各种实验(例如数据压缩和降噪)及科学出版物的例图。来源:维基百科

 
  莱娜图(局部):莱娜图(Lenna)是指刊于1972年11月号《花花公子》上的一张裸体插图照片的一部分,是一张大小为512x512像素的标准测试图。该图在数字视频处理学习与研究中颇为知名,常被用作数字视频处理各种实验(例如数据压缩和降噪)及科学出版物的例图。来源:维基百科



上一篇:亚马逊斥巨资建立在德第四个研发中心,专注人

下一篇:机器视觉中国第三 定制需求释放快速

友情链接/网站合作咨询: