新的计算机神经网络识别以及灵长类的大脑

新的计算机神经网络可以像灵长类大脑一样视觉识别

一个麻省理工学院神经科学家的团队发现,一些计算机程序可以识别这些图像中的对象以及灵长类的大脑。

一项新的研究麻省理工学院神经科学家表示,最新的计算机神经网络可以像识别灵长类大脑一样识别视觉物体。

几十年来,神经科学家一直试图设计能够模仿视觉技能,例如识别物体的计算机网络,人类大脑确实非常准确且快速地。

到目前为止,在简要浏览期间,没有计算机模型能够在视觉对象识别下匹配灵长类的大脑。然而,来自麻省理工学院神经科学家的新研究发现,这些所谓的“深度神经网络”的最新一代之一与灵长类的大脑相匹配。

詹姆斯·迪卡洛说,因为这些网络是基于神经科学家目前对大脑如何进行物体识别的理解,最新网络的成功表明,神经科学家对物体识别的工作原理有相当准确的把握,他是神经科学教授,也是麻省理工学院大脑和认知科学系主任,也是12月18日发表的一篇描述这项研究的论文的资深作者刊登奖金计算生物学yabo124

“事实上,模型预测神经反应和神经人口空间中物体的距离显示,这些模型封装我们目前最好的理解发生了什么在这以前神秘的大脑的一部分,”迪卡洛说,他也是一个麻省理工学院麦戈文脑研究所的成员。

这种改进了了解灵长类动物的作品如何导致更好的人工智能,有一天,修复视觉功能障碍的新方法,在麦戈尔恩研究所和纸质领先作者中添加了Charles Cadieu。

其他作者是研究生厦港和迭戈阿迪拉,科学家丹尼尔Yamins,前麻省理工学院的研究生尼古拉斯·平托,前麻省理工学院本科伊桑所罗门和附属研究机构纳吉Majaj。

受到大脑的启发

科学家在20世纪70年代开始建立神经网络,希望模仿大脑处理视觉信息的能力,认识语音和理解语言。

对于基于视觉的神经网络,科学家受到大脑中视觉信息的分层表示的启发。随着视觉输入从视网膜流入原发性视觉皮质,然后从那时起,它在每个级别处理它,并且变得更具体,直到可以识别对象。

为了模仿这一点,神经网络设计人员在其模型中创建了几个计算。每个级别执行数学操作,例如线性点产品。在每个级别,视觉对象的表示变得越来越复杂,并且除了对象的位置或移动之外的不需要的信息,抛弃。

“每个单独的元素通常都是一个非常简单的数学表达式,”卡迪厄说。“但当你把成千上万个这样的东西组合在一起时,你就会得到非常复杂的转换,从原始信号转换为非常有利于物体识别的表征。”

对于这项研究,研究人员首先测量了大脑的物体识别能力。由Hong和Majaj领导,它们在IT皮层中的电极阵列以及在区域V4中植入,这是一种视觉系统,其进入IT皮质。这允许他们看到神经表示 - 为动物看起来的每个物体的神经元群体。

然后,研究人员可以将其与深神经网络创建的表示进行比较,这包括由系统中的每个计算元素产生的数字矩阵组成。每个图像产生不同的数字数组。当准确性模型的大小取决于它是否在表示中将相似的对象分组到相似的簇中。

“通过这些计算变换中的每一个,通过这些网络层中的每一个,某些物体或图像都越来越近,而其他物体则进一步进一步,”Cadieu说。

最好的社交网络是由哈佛大学的研究人员开发的纽约大学,哪个分类对象以及猕猴。

更多加工能力

Cadieu说,有两个主要因素可以解释这种类型的神经网络最近的成功。一个是计算处理能力的可用性的重大飞跃。研究人员一直在利用图形处理单元(gpu),这是为高性能处理视频游戏所需的大量视觉内容而设计的小型芯片。“通过购买这些相对便宜的显卡,人们可以在计算方面挑战极限,”Cadieu说。

第二个因素是研究人员现在可以访问大型数据集以将算法送到“训练”它们。这些数据集包含数百万图像,每个数据集通过具有不同识别级别的人类注释。例如,狗的照片将被标记为动物,犬,驯养的狗和狗的品种。

起初,神经网络并不擅长识别这些图像,但随着它们看到越来越多的图像,并发现哪些图像是错误的,它们就会改进计算,直到它们在识别物体方面变得更加准确。

Cadieu说,研究人员对究竟允许这些网络区分不同对象的知识不太了解。

“那是一个亲和力的,”他说。“这非常擅长,我们不必真正知道这些物体的事情是什么。但是,大康是,检查那些网络是很难看的,看看内部,看看他们真正做了什么。现在人们可以看到这些事情正在运作良好,他们会更加努力了解他们内心的发生。“

最新计算机模型的高性能“令人兴奋,不仅作为一项工程壮举,而且它还为我们提供了更好的计算工具,来模拟生物大脑的工作方式,包括人类大脑,”Nikolaus Kriegeskorte说,他是英国医学研究理事会认知和脑科学部门的首席研究员,但他不是研究小组的成员。“加上最近的另外两项研究,这项工作表明,深度学习模型以某种类似于生物大脑的方式解决了复杂的视觉识别任务。”

DiCarlo的实验室现在计划尝试生成可以模拟视觉处理的其他方面的模型,包括跟踪运动和识别三维形式。他们还希望创造出包含在人类视觉系统中看到的反馈投影的模型。目前的网络只模拟从视网膜到IT皮层的“前馈”投射,但从IT皮层到系统其余部分的连接数量是原来的10倍。

这项工作得到了国家眼科研究所、国家科学基金会和国防高级研究计划局的支持。

出版: Charles F. Cadieu, et al.,“深度神经网络与灵长类IT皮层在核心视觉物体识别中的表现竞争”,PLoS计算生物学,2014;yabo124DOI: 10.1371 / journal.pcbi.1003963

图片:图像礼貌的研究人员

第一个发表评论关于“新的计算机神经网络和灵长类大脑的识别”

发表评论

邮箱地址可选。如果提供,您的电子邮件将不会被公布或共享。