科技名词

您当前的位置: 首页  >  科技名词  >  科技名词
卷积神经网络
发布时间:2023-07-18     作者:   来源:学习强国全国科学技术名词审定委员会   分享到:

卷积神经网络

convolutional network

定义:采用监督方式训练的一种面向两维形状不变性识别的特定多层感知机。

学科:计算机科学技术_人工智能_神经网络

相关名词:监督学习 机器学习 神经网络

【延伸阅读】

卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的典型网络结构之一。对卷积神经网络的研究始于20世纪80至90年代,到21世纪后,随着深度学习理论的提出、数值计算设备的改进以及各种标准的数据集的出现,卷积神经网络得到了快速发展,并被应用于计算机视觉、自然语言处理等领域。

卷积神经网络的典型结构大致分为卷积层、池化层、全连接层三个部分。后来的大部分卷积神经网络模型都是在这三个基本结构上的组合和改进。

卷积层的功能是对输入数据进行特征提取。其内部包含多个卷积核,也称为感受野。假如输入数据是一张灰度图像,在计算机中,它会被处理为一个二维矩阵。此外,卷积核一般也是大小为3×3或5×5大小的二维矩阵。计算机通过将图像和卷积核做卷积运算,可以使原信号特征增强,并且降低噪音。

池化层是一个下采样过程,主要作用是减少参数数量。池化分为最大值池化和平均值池化,和卷积类似,取一小块区域,比如一个5×5的方块。如果是最大值池化,就选这25个像素点中最大的那个点,作为代表输出;如果是平均值池化,就把25个像素点取平均值,作为代表值输出。

全连接层位于卷积神经网络隐含层的最后部分,其作用则是对卷积层和池化层提取到的特征进行非线性组合以得到输出,即全连接层本身可以不具有特征提取能力,而是试图利用现有的高阶特征完成学习目标。

卷积神经网络从猫视觉皮层电生理研究中获得启发,通过仿造生物的视知觉机制来构建模型。卷积网络中卷积核的设定就对应着视觉神经系统中视觉皮层对视觉空间的组织。视觉皮层细胞从视网膜上的光感受器接收信号,但单个视觉皮层细胞不会接收光感受器的所有信号,而是只接受其所支配的刺激区域,即感受野内的信号。只有感受野内的刺激才能够激活该神经元。多个视觉皮层细胞通过系统地将感受野叠加,完整接收视网膜传递的信号并建立视觉空间。

目前,卷积神经网络在诸多领域的应用都已经取得了不错的成绩,如图像识别、图片分类、自然语言处理、音频处理、姿势识别等。