高考考试网
当前位置: 首页 高考资讯

卷积神经网络结构及原理(卷积神经网络CNN简易教程)

时间:2023-07-22 作者: 小编 阅读量: 4 栏目名: 高考资讯

卷积神经网络CNN简易教程让我们先来了解一下我们的大脑是如何识别物体的我们将学习什么是CNN,CNN如何利用大脑的启发进行物体识别,CNN是如何工作的让我们来了解一下我们的大脑是如何识别图像的根据诺贝尔奖获得者Hubel和Wi。

让我们先来了解一下我们的大脑是如何识别物体的。我们将学习什么是CNN, CNN如何利用大脑的启发进行物体识别,CNN是如何工作的。

让我们来了解一下我们的大脑是如何识别图像的

根据诺贝尔奖获得者Hubel和Wiesel教授的说法,视觉区域V1由简单细胞和复杂细胞组成。简单的单元有助于特征检测,而复杂的单元则结合了来自小空间邻域的多个这样的局部特征。空间池有助于实现平移不变特征。

当我们看到一个新的图像时,我们可以从左到右和从上到下扫描图像,以了解图像的不同特征。我们的下一步是结合我们扫描的不同的局部特征来对图像进行分类。CNN就是这样工作的

平移不变特征是什么意思?

图像的不变性意味着,即使图像旋转、大小不同或在不同照明下观看,对象也将被识别为同一对象。

这有助于对象识别,因为图像表示对图像变换(如平移、旋转或小变形等)保持不变。

我们使用卷积神经网络进行图像识别和分类。

让我们了解什么是CNN,以及我们如何使用它。

CNN是什么?

CNN是Convolutional Neural Network卷积神经网络的缩写,卷积神经网络是一种专门用来处理数据的神经网络,它的输入形状类似于二维的矩阵图像。

CNN通常用于图像检测和分类。图像是二维的像素矩阵,我们在其上运行CNN来识别图像或对图像进行分类。识别一个图像是一个人,还是一辆车,或者只是一个地址上的数字。

和神经网络一样,CNN也从大脑中获取启发。我们使用Hubel和Wiesel提出的对象识别模型。

卷积是什么?

卷积是一种数学运算,其中我们有一个输入I和一个参数核K来产生一个输出。

让我们用图像来解释。

我们有一个图像“x”,它是一个具有不同颜色通道(红色、绿色和蓝色RGB)的二维像素矩阵,我们有一个特征检测器或核“w”,然后应用数学运算后得到的输出称为特征图

这个数学运算有助于计算两个信号的相似度。

我们可能有一个特征检测器或滤波器来识别图像中的边缘,所以卷积运算将有助于我们识别图像中的边缘。

我们通常假设卷积函数在除存储值的有限点集外的任何地方都为零。

I是二维数组,K是核卷积函数

因为卷积是可交换的,我们可以把上面的方程重新写一下,如下图所示。我们这样做是为了便于在机器学习中实现,因为m和n的有效值范围变化较小。这是大多数神经网络使用的互相关函数。

以上是互相关函数

那么,我们如何在CNN中实现它呢?

我们实现它的方式是通过卷积层

卷积层是CNN的核心构件,它有助于特征检测。

核K是一组可学习的过滤器,与图像相比,它在空间上很小,但是可以扩展到整个输入图像的深度。

理解这一点的一个简单方法是,如果你是一名侦探,你在黑暗中看到一幅很大的图像或一幅画,你将如何识别图像?

你将使用你的手电筒和扫描整个图像。这正是我们在卷积层中所做的。

核K是一个特征检测器,它相当于图像I上的手电筒,我们正在尝试检测特征并创建多个特征图来帮助我们识别或分类图像。

我们有多个特征探测器,以帮助像边缘检测,识别不同的形状,弯曲或不同的颜色等事情。

这一切是如何运作的?

让我们取一幅3通道5×5矩阵的图像(RGB), 3通道3×3的特征检测器(RGB),然后以步长为1来扫描图像上的特征检测器。

当我在图像上应用特征检测时,输出矩阵或特征图的维数是多少?

特征图的维数与输入图像的大小(W)、特征检测器的大小(F)、步长(S)和图像的填充大小(P)有关

(W−F 2p)/S1

在我们的例子中,W是输入图像的大小,为5。

F是特征检测器接受域大小,在我们的例子中,为3

步长(S)为1,图像上使用的填充大小(P)为0。

因此,我们的特征图维度为(5-3 0)/1 1=3。

因此特征图将是一个3*3的矩阵,有3个通道(RGB)。

下面一步一步进行解释

我们看到5×5的输入图像被简化为3×3的特征图,通道为3(RGB)

我们使用多个特征检测器来寻找边缘,我们可以使用特征检测器来锐化图像或模糊图像。

如果我们不想减少特征图的维数,那么我们可以使用如下所示的填充0

在这种情况下应用相同的公式,我们得到

(W−F2 p) / S1 => (5 - 32)/11= 5,

现在输出的尺寸将是5×5,带有3个颜色通道(RGB)。

让我们看看这一切是如何运作的

如果我们有一个3×3的特征检测器或滤波器,一个偏置单元,那么我们首先应用如下所示的线性变换

输出=输入*权重 偏差

参数个数 = (3 * 3 * 3) 1 = 28

对于100个特征检测器或过滤器,参数的数量将是2800。

在每一个线性函数的卷积运算之后,我们应用ReLU激活函数。ReLU激活函数在卷积层中引入了非线性。

它将特征图中的所有负像素值替换为零。

下图是应用ReLU激活函数后的特征图变换。

现在我们已经完成了局部区域的特征检测,我们将结合所有这些来自空间邻域的特征检测来构建图像。

记住你是一个在黑暗中扫描图像的侦探,你现在已经从左到右、从上到下扫描了图像。现在我们需要结合所有的特征来识别图像

池化

我们现在应用池来获得平移不变性。

平移的不变性意味着当我们少量改变输入时,合并的输出不会改变。这有助于检测输入中常见的特征,如图像中的边缘或图像中的颜色

我们使用最大池函数,它提供了比最小或平均池更好的性能。

当我们使用最大池时,它总结了整个邻居的输出。与原来的特征图相比,我们现在有更少的单元。

在我们的例子中,我们使用一个2x2的框扫描所有的特征图,并找到最大值。

现在我们知道卷积网络由以下构成

  • 并行的多重卷积,输出是线性激活函数
  • 卷积层中应用非线性函数ReLU
  • 使用像最大池这样的池函数来汇总附近位置的统计信息。这有助于“平移不变性”
  • 我们将结果展平,然后将其输入到全连接神经网络

下图是完整的卷积神经网络

卷积使用了三个重要的思想
  • 稀疏的交互
  • 参数共享
  • 等变表示

稀疏交互或稀疏权值是通过使用小于输入图像的核或特征检测器来实现的。

如果我们有一个大小为256 * 256的输入图像,那么就很难检测到图像中的边缘,因为其可能只占图像中像素的一个更小的子集。如果我们使用更小的特征检测器,那么当我们专注于局部特征识别时,就可以很容易地识别边缘。

另一个优点是计算输出所需的操作更少,从而提高了统计效率。

参数共享用于控制CNN中使用的参数或权值的数量。

在传统的神经网络中,每个权值只使用一次,但是在CNN中,我们假设如果一个特征检测器可以用来计算一个空间位置,那么它可以用来计算一个不同的空间位置。

当我们在CNN中共享参数时,它减少了需要学习的参数的数量,也减少了计算需求。

等变表示

这意味着目标检测对光照、位置的变化是不变的,而内部表示对这些变化是等方差的

    推荐阅读
  • 横看成岭侧成峰的诗句意思是什么(横看成岭侧成峰的出处)

    横看成岭侧成峰的诗句意思是什么意思是:从正面、侧面看庐山山岭连绵起伏、山峰耸立。不识庐山真面目,只缘身在此山中。之所以辨不清庐山真正的面目,是因为我人身处在庐山之中。《题西林壁》这首古诗,不仅对庐山雄奇壮观、千姿百态景色的赞美,更包含了“当局者迷,旁观者清”的人生哲理。

  • 辛弃疾李白苏轼图鉴(历史上的那些神童)

    六岁时,陆绩跟随父亲到九江拜谒袁术。陆绩又聪明又孝顺,这个“怀橘遗亲”的故事成为古代孝亲典范,被列入了“二十四孝”之中。群臣哄堂大笑,诸葛瑾非常尴尬。人们再次大笑,这次不是嘲笑,而是为这小孩子急中生智赞赏的笑。诸葛恪不仅为父亲化解了窘境,还白白得到了一头驴。食盐和柳絮,两种比喻高下立判,12岁的谢道韫充分展现了自己的才华。由这个故事,后人也把女子的文学才华称为“咏絮之才”。

  • 德云社比较火的相声演员(盘点德云社最火的10位相声演员)

    10、周九良本名周航,德云社七队队员,粉丝称他为“小先生”,因为他很佛系慵懒又称他为“橘猫”,最着急下班,真是沉迷下班周九良。

  • 特斯拉在上海建二期工厂吗(特斯拉将扩建上海超级工厂)

    在上海封控期间,上海宝冶的工人甚至直接转移去支援方舱建设。2021年全年特斯拉上海超级工厂实现了48.41万辆的年度交付量,在总交付量中占比达51.7%,当前主要出口国家是德国和日本。在经过22天的封控后,根据路透社预测,上海超级工厂的产量将因此减少5万多辆。

  • lol世界第一辅助是谁(lol世界第一辅助是谁啊)

    1、MadLife,公认的世界第一辅助,世界第一锤石,辅助之神。

  • 存世量最少的邮票排名(发行量这么大有收藏价值吗)

    汉族是原称为“华夏”的中原居民,后同其他民族逐渐同化,融合,汉代开始,称为汉族。主要聚居于宁夏回族自治区。其中黔东南苗族侗族自治州是苗族最大的聚居区。彝族支系繁多,多数自称“诺苏”,“纳苏”,“聂苏”等。新中国成立后,正式定名为彝族。目前仍在推广使用。布依语和壮语有密切的亲属关系。解放后,人民政府为布依族创制了用拉丁字母拼音的布依文。因其生产方式,居住和服饰等方面的不同特点而有多种自称和他称。

  • 桑叶面膜的功效和作用(有什么好处)

    桑叶面膜的功效和作用桑叶是物美价廉的天然美容护肤佳品,尤其对脸部的痤疮、褐色斑有较好的疗效。清洁完脸部间隔半个小时或一个小时贴面膜,这样对于皮肤吸收更好。桑叶有散风除热、清肝明目之功效,桑叶中含有芦丁、槲皮素、芸香苷等黄酮类等成分。桑叶有降血糖作用,能刺激胰岛素分泌,降低胰岛素分解速度;还有抗菌等作用,对金黄色葡萄球菌、链球菌、大肠杆菌、伤寒杆菌、痢疾杆菌及绿脓杆菌有抑制作用。

  • 地皮菜怎么清洗才能干净(地皮菜如何清洗才能干净)

    我们一起去了解并探讨一下这个问题吧!地皮菜怎么清洗才能干净地皮菜上面有很多土和杂质,可以选择多清洗几次,每次清洗杂质都会少一些,四五次就可以洗干净,最好是用温水。把地皮菜放在淡盐水里面,泡15分钟左右,杂质都会清除掉。用面粉清洗,面粉的粘附能力比较强,在清洗时可以撒上面粉,慢慢搓洗干净即可。

  • 冰箱一直嗡嗡响如何解决(家里冰箱嗡嗡异响你试过吗)

    然而,当冰箱用久之后就会发现,有时会发出嗡嗡的响声,着实心烦。今天我们来聊聊冰箱“嗡嗡”异响的原因,此外,怎样保养才能延长冰箱的寿命呢。总结随着品质消费的不断升级,人们对冰箱的要求越来越高,但是总是会有这样那样的问题出现,当听到“嗡嗡”异响时,对照以上原因,并用以上的方法尝试进行解决,可以事半功倍。

  • 王宝强车祸事件疑马蓉宋喆谋杀 马蓉王宝强事件结果

    深挖王车祸真相:两起车祸疑似马蓉、宋哲将王公司谋杀成空外壳。随着对离婚事件内幕的深入调查,王车祸身亡是真是假等话题被揭露,更有报道称王车祸真相其实是马蓉和宋哲的阴谋,但目前王公司已经沦为空空壳。据媒体报道,王曾前往各大银行查看其账户及账户存款,但其所有财产均已转移。不过有内部人士表示,马蓉确实是在转移财产,1400万,因为王有自己的情妇,马蓉是第一个赢的。