高考考试网
当前位置: 首页 高考资讯

卷积神经网络结构及原理(卷积神经网络CNN简易教程)

时间:2023-07-22 作者: 小编 阅读量: 5 栏目名: 高考资讯

卷积神经网络CNN简易教程让我们先来了解一下我们的大脑是如何识别物体的我们将学习什么是CNN,CNN如何利用大脑的启发进行物体识别,CNN是如何工作的让我们来了解一下我们的大脑是如何识别图像的根据诺贝尔奖获得者Hubel和Wi。

让我们先来了解一下我们的大脑是如何识别物体的。我们将学习什么是CNN, CNN如何利用大脑的启发进行物体识别,CNN是如何工作的。

让我们来了解一下我们的大脑是如何识别图像的

根据诺贝尔奖获得者Hubel和Wiesel教授的说法,视觉区域V1由简单细胞和复杂细胞组成。简单的单元有助于特征检测,而复杂的单元则结合了来自小空间邻域的多个这样的局部特征。空间池有助于实现平移不变特征。

当我们看到一个新的图像时,我们可以从左到右和从上到下扫描图像,以了解图像的不同特征。我们的下一步是结合我们扫描的不同的局部特征来对图像进行分类。CNN就是这样工作的

平移不变特征是什么意思?

图像的不变性意味着,即使图像旋转、大小不同或在不同照明下观看,对象也将被识别为同一对象。

这有助于对象识别,因为图像表示对图像变换(如平移、旋转或小变形等)保持不变。

我们使用卷积神经网络进行图像识别和分类。

让我们了解什么是CNN,以及我们如何使用它。

CNN是什么?

CNN是Convolutional Neural Network卷积神经网络的缩写,卷积神经网络是一种专门用来处理数据的神经网络,它的输入形状类似于二维的矩阵图像。

CNN通常用于图像检测和分类。图像是二维的像素矩阵,我们在其上运行CNN来识别图像或对图像进行分类。识别一个图像是一个人,还是一辆车,或者只是一个地址上的数字。

和神经网络一样,CNN也从大脑中获取启发。我们使用Hubel和Wiesel提出的对象识别模型。

卷积是什么?

卷积是一种数学运算,其中我们有一个输入I和一个参数核K来产生一个输出。

让我们用图像来解释。

我们有一个图像“x”,它是一个具有不同颜色通道(红色、绿色和蓝色RGB)的二维像素矩阵,我们有一个特征检测器或核“w”,然后应用数学运算后得到的输出称为特征图

这个数学运算有助于计算两个信号的相似度。

我们可能有一个特征检测器或滤波器来识别图像中的边缘,所以卷积运算将有助于我们识别图像中的边缘。

我们通常假设卷积函数在除存储值的有限点集外的任何地方都为零。

I是二维数组,K是核卷积函数

因为卷积是可交换的,我们可以把上面的方程重新写一下,如下图所示。我们这样做是为了便于在机器学习中实现,因为m和n的有效值范围变化较小。这是大多数神经网络使用的互相关函数。

以上是互相关函数

那么,我们如何在CNN中实现它呢?

我们实现它的方式是通过卷积层

卷积层是CNN的核心构件,它有助于特征检测。

核K是一组可学习的过滤器,与图像相比,它在空间上很小,但是可以扩展到整个输入图像的深度。

理解这一点的一个简单方法是,如果你是一名侦探,你在黑暗中看到一幅很大的图像或一幅画,你将如何识别图像?

你将使用你的手电筒和扫描整个图像。这正是我们在卷积层中所做的。

核K是一个特征检测器,它相当于图像I上的手电筒,我们正在尝试检测特征并创建多个特征图来帮助我们识别或分类图像。

我们有多个特征探测器,以帮助像边缘检测,识别不同的形状,弯曲或不同的颜色等事情。

这一切是如何运作的?

让我们取一幅3通道5×5矩阵的图像(RGB), 3通道3×3的特征检测器(RGB),然后以步长为1来扫描图像上的特征检测器。

当我在图像上应用特征检测时,输出矩阵或特征图的维数是多少?

特征图的维数与输入图像的大小(W)、特征检测器的大小(F)、步长(S)和图像的填充大小(P)有关

(W−F 2p)/S1

在我们的例子中,W是输入图像的大小,为5。

F是特征检测器接受域大小,在我们的例子中,为3

步长(S)为1,图像上使用的填充大小(P)为0。

因此,我们的特征图维度为(5-3 0)/1 1=3。

因此特征图将是一个3*3的矩阵,有3个通道(RGB)。

下面一步一步进行解释

我们看到5×5的输入图像被简化为3×3的特征图,通道为3(RGB)

我们使用多个特征检测器来寻找边缘,我们可以使用特征检测器来锐化图像或模糊图像。

如果我们不想减少特征图的维数,那么我们可以使用如下所示的填充0

在这种情况下应用相同的公式,我们得到

(W−F2 p) / S1 => (5 - 32)/11= 5,

现在输出的尺寸将是5×5,带有3个颜色通道(RGB)。

让我们看看这一切是如何运作的

如果我们有一个3×3的特征检测器或滤波器,一个偏置单元,那么我们首先应用如下所示的线性变换

输出=输入*权重 偏差

参数个数 = (3 * 3 * 3) 1 = 28

对于100个特征检测器或过滤器,参数的数量将是2800。

在每一个线性函数的卷积运算之后,我们应用ReLU激活函数。ReLU激活函数在卷积层中引入了非线性。

它将特征图中的所有负像素值替换为零。

下图是应用ReLU激活函数后的特征图变换。

现在我们已经完成了局部区域的特征检测,我们将结合所有这些来自空间邻域的特征检测来构建图像。

记住你是一个在黑暗中扫描图像的侦探,你现在已经从左到右、从上到下扫描了图像。现在我们需要结合所有的特征来识别图像

池化

我们现在应用池来获得平移不变性。

平移的不变性意味着当我们少量改变输入时,合并的输出不会改变。这有助于检测输入中常见的特征,如图像中的边缘或图像中的颜色

我们使用最大池函数,它提供了比最小或平均池更好的性能。

当我们使用最大池时,它总结了整个邻居的输出。与原来的特征图相比,我们现在有更少的单元。

在我们的例子中,我们使用一个2x2的框扫描所有的特征图,并找到最大值。

现在我们知道卷积网络由以下构成

  • 并行的多重卷积,输出是线性激活函数
  • 卷积层中应用非线性函数ReLU
  • 使用像最大池这样的池函数来汇总附近位置的统计信息。这有助于“平移不变性”
  • 我们将结果展平,然后将其输入到全连接神经网络

下图是完整的卷积神经网络

卷积使用了三个重要的思想
  • 稀疏的交互
  • 参数共享
  • 等变表示

稀疏交互或稀疏权值是通过使用小于输入图像的核或特征检测器来实现的。

如果我们有一个大小为256 * 256的输入图像,那么就很难检测到图像中的边缘,因为其可能只占图像中像素的一个更小的子集。如果我们使用更小的特征检测器,那么当我们专注于局部特征识别时,就可以很容易地识别边缘。

另一个优点是计算输出所需的操作更少,从而提高了统计效率。

参数共享用于控制CNN中使用的参数或权值的数量。

在传统的神经网络中,每个权值只使用一次,但是在CNN中,我们假设如果一个特征检测器可以用来计算一个空间位置,那么它可以用来计算一个不同的空间位置。

当我们在CNN中共享参数时,它减少了需要学习的参数的数量,也减少了计算需求。

等变表示

这意味着目标检测对光照、位置的变化是不变的,而内部表示对这些变化是等方差的

    推荐阅读
  • 苹果在哪取消订阅 苹果在哪里取消订阅

    iPhone是苹果公司研发及销售的智能手机系列,搭载着苹果公司自行研发的iOS移动操作系统,第一代iPhone于2007年1月9日由发布。苹果iPhone所采用的多点触控技术和它友好的用户界面对其他制造商的智能手机设计产生了深远影响。iPhone3GS后来还有耐指纹疏油涂层,能避免用户的指纹留在iPhone的屏幕上。

  • 南阳诸葛亮真实历史(诸葛亮病逝于此)

    二周武王姬发建立西周后,今岐山县一带属王畿的周、召两国,由周王朝直接管辖。三西晋建立后,该地区仍属扶风郡。隋文帝杨坚建立隋朝后,将三龙县改为岐山县。由此,对于岐山县这一建制,距今已有1400多年的历史了。金国占据中原地区后,设立凤翔路,岐山县属凤翔路凤翔府。四最后,元朝这一历史阶段,推行行省制,岐山县属陕西行中书省凤翔府所辖。1980年8月1日,撤宝鸡地区并入宝鸡市,岐山县为陕西省宝鸡市辖。

  • 全明星激斗不知火舞秘卷怎么搭配

    全明星激斗不知火舞秘卷怎么搭配?火舞个人比较适配的芯片肯定是伊邪那岐或是灵子这样的后排打击芯片,可以配合火舞的技能快速收割对手的后排。伊邪那岐作为蓝色芯片比较容易升星,对生命最低的对手发动攻击很容易打出收割效果,而攻击最高的回复怒气和生命上限,只要保证火舞练度让她的攻击最高,就可以让火舞可以获得额外半次怒气技能。

  • 艾尔登法环结缘教堂位置 艾尔登法环开放世界

    艾尔登法环结缘教堂位置在哪,结缘教堂是一个非常有用的地方,玩家如果不小心误杀了npc,可以在结缘教堂忏悔复活npc,很多玩家还不清楚艾尔登法环结缘教堂位置在哪,下面一起来看一下本站小编带来的艾尔登法环结缘教堂位置。艾尔登法环结缘教堂位置其实可以先去学院,学院里去满月女王boss房门的路上有个传送门,可以直接传送到结缘教堂。

  • 工厂工作的那些事(工厂里的一些事)

    工厂里的一些事我在苏州相城区一家小工厂里面做一名质检员,我们质检部门分别有五部,做打印机️里面的海绵小零部件,四部做打印机的液体加压辊等等在今年我们部门新升上来的组长,人家可牛逼了,本来好好的部门让一个老鼠弄成一锅。

  • 快手句子简短(快手句子简单唯美)

    以下内容希望对你有帮助!快手句子简短感情到了无话可说,需要敷衍时,真的该散了。碰什么不好,偏要碰爱情。疼痛是唯一可以让人瞬间清醒的东西。长大后懂得了一个道理,不贬低别人喜欢的东西,是一种素养。你吃不到的葡萄,我吃到了,还特别甜。前途很重要,我突然哽咽,可我舍不得一个人。有些东西,记住了,就再也忘不掉。有些人,哪怕离开,记忆也经久不散。人世间99%的故事都是悲剧结局,大团圆只是1%。

  • 绍兴哪里的油菜花好看? 绍兴油菜花最美的地方

    绍兴油菜花观赏地推荐如下:上虞覆卮山油菜花田地址:绍兴上虞区东澄古村花期:3月份覆卮山油菜花田素有“华东最美十大金花胜地之一”的好名声。这片金黄色的海洋起于香林大道附近,一直延展至会稽山绍兴酒股份有限公司附近,面积达到了160亩,是以往游步道花海种植面积的4倍左右。这片油菜花于去年10月底种下,预计花期将持续到3月底。今年的7月份前后,游步道旁还会种下向日葵,并在10月份为市民们带来另一片美丽花海。

  • 呆萌可爱的长句子(元气满满可爱的句子)

    呆萌可爱的长句子努力做一个可爱的人。元气满满之后,遇到自己喜欢的人的时候,感觉自己整个人都会不一样了,想做他怀里的小朋友,天真可爱。痛苦让人成长,是你进步的一个机会,一个挑战。别害怕痛苦的事情,它有另一面积极的作用。学会放手,然后张开手,平静地面对生活中每一次偶然,坦然地接受所有的必然,笑着面对新生活。不要把别人对你的好感当尊重,把尊重当做认同。这对于一个职场中人来说不理性,也不成熟。

  • 平行进口车选车注意事项(不懂平行进口车)

    平行进口汽车,是指未经品牌厂商授权,贸易商从海外市场引入中国市场进行销售的汽车。与传统的渠道,海外总代理授权品牌4S店然后在销售给客户,两者相平行的进口渠道。主机厂生产销往中东国家适应他们交通法规的称为中东版;中东国家大多丰田系列车型!

  • 金靖个人资料(金靖人物介绍)

    以下内容大家不妨参考一二希望能帮到您!金靖个人资料金靖,1992年12月23日出生于上海市,中国内地女演员,毕业于上海政法学院。2016年,作为常驻嘉宾参与录制东方卫视综艺节目《今夜百乐门》,从而正式出道。2018年,参与金鹰卡通卫视综艺节目《人偶总动员第三季》。2019年,参与腾讯视频综艺节目《演员请就位》。2020年,出演抗疫剧《最美逆行者》。