高考考试网
当前位置: 首页 高考资讯

正则化参数怎么选(L1和L2正则化的直观解释)

时间:2023-08-09 作者: 小编 阅读量: 1 栏目名: 高考资讯

L1和L2正则化的直观解释过度拟合是当机器学习或统计模型针对特定机器学习数据集定制并且无法泛化到其他数据集时发生的现象这通常发生在复杂的机器学习模型中,如深度神经网络正则化是引入附加信息以防止过度拟合的过程本文的重点是L1和L。

过度拟合是当机器学习或统计模型针对特定机器学习数据集定制并且无法泛化到其他数据集时发生的现象。这通常发生在复杂的机器学习模型中,如深度神经网络。

正则化是引入附加信息以防止过度拟合的过程。本文的重点是L1和L2正则化。

有很多解释有点过于抽象,在本文中,我将与您分享一些直觉,为什么L1和L2使用梯度下降。梯度下降只是一种使用梯度值通过(迭代)更新找到“正确”系数的方法。

L1和L2

L1和L2正则化的名称分别来源于向量w的L1和L2范数。。这是关于规范的入门读物:

1-norm (也称为L1范数)

2-norm (也称为L2范数或欧几里德范数)

p -norm

实现正则化的L1范数的线性回归模型称为套索回归(lasso regression),实现正则化的L2范数的线性回归模型称为岭回归(ridge regression)。要实现这两个,请注意线性回归模型保持不变:

但损失函数的计算包含了这些正则化项:

没有正则化的损失函数

L1正则化的损失函数

L2正则化的损失函数

正则化项是“限制”,通过该最小化损失函数时,除了具有以最小化真之间的误差的优化算法必须“坚持” ÿ和预测ŷ。

模型

为简单起见,我们定义一个简单的线性回归模型ŷ与一个独立变量。

在这里,我使用了深度学习惯例w('weight')和b('bias')。

在实践中,简单的线性回归模型不容易过度拟合。如引言中所述,深度学习模型由于其模型复杂性而更容易受到此类问题的影响。

因此,请注意本文中使用的表达式很容易扩展到更复杂的机器学习模型,而不仅限于线性回归。

损失函数

然后我们将损失函数定义为平方误差,其中误差是y(真实值)和ŷ(预测值)之间的差异。我们称这个损失函数为L。

没有正则化的损失函数

假设我们的模型将使用此损失函数进行过度拟合。

L1正则化的损失函数

根据我们的损失函数,在L中加入L1正则化项如下:

其中正则化参数λ > 0被手动调整。注意,除了w=0时,|w|在任何地方都是可微的,如下所示。我们稍后会需要这个。

L2正则化的损失函数

把L2的正则化项加到L中是这样的:

其中,λ > 0。

梯度下降

现在,我们用梯度下降优化法来求w。

求L 、L0、 L1的梯度

L:

L1:

L2:

如何防止过度拟合?

让我们在上面的等式中执行以下替换:

  • η = 1,
  • H = 2x(wxby)

因此我们有如下:

L:

L1:

L2:

观察具有和不具有正则化参数λ的权重更新之间的差异。

L vs. {L1和L2}

直觉A:

让我们用等式说明。等式0执行w-H给我们一个导致过度拟合的w值。直观地说,等式1.1-2会减少过度拟合,因为引入的λ。

直觉B:

让我们说一个过度拟合的模型意味着我们有一个非常拟合我们模型的w值。“完美”意味着如果我们在模型中替换数据(x),我们的预测ŷ将非常接近真实的y。当然,这很好,但我们不希望完美。为什么?因为这意味着我们的模型仅适用于我们训练的数据集。这意味着我们的模型将产生远离其他数据集的真实值的预测。所以我们从不完美的角度来解决,希望我们的模型也可以与其他数据进行密切的预测。为了做到这一点,有了等式1.1-2中的λ惩罚项。

直觉C:

请注意,H取决于机器学习模型(w和b)和数据(x和y)。仅根据公式中的模型和数据更新权重。等式0会导致过度拟合,从而导致泛化不佳。另一方面,在等式1.1-2中,w的最终值不仅由模型和数据的影响,还由预定义的参数λ影响。因此,如果我们设置适当的λ值,我们可以防止过度拟合(虽然太大的值会导致模型严重不拟合)。

L1与L2

直觉D:

我们现在将注意力集中在L1和L2上,并重写等式1.1-2(通过重新排列其λ和H项如下):

L1:

L2:

对于L1(公式3.1),如果w为正,则正则化参数λ > 0将通过从w减去λ而将w变得更小。在等式3.2,w为负,则将λ加到w,推动它减去负值。因此,这具有将w推向0的效果。

这在单变量线性回归模型中当然是毫无意义的,但是它将证明在多变量回归模型中“去除”无用变量是非常有用的。您还可以将L1视为减少模型中的特征数量。以下是L1尝试在多元线性回归模型中的示例:

虽然L1取决于W的符号, L2则不管它的符号是什么,只要把w推开。

,
    推荐阅读
  • 如何关闭微信小程序(关闭微信小程序的方法)

    下面更多详细答案一起来看看吧!如何关闭微信小程序首先打开微信页面设置点开通用设置,找到“发现页面管理”打开,再点击小程序开关设置即可关闭。还可以打开使用过的小程序列表点击设置,在弹出的小程序菜单中找到设置项把“使用我的地理位置”和“使用我的用户信息”关闭即可。

  • 保存excel2003工作薄时文件格式是什么 Excel 2010默认保存工作薄的格式扩展为

    任何能够打开xls文件的文字处理软件都可以将该文档转换为xlsx文件,xlsx文件比xls文件所占用空间更小。

  • 成都双流机场最近需要哪些检查(天府双流走错机场怎么办)

    天亲爱的旅客:2021年6月27日,成都天府国际机场将正式投运,天府机场与双流机场将进入“两场一体”运行模式。请各位旅客务必在出发前仔细确认机场信息。天府机场、双流机场联合各航空公司共同为天府机场投运转场初期错走机场的旅客制定了服务保障措施。

  • 夏天也被静电电到是怎么回事(噼里啪啦静电季)

    在寒冷季节,静电也是诱发心血管疾病的原因之一。临床上也有不少被静电诱发的心脏病病例。这是因为老年人的皮肤干燥,加上心血管系统老化、抗干扰能力减弱,更易被静电击伤。对于患有心血管疾病的老年人,静电会加重病情或诱发心律失常。过高的静电会使人焦躁不安、头痛、胸闷、呼吸困难、咳嗽。尤其是体质弱的来说,静电还是具有较大的危害,需要在日常加以注意。

  • 荷兰乳牛中老年奶粉一罐喝多久(荷兰乳牛中老年奶粉营养更均衡)

    荷兰乳牛中老年奶粉针对中老年人的身体特征设计的配方,营养更均衡。荷兰乳牛中老年奶粉富含钙,为中老年人的健康增添动力。荷兰乳牛中老年奶粉还含有多维多矿,多种维生素和矿物质,是日常饮食的有益补充硒,可提高机体抗氧化能力,增强免疫力。每天锻炼至少半小时以上,配合每天一杯荷兰乳牛中老年奶粉,让中老年人轻松拥有健康身体。

  • 实习驾驶应该占哪个车道(窄路会车碰到这么一位)

    窄路会车碰到这么一位,拿个实习标志放在车前,这是什么意思呢?

  • 玉龙雪山高原反应注意事项(五个注意事项让你避免高原反应快乐游玩玉龙雪山)

    玉龙雪山高原反应注意事项注意休息。路途很劳累,不要一到云南就去玉龙雪山,要在丽江适应几天,旅行时要保证每天的睡眠时间和质量,不要玩的太晚,如果日程安排较紧,那就抓紧一切时间休息,如坐车的路上。品尝当地特色食品。做好应急准备,提前用红景天,备用速达养,最后备上氧气瓶。吸氧能快速缓解各种高原反应症状。

  • 乱世王者盟主被取代怎么取回(乱世王者盟主玩法)

    下面内容希望能帮助到你,我们来一起看看吧!乱世王者盟主被取代怎么取回取代盟主:当盟主不活跃时,超过2天持续时间不在线,这个时候就是不活跃,可以在联盟里面查看在线时间。48小时不在线,可以被联盟的玩家取代,直接变成别人盟主了。取代条件:需要官员、4阶、3阶玩家,这些玩家可以取代盟主,其他玩家不能进行取代。取代还需要100金币的,这个基本上都有,100金币也不多,拥有一个联盟才是最重要的,自己建造矿产。

  • 常见的设计软件(国产设计软件实操体验)

    相比传统的PS、Sketch本地软件,不需要再去思考文件需要保存在哪个硬盘,其次文件随时都在自动保存,不用担心文件会丢失或损坏。而跟进文件可以对该文件进行全面跟踪,这非常便于协作。即时设计、Mastergo和Pixso均支持多种画板的尺寸,如手机、桌面、平板、平面等。所以在开始作业前,我需要导入自己工作多年的Sketch组件库。

  • 起亚k2后视镜怎么折叠?(起亚k2后视镜怎么折叠起来)

    2、调整左侧后视镜:左侧后视镜在进行上下调整时,把远处的地平线置于中央,左、右位置则调整至车身占据镜面范围的1/4,调整左侧后视镜时,确定好水平线,将水平线放在后视镜的中线位置,然后调整车身占后视镜的面积。