高考考试网
当前位置: 首页 高考资讯

深度学习超大型矩阵求逆(机器学习SVD矩阵分解算法)

时间:2023-07-04 作者: 小编 阅读量: 4 栏目名: 高考资讯

今天是机器学习专题第28篇文章,我们来聊聊SVD算法。因此广泛利用在各个领域当中,例如信号处理、金融领域、统计领域。所以目前流行的PCA几乎都是以SVD为底层机制实现的,比如sklearn库中的PCA工具就是用的SVD。由于SVD可以实现并行化计算,使得在实际当中它更受欢迎。但SVD也不是万能的,它一个很大的缺点就是和PCA一样解释性很差,我们无法得知某些值或者是某些现象的原因。

今天是机器学习专题第28篇文章,我们来聊聊SVD算法。

SVD的英文全称是Singular Value Decomposition,翻译过来是奇异值分解。这其实是一种线性代数算法,用来对矩阵进行拆分。拆分之后可以提取出关键信息,从而降低原数据的规模。因此广泛利用在各个领域当中,例如信号处理、金融领域、统计领域。在机器学习当中也有很多领域用到了这个算法,比如推荐系统、搜索引擎以及数据压缩等等。

SVD简介

我们假设原始数据集矩阵D是一个mxn的矩阵,那么利用SVD算法,我们可以将它分解成三个部分:

这三个矩阵当中U是一个m x n的矩阵,∑是一个m x n的对角矩阵,除了对角元素全为0,对角元素为该矩阵的奇异值。V是一个n x n的矩阵。U和V都是矩阵,即满足U^TU = I, V^T V = I。也就是它乘上它的转置等于单位对角矩阵。

我们可以看下下图,从直观上感知一下这三个矩阵。

下面我们来简单推导一下SVD的求解过程,看起来很复杂,概念也不少,但是真正求解起来却并不难。会需要用到矩阵特征值分解的相关概念,如果不熟悉的同学可以先看下线性代数专题相关内容做个回顾:

线性代数精华——讲透矩阵的初等变换与矩阵的秩

首先,如果我们计算A^TA可以得到一个n x n的方阵。对于方阵我们可以对它进行特征分解,假设得到特征值是lambda_i,特征向量是v_i,代入特征值的性质可以得到:

这样的特征值和特征向量一共会有n个,我们把它所有的特征向量组合在一起,可以得到一个n x n的矩阵V。它也就是我们SVD分解结果之后的V,所以有些书上会把它叫做右奇异向量。

同理,我们计算AA^T可以得到一个m x m的方阵,我们同样可以对进行特征值分解,得到一个特征矩阵U。U应该是一个m x m的矩阵,也就是SVD公式中的U,我们可以将它称为A的左奇异向量。

U和V都有了,我们只剩下∑还没求出来了。由于它是一个对角矩阵,除了对角元素全为0,所以我们只需要求出它当中的每一个对角元素,也就是奇异值就可以了,我们假设奇异值是 σ,我们对SVD的式子进行变形:

这个推导当中利用了V是酉矩阵的性质,所以我们乘上了V将它消除,就推导得到了奇异值的公式,∑矩阵也就不难求了。

整个推导的过程不难,但是有一个问题没解决,为什么AA^T的特征矩阵就是SVD中的U矩阵了,原理是什么?这一步是怎么推导来的?说实话我也不知道天才数学家们这一步是怎么推导得到的,我实在脑补不出来当时经过了怎样的思考才得到了这个结果,但是想要证明它是正确的倒不难。

这里也同样利用了酉矩阵的性质,还有对角矩阵乘法的性质。我们可以看出来,U的确是AA^T特征向量组成的矩阵,同样也可以证明V。其实如果眼尖一点还可以发现特征值矩阵等于奇异值矩阵的平方,所以

所以,我们求解∑矩阵可以不用很麻烦地通过矩阵去计算,而是可以通过AA^T的特征值取平方根来求了。

SVD的用途

我们推导了这么多公式,那么这个SVD算法究竟有什么用呢?

看来看去好像看不出什么用途,因为我们把一个矩阵变成了三个,这三个矩阵的规模也并没有降低,反而增加了。但是如果去研究一下分解出来的奇异值,会发现奇异值降低的特别快。只要10%甚至是1%的奇异值就占据了全部奇异值之和的99%以上的比例。

换句话说,我们并不需要完整的SVD分解结果,而是只需要筛选出其中很少的k个奇异值,和对应的左右奇异向量就可以近似描述原矩阵了。

我们看下下图,相当于我们从分解出来的矩阵当中筛选一小部分来代替整体,并且保留和整体近似的信息。

我们把式子写出来:

这里的k远小于n,所以我们可以大大降低SVD分解之后得到的矩阵参数的数量。

也就是说,我们通过SVD分解,将一个m x n的大矩阵,分解成了三个小得多的小矩阵。并且通过这三个小矩阵,我们可以还原出原矩阵大部分的信息。不知道大家有没有想到什么?是了,这个和我们之前介绍的PCA算法如出一辙。不仅思路相似,就连计算的过程也重合度非常高,实际上PCA算法的求解方法之一就是通过SVD矩阵分解。

SVD与PCA

我们来简单看看SVD和PCA之间的关联。

首先复习一下PCA算法,我们首先计算出原始数据的协方差矩阵X,再对X^TX进行矩阵分解,找到最大的K个特征值。然后用这K个特征值对应的特征向量组成的矩阵来对原始数据做矩阵变换。

在这个过程当中,我们需要计算X^TX,当X的规模很大的时候,这个计算开销也是很大的。注意到我们在计算SVD中V矩阵的时候,也用到了A^TA矩阵的特征值分解。然而关键是一些计算SVD的算法可以不先求出协方差矩阵X^TX也能得到V,就绕开了这个开销很大的步骤。

所以目前流行的PCA几乎都是以SVD为底层机制实现的,比如sklearn库中的PCA工具就是用的SVD。

代码实现

关于SVD算法我们并不需要自己实现,因为numpy当中封装了现成的SVD分解方法

我们直接调用np.linalg.svd接口即能完成矩阵的分解:

这里的Sigma返回的是一个向量,代替了对角矩阵,节省了存储开销。我们可以通过找出最小的K,使得K个奇异值占据整体奇异值95%以上的和。这里可以看到,我们选出了5个奇异值就占据所有奇异值和的99%以上:

总结

我们今天和大家分享了SVD算法的原理,以及一种常规的计算方法。SVD和PCA一样底层都是基于矩阵的线性操作完成的,通过SVD的性质,我们可以对原数据进行压缩和转化。基于这一点,衍生出了许多的算法和应用场景,其中最经典的要属推荐系统中的协同过滤了。由于篇幅限制,我们将会在下一篇文章当中和大家分享这一点,实际了解一下SVD的应用,加深一下理解。

由于SVD可以实现并行化计算,使得在实际当中它更受欢迎。但SVD也不是万能的,它一个很大的缺点就是和PCA一样解释性很差,我们无法得知某些值或者是某些现象的原因。关于这一点,我们也会在下一篇文章当中加以体现。

今天的文章到这里就结束了,如果喜欢本文的话,请来一波素质三连,给我一点支持吧(关注、转发、点赞)。

本文始发于公众号:TechFlow

    推荐阅读
  • 不驰于空想不鹜于虚声什么意思 不骛于虚声不驰于空想什么意思

    “不驰于空想,不鹜于虚声”是李大钊的一句励志名言,说的是不在空想中驰骋,不追求虚浮的名声,着眼现实,一步步改变一步步做;不要追求事物表象的光彩华丽,要脚踏实地地工作。“不驰于空想,不鹜于虚声”的出处是李大钊说:“凡事都要脚踏实地去作,不驰于空想,不骛于虚声,而惟以求真的态度作踏实的工夫。以此态度求学,则真理可明,以此态度做事,则功业可就。”2017年12月31日,国家主席发表了2018年新年贺词。

  • 盒马集市前景分析(盒马集市汇聚社区消费需求)

    5月下旬,羊角蜜甜瓜进入成熟期。山东莘县首批9万斤羊角蜜甜瓜,刚上市即销售一空。今年以前,每到5月收获期,莘县的羊角蜜瓜农便要想尽办法卖瓜。今年3月1日,阿里巴巴设立MMC事业群。3月底,盒马集市来到山东,与当地羊角蜜主产区合作。盒马集市联动大商家,前往农产品产地直采,让瓜农能够直接对接市场、社区和消费者。盒马集市平台一名羊角蜜供应商称。

  • 喝奶茶的说说心情短语(喝奶茶的说说心情短语有哪些)

    以下内容希望对你有帮助!喝奶茶的说说心情短语下午时分,奶茶+音乐很舒服陪你一起逛街,喝奶茶,听音乐。咖啡和奶茶在一起,就成了鸳鸯老板,一杯奶茶。香草、奶茶,果汁,我的童年。奶茶真百搭,一年四季都好喝。你对我有多重要呀就像冬天的厚围巾暖宝宝和暖暖的珍珠原味奶茶奶茶不加珍珠是路遥的口味,不知怎么的我也就跟着习惯了。喜欢的人不出现,出现的人不喜欢,那是奶茶的歌,却唱出了我的生活。

  • 香蕉大批储存方法(香蕉大批储存方法有哪些)

    接下来我们就一起去研究一下吧!香蕉大批储存方法工具/原料:报纸,保鲜膜,绳子。就是用水冲一下晾干用保鲜膜把香蕉的根茎包上。

  • 汽车胎压的标准是多少(看完你就明白了)

    如果满座(5人)的话,胎压调到2.5左右比较适合;一般两人的话,胎压数值在2.3也是正常的。胎压应该打多少以车厂推荐值为准。这是因为胎压的设定主要是考虑到车身的重量、底盘高度等车辆因素。与使用什么品牌的轮胎无必然联系。如果车厂没有特殊规定,在冬季或者夏季是不需要特别调整的。当然建议在测量胎压时最好在常温环境下。

  • 白日放歌须纵酒里的白日什么意思(白日放歌须纵酒原文及译文)

    白日放歌须纵酒里的白日什么意思白日的意思是:白天。出自唐代诗人杜甫的作品《闻官军收河南河北》。此诗被称为杜甫“生平第一快诗”。诗人的思想感情出自胸臆,奔涌直泻。后六句都是对偶,但却明白自然像说话一般,有水到渠成之妙。白日放歌须纵酒,青春作伴好还乡。即从巴峡穿巫峡,便下襄阳向洛阳。快快动身起程巴峡穿过巫峡,我穿过了襄阳后又直奔洛阳。

  • 2022年南宁青秀区小学招生时间安排(2021年南宁市青秀区小学报名时间)

    8月中旬,对进城务工人员随迁子女进行统筹调配,并发放入学通知书。7月下旬,派位成功的学生到所报名的市区民办小学办理学位确认手续,录取完成。如因疫情防控需要调整招生时间的,有关安排将另行通知。

  • 得了扁平疣有什么忌什么(扁平疣的发病症状有啥)

    扁平疣的传染性非常强,建议患者发现症状时尽早治疗。扁平疣症状表现:分散分布、质地柔软、顶部光滑、粟粒至绿豆大、淡褐色的高出皮肤表面的扁平状丘疹,容易传染。早期:1-2年,扁平疣分布面积小,颜色与肤色接近或略显深色。

  • 月季压枝方法(月季怎么压枝条)

    月季压枝方法对月季花压枝需要选择合适的土壤。月季花适合生长在微量元素含量较为丰富、排水性较好的土壤中,所以在对月季花压枝时最好使用营养含量较为丰富、土质较为疏松的沙壤土或者腐殖土,并且在压枝前需要翻新土壤。

  • 烤的牛排怎么加热(牛排加热方法)

    可用平底锅采取再煎制的方法加热,滴入少量油到平底锅,油加热到5成放入牛排,5秒钟翻一次,双面翻动10次即可。将蒸锅水烧开后盘子装入打包的牛排,套上食品袋放入蒸锅,大火蒸3分钟即可,牛排不会水分很重。将打包回来的牛排切成条状或块状,放入炒锅和其他菜一起炒也是很美味的。打包回来的牛排斜刀切成薄片,放入平底锅煎。