YuleZhang / Dimension_Reduction_Alo

一些粗粒化、降维的算法实现

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

总结

这次算法设计持续了六天,遇到了很多问题,在这里简单总结一下

图片的表示

重复读了几次PPT中约化密度矩阵的表示方式,但始终觉得图片的表示很令人困惑。PPT前面说到图片是四维张量,即(样本数,长度,宽度,通道数RGB)这一点是毋庸置疑的。然而算法中确将一个图片的像素想像成了一个一位列表,这就不可避免的给图片的表示带来了很大的难题。算法中将二维图片(m,n)flatten到一维(m*n),从而构造出算法输入,但这样处理数据忽略了图像像素间的关联性。然而这还不够,

算法设计

首先是在根据论文设计算法时,由于首次尝试理解并实现这些算法,确实有一些吃力,并且在实现过程中,经常会忽略掉一些算法细节,没有搞清返回值,差了很多的论文资料才得以实现算法

算法应用于ORL数据集

在应用的时候又发现了一些问题,其中比较棘手的是图像数据经过不同算法的处理之后维度和特征(极大、极小、平均等)都会发生变化,在整体进行训练时,要保证前后算法的数据输入输出相互兼容。

并且实验并没有得到与论文完全一致的结果,因此采用了网格搜索的方式来寻找最佳参数组合,以尽可能地接近预期。搜索的参数包括neighbors、sigma、gamma等,最终经过几批的训练,确实使得算法的准确率达到了90%以上的高度,但是其泛化能力、适用能力还有待提高。

结语

总的来说,还是对这些算法不太熟悉,没有完全吃透。另外我发现,即使用google搜索,找到的关于这方面的资料也并不多,而且大多数实验结果都一致(怀疑大部分都是搬运工),最后还是具体的算法论文帮了我很多,要养成看论文的习惯。

好文章记录

1. 拉普拉斯特征映

2.kernel-pca-原理和演示

3.流形学习

4.KPCA非线性降维与核函数

5.拉普拉斯特征映射

6.拉普拉斯映射论文

About

一些粗粒化、降维的算法实现


Languages

Language:Python 100.0%