YuleZhang/Dimension_Reduction_Alo

总结

这次算法设计持续了六天，遇到了很多问题，在这里简单总结一下

图片的表示

重复读了几次PPT中约化密度矩阵的表示方式，但始终觉得图片的表示很令人困惑。PPT前面说到图片是四维张量，即（样本数，长度，宽度，通道数RGB）这一点是毋庸置疑的。然而算法中确将一个图片的像素想像成了一个一位列表，这就不可避免的给图片的表示带来了很大的难题。算法中将二维图片（m,n）flatten到一维（m*n），从而构造出算法输入，但这样处理数据忽略了图像像素间的关联性。然而这还不够，

算法设计

首先是在根据论文设计算法时，由于首次尝试理解并实现这些算法，确实有一些吃力，并且在实现过程中，经常会忽略掉一些算法细节，没有搞清返回值，差了很多的论文资料才得以实现算法

算法应用于ORL数据集

在应用的时候又发现了一些问题，其中比较棘手的是图像数据经过不同算法的处理之后维度和特征(极大、极小、平均等)都会发生变化，在整体进行训练时，要保证前后算法的数据输入输出相互兼容。

并且实验并没有得到与论文完全一致的结果，因此采用了网格搜索的方式来寻找最佳参数组合，以尽可能地接近预期。搜索的参数包括neighbors、sigma、gamma等，最终经过几批的训练，确实使得算法的准确率达到了90%以上的高度，但是其泛化能力、适用能力还有待提高。

结语

总的来说，还是对这些算法不太熟悉，没有完全吃透。另外我发现，即使用google搜索，找到的关于这方面的资料也并不多，而且大多数实验结果都一致(怀疑大部分都是搬运工)，最后还是具体的算法论文帮了我很多，要养成看论文的习惯。

好文章记录

YuleZhang / Dimension_Reduction_Alo

总结

About

Languages