本项目提供一种判别药材产地的方法,采用近红外检测技术采集不同产地中药材的漫发射光谱,而在近红外红外数据中,它们的主要特征有高维、谱带重叠等,我们首先使用主成分分析法(PCA)将这些数据进行降维处理,在这之后再使用无监督学习方法里面的K均值算法及DBSCAN算法,将得到的药材的光谱数据进行聚类划分,进行完这个操作之后得到的结果也就是对于不同的药材产地的判别结果。
对于年份的预测,从原始数据不同年份里抽出80个样本作为训练样本(即已知数据及其对应的输出),年份则为其输出。对于剩下的70个原始数据即未知类别数据,通过监督学习中的K近邻算法(KNN)及支持向量机(SVM)算法以此来达到对未知类别数据的输出的目的。
MATLAB2018以上。