训练样本分布不均的KNN分类改进算法

在线阅读 下载PDF 导出详情
摘要 摘要院分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。KNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用,但是这种方法在训练样本的分布不均匀时会造成分类准确率的下降。针对KNN方法存在的这个问题,本文提出了一种基于相对距离的KNN分类方法,这种方法减少了边界点处测试样本的误判。实验结果显示,这种方法具有很好的性能。
出处 《价值工程》 2014年1期
出版日期 2014年01月11日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献