简介:摘要:针对目前市场上已有的桌面文件整理软件不够智能化,不能根据文件文本信息进行分类的问题,根据文件的标题和文本内容,开发出了一款基于凝聚层次聚类和词袋模型 分类的智能化桌面文件整理软件。聚类算法适用于用户使用初期零散文件较多的情况,将散乱的桌面文件自动划分为不同的类别,并整理成对应的文件夹;分类算法适用于用户后期零散文件继续增加的情况,将各文件匹配到对应文件夹。实验结果表明,在短文本,且样本数量较少的情况下,上述算法能很好地对桌面文件进行类别的划分,聚类和分类的准确率分别达到了90%和86.77%。该软件能很好地解决桌面文件整理问题。
简介:摘要: 现如今,人们的生活质量在不断提高,对于电力的需求在不断加大, 针对电力大数据流的异常检测问题,该文将流数据聚类算法与电力大数据相结合,针对现有流数据聚类算法不易存储全部数据、断电数据易丢失等问题,以及流数据聚类算法对于离线阶段聚类算法实时应答的要求,从数据的完整性、安全性以及流数据聚类算法的低时间复杂度的角度出发,对 CluStream 流数据聚类算法进行改进,提出流式 K-means 聚类算法。对在线阶段,使用 Redis 集群进行流数据的缓冲,并设计节点时间衰减策略,增大心跳消息中有效消息所占比例;对离线阶段聚类算法进行优化,使用最佳距离法确定初始聚类中心,减少迭代次数;最后,使用所提出的流式 K-means 聚类算法进行用户用电异常行为检测,实验结果表明,该算法能够很好的发现用户用电异常行为。
简介:摘要:医学图像具有灰度分辨率高、图像相似度大、分类多的特点。如何从大量的医学图像中高效、准确地检索出所需的图像仍然是一个难题。目前的医学图像检索系统还存在检索准确率低问题。为了提高医学图像检索性能,提出了一种基于CenterVLAD聚类特征的医学图像检索技术。通过对医学图像检索相关算法的研究,简要介绍了医学图像检索的背景,分析了基于CenterVLAD聚类特征的医学图像检索技术。提出了一种基于CenterVLAD聚类特征技术的解决方案。基于上述算法,我们自主开发了一个医学图像检索系统。该系统实现了图像预处理、图像检索和图像查看功能,可用于辅助医生检索类似病例的图像。
简介:摘要:随着水利工程大力兴建,所遇工程问题越来越多,边坡变形及稳定性问题出现的概率也越来越大。依据边坡变形海量资料,应用K-Means聚类法,进行边坡变形时空演化规律研究,建立了基于位移和位移速率两指标控制的边坡变形时空演化特征,很好地揭示了边坡变形动态区域和演化特征,可为类似边坡变形提供参考和借鉴。
简介:摘 要 : 目的 对植物纤维 - 三聚氰胺类 餐厨具中甲醛迁移量影响因素进行分析。 方法 采用三种后处理方法分别是: 1 温水浸泡 2 、喷涂食用油 3 、喷涂聚酯图层,按欧盟 EU10/2011 标准对制品进行甲醛单体迁移量检测,评估三种后处理方 植物纤维 - 三聚氰胺类 餐厨具安全性的作用。 结论 植物纤维 - 三聚氰胺类 餐厨具(杯、小碗、大碗)中的甲醛在不同模拟条件下易迁移 , 后处理效果最佳的为喷涂聚酯图层,但喷该图层于食品容器上可大大降低甲醛迁移量,但也将有可能出现多环芳香烃( PAH )迁移风险。
简介:摘要:在近红外和中红外光谱照射下的中药材所呈现的光谱特性可以用来鉴别中药材的种类和产地。运用系统聚类分析和逐步判别分析算法,该模型对中草药种类与产地做了鉴别性研究,能简单、快速地得到的结果且较为合理。