简介:云计算中的群集计算应用程序(例如MapReduce和面向用户的应用程序)具有应用程序级别的需求,因此需要有高级别的抽象来表示这些应用程序的需求.协流(coflow)是一个网络级别的抽象,用来表达数据并行编程范例的通信要求.协流使应用程序更容易地将其通信语义传达给网络,从而使网络能够优化常见的通信模式.然而,现有的协流识别方案依赖于修改应用程序,并不适用于多数实际场景.提出了基于增量聚类的协流识别策略,采用增量聚类算法来执行快速、透明的协流识别,实现了协流识别的自动化,同时无需对应用进行修改.仿真实验结果显示,本文的识别算法具有超过90%的准确率,具有一定的鲁棒性.
简介:目的探讨人脑星形细胞瘤发生发展中相关基因及分类特征基因的表达。方法用含13939种人基因的BioStarH140S芯片,以正常脑及18例胶质瘤组织总RNA制备的探针杂交芯片,ScanArray4000扫描信号,提取脑及不同级别星形细胞瘤的差异基因并行生物信息分析,Hierarchical聚类提取差异基因的特征。结果星形细胞瘤中筛选出438条(3.14%)差异表达基因;信息分析与细胞信号、细胞骨架和运动、癌基因及抑癌基因等多类基因密切相关;与分类相关的特征基因有MAP7、DBCCR1、PCDHA5、KCNAB1、NAPIL2等。表达谱将星形细胞瘤分成两类,与临床组织病理分类基本一致。结论芯片是基因分析和筛选肿瘤标志性基因的有效手段,可客观分析星形细胞瘤发展及预后;分类特征基因为星形细胞瘤侵袭性和预后判断提供依据,有助于临床诊治。
简介:k均值算法是一个常用的局部搜索算法,它的主要缺陷是容易陷入局部极小,并且该局部极小解与全局最优解往往有很大的偏差.本文提出一个基于K-均值的迭代局部搜索文档聚类算法.该算法以k均值算法所得到的解作为初始解,从该初始解开始作局部搜索,在搜索过程中接受部分劣解.当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围.实验结果表明该算法对文档数据集聚类的正确性达99%以上.
简介:摘要: 现如今,人们的生活质量在不断提高,对于电力的需求在不断加大, 针对电力大数据流的异常检测问题,该文将流数据聚类算法与电力大数据相结合,针对现有流数据聚类算法不易存储全部数据、断电数据易丢失等问题,以及流数据聚类算法对于离线阶段聚类算法实时应答的要求,从数据的完整性、安全性以及流数据聚类算法的低时间复杂度的角度出发,对 CluStream 流数据聚类算法进行改进,提出流式 K-means 聚类算法。对在线阶段,使用 Redis 集群进行流数据的缓冲,并设计节点时间衰减策略,增大心跳消息中有效消息所占比例;对离线阶段聚类算法进行优化,使用最佳距离法确定初始聚类中心,减少迭代次数;最后,使用所提出的流式 K-means 聚类算法进行用户用电异常行为检测,实验结果表明,该算法能够很好的发现用户用电异常行为。
简介:对于多属性群决策中专家权重确定的问题,本文提出了基于聚类的专家权重确定方法,将专家权重分为类别间权重和类别内权重,对专家聚类步骤和类别间权重的计算方法进行了改进。通过专家给出的判断矩阵构建相容度矩阵,利用系统聚类原理,对相容度矩阵进行聚类,得到最大相容度谱系图。通过最大相容度间的距离和给定阈值的比较,对专家进行恰当分类,从而避免了根据现有研究步骤只能将专家分为两类的不足。此外,在确定类别间权重时,除继续对类容量较大的类赋予较大的类别间权重系数外,还引入专家判断矩阵的属性权重一致性来反映类别间的差异,从而有效避免了当某几类专家中含有相等数目专家时,赋予这几类专家相同类别间权重系数的问题。所提方法结构清晰、计算简便,并使得专家权重计算结果更为合理准确。最后运用一个算例对比验证了该方法的可行性和有效性。
简介:摘要目的基于系统聚类思想,探索对方剂按照类似于类方分类的方法进行分类的实现方式。方法选取《皕一选方治验实录》收录的581首方剂,规范药物名称,录入Microsoft Excel 2007,导入SPSS 24.0,利用系统聚类功能生成谱系图,分析581首优选古方的分类情况。结果通过反复聚类可把581首方剂分为86类,最多的一组有29个方剂,最少的一组有2个方剂,平均每组约6.75个方剂,总体上呈现出越晚截取的组其内部方剂的相似性越低。结论本方法可实现对方剂按照类似于类方分类的方法进行分类,可能有助于打破原有的思维束缚,进一步加深对方剂配伍规律的认识,但在分析方剂相互间的配伍规律时会减少理论线索,且未专门考虑方剂中药物的药量及性味归经问题。