学科分类
/ 25
500 个结果
  • 简介:影响矿井煤炭自燃的因素包括煤炭自燃倾向性、地质条件、开采技术条件,煤炭自燃预测是一个模糊系统。应用模糊聚类分析法,将一定数量煤矿自燃信息作为样本进行聚类分析,可以得到煤层自燃危险程度模式,预测待开采煤层的自燃危险程度。

  • 标签: 煤炭自燃 预测 模糊聚类法
  • 简介:云计算中的群集计算应用程序(例如MapReduce和面向用户的应用程序)具有应用程序级别的需求,因此需要有高级别的抽象来表示这些应用程序的需求.协流(coflow)是一个网络级别的抽象,用来表达数据并行编程范例的通信要求.协流使应用程序更容易地将其通信语义传达给网络,从而使网络能够优化常见的通信模式.然而,现有的协流识别方案依赖于修改应用程序,并不适用于多数实际场景.提出了基于增量的协流识别策略,采用增量算法来执行快速、透明的协流识别,实现了协流识别的自动化,同时无需对应用进行修改.仿真实验结果显示,本文的识别算法具有超过90%的准确率,具有一定的鲁棒性.

  • 标签: 数据中心网络 协流 增量聚类
  • 简介:目的探讨人脑星形细胞瘤发生发展中相关基因及分类特征基因的表达。方法用含13939种人基因的BioStarH140S芯片,以正常脑及18例胶质瘤组织总RNA制备的探针杂交芯片,ScanArray4000扫描信号,提取脑及不同级别星形细胞瘤的差异基因并行生物信息分析,Hierarchical提取差异基因的特征。结果星形细胞瘤中筛选出438条(3.14%)差异表达基因;信息分析与细胞信号、细胞骨架和运动、癌基因及抑癌基因等多基因密切相关;与分类相关的特征基因有MAP7、DBCCR1、PCDHA5、KCNAB1、NAPIL2等。表达谱将星形细胞瘤分成两,与临床组织病理分类基本一致。结论芯片是基因分析和筛选肿瘤标志性基因的有效手段,可客观分析星形细胞瘤发展及预后;分类特征基因为星形细胞瘤侵袭性和预后判断提供依据,有助于临床诊治。

  • 标签: 星形细胞瘤 基因芯片 表达谱 Hierarchical聚类
  • 简介:针对传统算法中存在的较易陷入局部最优解等问题,在传统的K均值算法中引入了遗传算法和模拟退火算法,将两种算法相结合,通过交叉、变异、模拟退火等操作,实现了聚类分析。通过模拟数据集的实验和UCI数据集的实验验证了算法的稳定性和获取全局最优解特性。

  • 标签: 聚类 模拟退火 遗传算法
  • 简介:k均值算法是一个常用的局部搜索算法,它的主要缺陷是容易陷入局部极小,并且该局部极小解与全局最优解往往有很大的偏差.本文提出一个基于K-均值的迭代局部搜索文档算法.该算法以k均值算法所得到的解作为初始解,从该初始解开始作局部搜索,在搜索过程中接受部分劣解.当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围.实验结果表明该算法对文档数据集聚的正确性达99%以上.

  • 标签: K-均值 迭代局部搜索文档聚类算法 局部极小解 全局最优解 数据库
  • 简介:本文运用模糊聚类分析法,根据供应商的交货可靠度、产品质量和产品价格这三个评价指标对多家供应商进行分析,将供应商大体上分为几类,以便选择出适合企业的供应商。最后用实际算例对本文方法进行了分析说明。

  • 标签: 供应商选择 模糊聚类法 交货可靠度 产品质量 产品价格
  • 简介:摘要: 现如今,人们的生活质量在不断提高,对于电力的需求在不断加大, 针对电力大数据流的异常检测问题,该文将流数据算法与电力大数据相结合,针对现有流数据算法不易存储全部数据、断电数据易丢失等问题,以及流数据算法对于离线阶段算法实时应答的要求,从数据的完整性、安全性以及流数据算法的低时间复杂度的角度出发,对 CluStream 流数据算法进行改进,提出流式 K-means 算法。对在线阶段,使用 Redis 集群进行流数据的缓冲,并设计节点时间衰减策略,增大心跳消息中有效消息所占比例;对离线阶段算法进行优化,使用最佳距离法确定初始中心,减少迭代次数;最后,使用所提出的流式 K-means 算法进行用户用电异常行为检测,实验结果表明,该算法能够很好的发现用户用电异常行为。

  • 标签: 电力大数据 流数据聚类 流式 K-means聚类 用户用电异常
  • 简介:由于工具书编纂队伍庞大,工作流程上又多头并进,所以工具书编纂过程中难免会出现内容交叉重复问题。为了减少工具书查重的工作量,文章提出了一种基于文本的查重方法。试验表明,分层算法可用于大型工具书词条查重工作,它对工具书编纂中解决词条交叉重复问题是有效的。

  • 标签: 文本聚类 特征词 交叉重复 工具书查重
  • 简介:针对采用经典划分思想的算法以一个点来代表的局限,提出一种基于泛化中心的分类属性数据算法。该算法通过定义包含多个点的泛化中心来代表,能够体现出的数据分布特征,并进一步提出泛化中心距离及间距离度量的新方法,给出泛化中心的确定方法及基于泛化中心进行对象到分配的策略,一般只需一次划分迭代就能得到最终结果。将泛化中心算法应用到四个基准数据集,并与著名的划分算法K-modes及其两种改进算法进行比较,结果表明泛化中心算法正确率更高,迭代次数更少,是有效可行的。

  • 标签: 聚类算法 泛化中心 分类属性 K-modes
  • 简介:简述了编组站分类问题的研究现状以及编组站的类别,介绍了运用K均值对编组站进行分类的主要步骤。将该方法应用到东北地区11个编组站分类的实例中,在计算过程中,使用SPSS16统计学软件,计算结果表明分类正确,证明该方法可行,具有人为因素影响小、计算持续时间短及结果较精确等特点。

  • 标签: 铁路 编组站分类 K均值聚类法
  • 简介:对于多属性群决策中专家权重确定的问题,本文提出了基于的专家权重确定方法,将专家权重分为类别间权重和类别内权重,对专家步骤和类别间权重的计算方法进行了改进。通过专家给出的判断矩阵构建相容度矩阵,利用系统原理,对相容度矩阵进行,得到最大相容度谱系图。通过最大相容度间的距离和给定阈值的比较,对专家进行恰当分类,从而避免了根据现有研究步骤只能将专家分为两的不足。此外,在确定类别间权重时,除继续对容量较大的赋予较大的类别间权重系数外,还引入专家判断矩阵的属性权重一致性来反映类别间的差异,从而有效避免了当某几类专家中含有相等数目专家时,赋予这几类专家相同类别间权重系数的问题。所提方法结构清晰、计算简便,并使得专家权重计算结果更为合理准确。最后运用一个算例对比验证了该方法的可行性和有效性。

  • 标签: 决策科学 多属性群决策 专家权重 聚类分析 判断矩阵
  • 简介:传统的搜索引擎所提供的搜索结果仅仅是按照Web与查询的相关性从高到低排成一个有序列表,不具备层次性。用户使用起来并不方便。文章通过采用覆盖算法对搜索引擎的结果进行来解决这个问题,并对其实现过程进行较为详细的描述。

  • 标签: WEB 信息检索 搜索引擎 覆盖聚类算法
  • 简介:摘要分析了C油田A二油层驱注后期含水回升期存在的主要问题,即聚合物突破后,层间矛盾加剧,薄差层动用程度差,加之聚合物的清污混注,使区块含水上升过快,目前综合含水达到94.8%,并制订实施综合调整措施,含水回升速度得到控制,区块开发效果明显改善。

  • 标签: 二类油层 注聚后期 含水上升
  • 简介:摘要:计算机和互联网的普及,使得电力部门累积了大量的数据信息,这些数据信息记录着供电企业的运行状况以及客户信息,利用大数据和云计算可以做到算法,实现对大客户用电行为的分析,有利于更好地为大客户提供个性化电力服务需求,使供电企业在竞争激烈的市场环境中立于不败之地。

  • 标签: 聚类算法 电力大客户 行为分析
  • 简介:摘要 大数据时代下推文的推荐模型能够快速有效的筛选出适合于不同用户的数据信息。类比电商平台常用的推荐系统与搜索引擎使用的页面推荐算法,量化文字信息使得将数据带入推荐系统成为可能,构建推文之间的拓扑关系图建立推文-推文、用户-用户之间的关系群,进而使用模糊-协同过滤算法提供基于推文或基于用户的推文推荐算法。

  • 标签: 层次分析法 PageRank 模糊聚类 协同过滤推荐
  • 简介:摘要:地市供电公司通过归类分析进而准确、快速、有效地发掘用户侧需求响应潜力是缓解高峰时期供电压力和保障电网安全运行的重要举措。用电负荷在电力需求侧响应中具有重要作用,可以帮助实现电力系统的优化调度、提高能源利用效率和促进电力市场的健康发展。本文结合面向电力需求侧响应的用电负荷策略进行研究,以供参考。

  • 标签: 面向电力需求 侧响应 用电负荷聚类 策略
  • 简介:摘要目的基于系统思想,探索对方剂按照类似于方分类的方法进行分类的实现方式。方法选取《皕一选方治验实录》收录的581首方剂,规范药物名称,录入Microsoft Excel 2007,导入SPSS 24.0,利用系统功能生成谱系图,分析581首优选古方的分类情况。结果通过反复可把581首方剂分为86,最多的一组有29个方剂,最少的一组有2个方剂,平均每组约6.75个方剂,总体上呈现出越晚截取的组其内部方剂的相似性越低。结论本方法可实现对方剂按照类似于方分类的方法进行分类,可能有助于打破原有的思维束缚,进一步加深对方剂配伍规律的认识,但在分析方剂相互间的配伍规律时会减少理论线索,且未专门考虑方剂中药物的药量及性味归经问题。

  • 标签: 聚类分析 系统聚类 方剂 分类 类方 《皕一选方治验实录》
  • 简介:采用模糊思想与方法,对大学生体质健康测试数据进行分析,从庞杂的数据中获取有价值的信息,建立学生体质健康状况评价模块,用以帮助教师及学生更好的了解学生的体质状态,选择锻炼方法,提高学生健康质量。本文以5000名在校大学生的体质健康测试数据为案例,应用模糊方法对数据进行处理分析,得到了各类的语意解释,从而量化的评价了学生体质健康情况。

  • 标签: 体质健康 模糊聚类
  • 简介:通过研究视频汉字识别问题,提出了关于视频中汉字跟踪及分割算法。首先,提取视频样本特征,采用K均值算法进行作为第1次分类,之后,采用多个BP(backpropagation)神经网络进一步细分一次分类后的结果作为二次分类。最后,对以上算法进行了实验验证,结果证明这些算法是有效的,多层分类器较单一的BP神经网络分类器识别率更高。

  • 标签: 汉字分割 汉字跟踪 K均值聚类 BP神经网络