简介:以我们在现实生活当中处理数据库的经验来看,为了从数据库中使用限制性的信息抽取方法得到有用的数据和信息,我们有必要使用"特点子集选择"的方法(FeatureSubsetSelection).而这种方法需要从多个相关的属性当中进行多次的试验从而找到某种特定的子集.在这种情况下,如何能够找到快速的、准确的同时又是简便的选择算法变得越来越关键.这篇文章对由Dr.RobertHoltes提出的"One-R"算法进行了适当的改进,通过"Chi"氏独立性检验和拜亚(BayesDecisionTheory)公式推导出的新方法,在试验的基础上表明,这种新的算法在某种程度上比原来的"One-R"算法要准确.
简介:传统的关联规则Apriori算法在产生频繁项集的过程中,需要多次扫描事务数据库以及多次扫描频繁项集,从而造成算法性能下降.为了减少扫描事务数据库以及频繁项集的次数,在生成的候选k项集中,除了存储项集item-set以及支持度计数count之外,加入事务标识符列表Tidlist属性,在生成频繁k项集时,可以直接通过Tid-list的交集得出事务标识符列表以及项集的计数,不需要去扫描事务数据库,从而可以有效地提高算法的性能.文中提出了一种改进的关联规则挖掘模型以及关联规则挖掘算法I-Apriori算法.实验证明,I-Apriori算法相比Apriori算法的执行时间有明显改进.
简介:摘要:近年来,社会 的发展迅速,我国的电力行业的发展也有了很大的改善。 中国已进入经济新常态时代,电力公司需要回归企业经营的本质。中国电力企业联合会发布的《 2015年 1-6月份电力工业运行简况》中指出,今年上半年,全国全社会用电量同比增长 1.3%,创 35年来新低。公司售电量增幅下降,电费回收难度增大,当前公司面临的经营风险和压力加大。未来,电力公司需要更进一步回归企业经营的本质,电力营销在强化市场拓展、维系大客户关系、提升自身竞争力等方面的工作将成为当前及未来的重点任务之一。因此在互联网时代,客户对服务的质量、服务的便捷性、服务的效率、信息的透明、服务的精准等均提出了更高的要求。因此本文主要从营销大数据客户服务监控这个角度出发,针对客户的所需所求所关心的要点,通过大数据进行分析,从而为客户提供精准的需求,避免资源重叠浪费。