基于MapReduce的分块压缩矩阵Apriori的并行化研究

在线阅读 下载PDF 导出详情
摘要 针对经典的Apriori算法需要多次扫描数据库,不适合大规模数据这个问题,提出了一种改进的Apriori算法.该算法采用布尔向量关系运算思想,将事务数据库扫描后转化成压缩矩阵,在MapReduce框架下将压缩矩阵进行分块,每块分别被做并列式处理.利用分压缩矩阵快速计算所有的候选项集,从中产生频繁K-项集,降低了Apriori算法的时间复杂度.
机构地区 不详
出版日期 2015年04月14日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献