基于VSM模型和数据库技术的文本相似度检查软件研究与实现

在线阅读 下载PDF 导出详情
摘要 向量空间模型(VSM)是信息检索领域应用较好的模型。数据库技术是一门发展成熟、应用广泛的技术。本文提出了利用VSM模型和数据库技术相结合来计算文档相似度。结合TFIDF算法思想,设计一种结合数据库进行计算权重的类TFIDF算法。在此基础上设计出了文档相似度检查软件。该软件主要有文档分词、词频统计、相似度计算三大模块,软件可以计算出文档和其他文档的相似度。
机构地区 不详
出版日期 2014年08月18日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献