汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现

在线阅读 下载PDF 导出详情
摘要 分析了Nutch的语言分析器结构,针对Nutch对中文进行单字切分的不足,结合基于多层隐马模型的汉语词法分析系统ICTCLAS,以JavaCC脚本设计了可扩展的词法分析器,实现了Nutch对中文的词语切分。实验表明,利用JavaCC和ICTCLAS分词系统实现的中文分词完善了Nutch的中文搜索功能。
机构地区 不详
出处 《军械工程学院学报》 2008年5期
出版日期 2008年05月15日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献