简介:摘要结合人工神经网络领域的理论成果,量化描述大脑处理信息的过程,分析大脑各生化参数、生理机制对具体信息存储、信息提取的影响,将有助于进一步理解大脑的工作原理。本文介绍了一个量化描述大脑信息存储、信息提取的思路,并结合结构风险最小化原理,分析说明大脑在具体信息处理过程中存在样本量和网络规模匹配的问题。在量化模型的帮助下,可以看到,血液循环的时序控制作用、语言机制等能和大脑的生化参数相互配合,实现如下几点,从而使大脑能对不同信息处理组织起相对独立规模受控的子网络,降低结构风险,准确而高效的处理信息1在处理特定信息的时候,相关网络中细胞的兴奋程度足够大,并且能维持足够长的兴奋时间2在处理特定信息的时候,无关网络中细胞的兴奋程度足够小3兴奋程度大小和时间长短不同造成连接改变程度差异,改变程度差异参数和遗忘机制的参数能相互配合4在实现差异的基础上,又能保证生化环境的稳定,使信息提取时输入神经网络的样本不和训练样本差别过大5子网络的组织有一定的稳定性和灵活性。
简介:目的本研究探索中文消费者健康词表的构建方法;研究利用Word2vec构建消费者体检健康词表的可行性和合理性。方法抓取天涯医院的信息作为语料,使用结巴分词进行中文分词处理,使用Word2vec构造词向量模型,从而形成消费者体检词表。最后,使用预测准确率、准确率、召回率评价指标对词向量的模型效果进行评估。结果消费者体检健康词表包含了74个种子词、137个消费者用词。候选词的准确率为94.71%,召回率为51.27%,F1值为0.33,74个种子词形成的候选词中前3个词为同义词的预测准确率为60.81%。结论本研究验证了Word2vec在识别消费者用词方面的强大能力,利用Word2vec技术可以用来开发中文消费者健康词表。我们发现,Word2vec自动生成的候选消费者词列表质量不足以生成消费者健康词表,但是能作为人工审核构建的重要参考,为开发完整的中文CHV奠定了坚实的基础。