学科分类
/ 2
23 个结果
  • 简介:语料库大规模真实语料的汉语句型自动分析与频度统计,是查清现代汉语句型现状的主要途径,也是继汉字字频统计和词频统计之后的又一重大基础性研究课题。本文主要给出以结构特征为标准的句型系统的汉语句型频度表、实验数据与分析、实验模型及其工作原理的简单介绍。

  • 标签: 汉语句型 频度统计 句型成分分析 性质形容词 单音节形容词 趋向动词
  • 简介:本文通过介绍和评论基于统计的语言处理模型的工作原理和有关的应用实例,从语言学理论的角度来说明统计模型的局限性。通过讨论N元语法模型及其在词类标注上的应用,展示基于统计的语言处理模型的工作原理及其应用。讨论了语言结构的递归性特点和语言学知识的结构依赖性特点,指出递归嵌入会使得统计规律被任意数目的嵌入词语打乱,语言学知识的结构依赖性将使得统计模型赖以实现的独立性假设失效。

  • 标签: 统计模型 有限状态语法 马尔科夫过程 递归性 结构依赖性
  • 简介:模糊逻辑模型和交股模型是心理语言学有关言语感知研究中解释言语听辨机制的重要模型理论。模糊逻辑模型运用模糊逻辑和原型的两个概念生动明确地描述了言语听辨的过程和言语在记忆中的储存情况。交股模型将各个层面的因素及影响都包括在言语听辨的过程中。然而,这两个模型也有各自的局限性。模糊逻辑模型主要强调语音因素的作用,而交股模型则误将听辨过程看作是去除交股中与目标词不相似词的过程。本文通过对两个模型局限性的解析,将二者的优点重组,以寻找一种更为合理地解释言语听辨过程的新途径。

  • 标签: 模糊逻辑模型 交股模型 心理语言学 言语感知研究 言语听辨机制 局限性
  • 简介:对目前音韵学中所用的统计方法进行了全面的比较,分析了统计法在音韵研究中的必要性和可行性,强调了统计法的科学性,并从统计学原理、方法的引入、运用中的注意事项和统计法在音韵学运用中的优势和不足等方面对三种统计方法进行了详细的阐述。

  • 标签: 方法论 概率论 音韵学 统计
  • 简介:中文姓名的辨识是自动分词、自动文摘的基础.独立于自动分词,我们运用姓名用字概率和规则,设计并实现了一个中文姓名辨识系统.对207757字语料进行了测试,召回率达到92.57%,精确率达到80.35%,且速度较快.

  • 标签: 概率分布 规则筛选 兼类姓 专有人名 特殊候选姓名对
  • 简介:事件演化即事件在篇章中依次变化,是篇章推进的主要手段。结合物性结构理论,同一话题下与不同话题间事件演化可构建出一套语义模型,该语义模型着重刻画事件间基于词汇语义的内部语义联系,并说明物性结构与题元结构的协同作用对事件演化提供的语义触发动力与制约机制。

  • 标签: 事件演化 物性结构 题元角色 语义模型
  • 简介:常用字字量问题是汉字规范首先要解决的问题之一。本文探讨在不同条件下确定的不同字表,是否可以用统计学的假设检验方法,对这些字表的出现概率进行比较,以字表在实际应用中概率的高低来评价其应用效果的大小。经过实际运算,得出了调整后的《规范汉字表》常用字表在应用中的概率高于原3500常用字表的结论。由此证明《规范汉字表》确定的常用字表是合理的、优化的。

  • 标签: 常用字 规范汉字表 累积频率 统计方法
  • 简介:《黄州竹楼记》中的"茶烟"一词,各家注释众说纷纭,各种辞书均未立条解释.为此,本文通过对《全唐诗》、《全宋词》的全文机器检索,发现"茶烟"共有43例之多,除不成词者外,少数是指焙茶或"烹茶炉火的烟气"、"煮茶的烟火",更多的则是指茶水热汽.

  • 标签: 茶烟 《全唐诗》 《全宋词》 全文检索 茶水热汽
  • 简介:摘要目前小学生的数学学习处于初步阶段,各项思维能力都还未成熟,数学思想模型融入小学教学,不仅仅能提高小学生的解题速度,更有利于提高小学生对数学问题的深刻认识。因此,加强对数学建模思想的研究,有利于普遍提高小学生的思维能力的建构,符合新课改背景下对教学的要求。本文对数学模型在小学领域的具体实施进行了探讨,为小学数学质量的提高提供些许建议。

  • 标签: 小学数学 模型思想 模型构建
  • 简介:文章在对比典型博弈过程和歧义结构产生与消解过程的基础上,提出了一个结构歧义的博弈论模型。这个模型运用博弈论的思想和方法描述结构歧义产生及其消除过程,为歧义消解提供一种新的思路和方法。歧义消解的实例表明这种观点对我们理解和分析歧义的消解过程,提供了有益的帮助。

  • 标签: 结构歧义 消歧 博弈论 策略
  • 简介:文章基于知识组织理论,提出了术语词典知识表示的基本模型,作为术语词典编纂系统的知识框架。对术语词典辅助编纂的系统架构进行设计,分解为三个核心功能模块,将基于语料库的术语计算、数据可视化、用户交互模块紧密结合,直接服务于术语词典的编纂,提高知识生产效率。

  • 标签: 术语词典 知识组织 用户交互 术语计算 数字出版
  • 简介:国外的释义性词语研究始于“基础词汇”词表的研制,最终促成使用最低限量词汇释义的词典编纂方法,而汉语词典的释义性词语计量研究迄今尚无任何进展。本专题基于现代汉语元语言系统研究的理论方法,率先对《现代汉语词典》的释义性词语进行全面性计量研究,依据统计结果划分频度相对等级,列出《XH释义性语料高频词表》。本研究重在为汉语词典编纂优选释义性词语提供基础,也可补现代汉语常用词统计的语料选取缺陷。

  • 标签: 汉语词典 释义性词语 统计 分级 高频词表
  • 简介:文章以"数理统计法"分析两汉时期各韵部的历时演变以及音变条件,检讨"鱼歌"、"侯鱼"、"支歌"、"脂微"、"东阳"、"阳耕"、"真文元"、"质物"、"祭(月去)叶"等合韵关系,此外也对上古的"重韵问题"提出看法。

  • 标签: 数理统计 上古韵 合韵 重韵 两汉诗
  • 简介:语文是一门培养、提高学生处理中文信息的技能与能力的工具性基础课程。将中文信息处理技术及方法引进到语文教学的研究及教学过程中,可以推动语文教学的现代化。本文介绍运用中文信息处理技术统计分析中小学语文课文字词分布的状况及这些统计分析对教学研究、教材编写的价值。

  • 标签: 统计分析 分布
  • 简介:两岸华语在口语语法方面的差异尚未得到学界深入的比较研究,其中指示标记的差异较为突出。台湾国语对话体里“那”比“这”大,这主要是由于对话语体的性质、新信息、话题跳跃与弱社会化程度有利于“那”出现。后置性指示标记“这样子”在台湾国语对话体里颇具特色,男女老少皆用,给人以流行、亲昵的意味。

  • 标签: “这” “那” “这样子” 两岸华语 台湾国语 普通话
  • 简介:摘要长短元音在不同语言中存在不同表现和特征,国内孟高棉语、德昂语、克木语的元音在韵尾时都存在长短对立。对长短元音进行统计研究,有助于认识长短元音本质的特征。本文的主要研究对象——那姆佤话,长短元音对立也是其语言中较明显的特性,另外,长短元音与不同声母的搭配情况与规律也展示其语言的特殊性。

  • 标签: 那姆佤话,声母,长短元音
  • 简介:本文是运用韩礼德的系统功能语言学理论,对汉语语篇进行功能分析的尝试。通过对一类短信语篇进行三大纯理功能的分析,揭示出这类语篇在人际意义、语气结构、小句过程类型、主位结构、衔接手段等多个方面的系列“特异”性质。语篇的典型结构模式为“起——承——转/落”三个步骤。本文的分析显示,系统功能语言学的方法是一种行之有效的语篇分析方法,对于汉语语篇的分析具有良好的实践意义。

  • 标签: 拟误 短信 语篇 功能语篇分析
  • 简介:模型化词语“B·C”是具有“模标·模槽”特征的系列词语,分为“类型化实词/词素+短语/词”、“范畴化实词/词素+短语/词/词素”、“情绪化虚词素+短语/词”、“语法化虚词素+词/词素”四个次类,其内部词和短语判别的依据有三项:音节数、意义、结构。

  • 标签: 模型化 短语 依据
  • 简介:摘要本文主要讨论日语自动词可接ヲ格的具体情况及限制条件,收集了248个接ヲ格的自动词,试图用定量的研究方法来把这些可接ヲ格的自动词做一个定性的分析。收集的方法主要通过查阅较有说服力的字典和相关文献资料。

  • 标签:
  • 简介:本文提出了一种复合元音的指数式动态模型,它能将普通话的十三个复合元音的音色变化描述为几个目标值之间的动态运动。此模型用于语音合成时,能减少合成参数的存贮量,提高合成的复合元音的自然度。该模型也为进一步研究离散言语代码与连续语音声波之间的转换机制提供了一条途径。

  • 标签: 动态模型 共振峰频率 指数式 目标值 模型合成 二合元音