期刊网_中国期刊网

数据的陷阱

作者：胡哲
学科：语言文字 > 语言学
创建时间：1989-02-12
出处：《当代修辞学》 1989年第2期

简介：数据给人的印象是无情，公道的。它在文章中很有说服力，因此许多人爱在文章中运用数据来说明问题。但也有一些人却在数据方面做手脚有意无意地为读者设下了陷阱。1．平均数我们经常遇到“平均数”，但“平均数”有三种可能说法。比如，15个人每周看电视时间为48，40，30，26，22，18，12，10，9，5，5，5，5，4，0小时。
标签：平均数说服力看电视文章

全文阅读

音韵学中统计法的比较

作者：郑林啸
学科：语言文字 > 语言学
创建时间：2004-03-13
出处：《语言研究》 2004年第3期

简介：对目前音韵学中所用的统计方法进行了全面的比较，分析了统计法在音韵研究中的必要性和可行性，强调了统计法的科学性，并从统计学原理、方法的引入、运用中的注意事项和统计法在音韵学运用中的优势和不足等方面对三种统计方法进行了详细的阐述。
标签：方法论概率论音韵学统计

全文阅读

基于统计和规则的中文姓名自动辨识

作者：季姮;罗振声
学科：语言文字 > 语言学
创建时间：2001-01-11
出处：《语言文字应用》 2001年第1期

简介：中文姓名的辨识是自动分词、自动文摘的基础.独立于自动分词,我们运用姓名用字概率和规则,设计并实现了一个中文姓名辨识系统.对207757字语料进行了测试,召回率达到92.57%,精确率达到80.35%,且速度较快.
标签：概率分布规则筛选兼类姓专有人名特殊候选姓名对

全文阅读

现代汉语句型频度统计模型的研究

作者：罗振声
学科：语言文字 > 语言学
创建时间：1995-01-11
出处：《语言研究》 1995年第1期

简介：语料库大规模真实语料的汉语句型自动分析与频度统计，是查清现代汉语句型现状的主要途径，也是继汉字字频统计和词频统计之后的又一重大基础性研究课题。本文主要给出以结构特征为标准的句型系统的汉语句型频度表、实验数据与分析、实验模型及其工作原理的简单介绍。
标签：汉语句型频度统计句型成分分析性质形容词单音节形容词趋向动词

全文阅读

基于统计的语言处理模型的局限性

作者：袁毓林
学科：语言文字 > 语言学
创建时间：2004-02-12
出处：《语言文字应用》 2004年第2期

简介：本文通过介绍和评论基于统计的语言处理模型的工作原理和有关的应用实例，从语言学理论的角度来说明统计模型的局限性。通过讨论N元语法模型及其在词类标注上的应用，展示基于统计的语言处理模型的工作原理及其应用。讨论了语言结构的递归性特点和语言学知识的结构依赖性特点，指出递归嵌入会使得统计规律被任意数目的嵌入词语打乱，语言学知识的结构依赖性将使得统计模型赖以实现的独立性假设失效。
标签：统计模型有限状态语法马尔科夫过程递归性结构依赖性

全文阅读

数理统计方法在汉字规范中的应用

作者：周晓文;王晓明
学科：语言文字 > 语言学
创建时间：2008-02-12
出处：《语言文字应用》 2008年第2期

简介：常用字字量问题是汉字规范首先要解决的问题之一。本文探讨在不同条件下确定的不同字表,是否可以用统计学的假设检验方法,对这些字表的出现概率进行比较,以字表在实际应用中概率的高低来评价其应用效果的大小。经过实际运算,得出了调整后的《规范汉字表》常用字表在应用中的概率高于原3500常用字表的结论。由此证明《规范汉字表》确定的常用字表是合理的、优化的。
标签：常用字规范汉字表累积频率统计方法

全文阅读

唐诗宋词中"茶烟"的统计分析

作者：任继昉
学科：语言文字 > 语言学
创建时间：2003-04-14
出处：《语言科学》 2003年第4期

简介：《黄州竹楼记》中的"茶烟"一词,各家注释众说纷纭,各种辞书均未立条解释.为此,本文通过对《全唐诗》、《全宋词》的全文机器检索,发现"茶烟"共有43例之多,除不成词者外,少数是指焙茶或"烹茶炉火的烟气"、"煮茶的烟火",更多的则是指茶水热汽.
标签：茶烟《全唐诗》《全宋词》全文检索茶水热汽

全文阅读

《现代汉语词典》释义性词语的统计与分级

作者：安华林;曲维光
学科：语言文字 > 语言学
创建时间：2004-01-11
出处：《语言文字应用》 2004年第1期

简介：国外的释义性词语研究始于“基础词汇”词表的研制，最终促成使用最低限量词汇释义的词典编纂方法，而汉语词典的释义性词语计量研究迄今尚无任何进展。本专题基于现代汉语元语言系统研究的理论方法，率先对《现代汉语词典》的释义性词语进行全面性计量研究，依据统计结果划分频度相对等级，列出《XH释义性语料高频词表》。本研究重在为汉语词典编纂优选释义性词语提供基础，也可补现代汉语常用词统计的语料选取缺陷。
标签：汉语词典释义性词语统计分级高频词表

全文阅读

两汉诗人用韵的数理统计分析

作者：魏鸿钧
学科：语言文字 > 语言学
创建时间：2016-02-12
出处：《语言研究》 2016年第2期

简介：文章以＂数理统计法＂分析两汉时期各韵部的历时演变以及音变条件,检讨＂鱼歌＂、＂侯鱼＂、＂支歌＂、＂脂微＂、＂东阳＂、＂阳耕＂、＂真文元＂、＂质物＂、＂祭（月去）叶＂等合韵关系,此外也对上古的＂重韵问题＂提出看法。
标签：数理统计上古韵合韵重韵两汉诗

全文阅读

中小学语文课文字词分布统计及应用价值

作者：李镗
学科：语言文字 > 语言学
创建时间：2000-03-13
出处：《语言文字应用》 2000年第3期

简介：语文是一门培养、提高学生处理中文信息的技能与能力的工具性基础课程。将中文信息处理技术及方法引进到语文教学的研究及教学过程中，可以推动语文教学的现代化。本文介绍运用中文信息处理技术统计分析中小学语文课文字词分布的状况及这些统计分析对教学研究、教材编写的价值。
标签：统计分析分布

全文阅读

基于口语库统计的两岸华语指示标记比较研究

作者：方清明
学科：语言文字 > 语言学
创建时间：2014-02-12
出处：《语言科学》 2014年第2期

简介：两岸华语在口语语法方面的差异尚未得到学界深入的比较研究，其中指示标记的差异较为突出。台湾国语对话体里“那”比“这”大，这主要是由于对话语体的性质、新信息、话题跳跃与弱社会化程度有利于“那”出现。后置性指示标记“这样子”在台湾国语对话体里颇具特色，男女老少皆用，给人以流行、亲昵的意味。
标签： “这” “那” “这样子” 两岸华语台湾国语普通话

全文阅读

那姆佤话声母与长短元音的统计特性研究

作者：庞欣
学科：语言文字 > 语言学
创建时间：2017-12-22
出处：《复印报刊资料：语言文字学》 2017年第12期
机构：中央民族大学少数民族语言文学院北京100081

简介：摘要长短元音在不同语言中存在不同表现和特征，国内孟高棉语、德昂语、克木语的元音在韵尾时都存在长短对立。对长短元音进行统计研究，有助于认识长短元音本质的特征。本文的主要研究对象——那姆佤话，长短元音对立也是其语言中较明显的特性，另外，长短元音与不同声母的搭配情况与规律也展示其语言的特殊性。
标签：那姆佤话，声母，长短元音

全文阅读

汉语教学数据挖掘：意义和方法

作者：郑艳群
学科：语言文字 > 语言学
创建时间：2016-04-14
出处：《语言文字应用》 2016年第4期

简介：当前，第二语言教学方式发生了诸多变化，针对第二语言教学的研究方法和研究范式也随之发生了变化。本文结合汉语教学研究的具体问题，论述了大数据和数据挖掘技术在汉语教学理论研究、实践研究以及学科建设方面的重要意义；结合汉语教学的具体实例，论述了汉语教学研究中应用数据挖掘技术的常用方法和具体步骤。
标签：汉语教学数据挖掘意义方法

全文阅读

「N+を＋V自动词」结构中的自动词量化统计

作者：彭靖
学科：语言文字 > 语言学
创建时间：2018-07-17
出处：《复印报刊资料：语言文字学》 2018年第7期
机构：天津外国语大学研究生院天津市300204

简介：摘要本文主要讨论日语自动词可接ヲ格的具体情况及限制条件，收集了248个接ヲ格的自动词，试图用定量的研究方法来把这些可接ヲ格的自动词做一个定性的分析。收集的方法主要通过查阅较有说服力的字典和相关文献资料。
标签：

全文阅读

回鹘文文献《乌古斯可汗传说》中格范畴的频率统计分析

作者：玛依努尔·包达西
学科：语言文字 > 语言学
创建时间：2018-07-17
出处：《复印报刊资料：语言文字学》 2018年第7期
机构：中央民族大学中国100081

简介：
标签：乌古斯可汗传格范畴频率统计

全文阅读

语音样品的选取和实验数据的分析

作者：石锋;时秀娟
学科：语言文字 > 语言学
创建时间：2007-02-12
出处：《语言科学》 2007年第2期

简介：提要文章通过对传统的语言调查与现代的语音实验在方法上的比较分析，阐述了语音样品的选取和实验数据的归一化和相对化程序及方法。
标签：语音样品实验数据语音格局归一化相对化

全文阅读

大数据时代的教育管理模式变革刍议

作者：陈智
学科：语言文字 > 语言学
创建时间：2018-06-16
出处：《复印报刊资料：语言文字学》 2018年第6期
机构：山西省北师大大同附中

简介：摘要当前教育管理的一个重要问题是在于教育管理需要专业化的先进管理工具和技术,教育管理的改进和提升关键在于应用现代信息技术手段,为教育管理决策提供高效、专业化的实现平台。该文首先澄清教育管理的“工具理性”等理论认识问题工具理性是教育管理实现其管理价值必需的策略与手段;其次在四个维度(目标、任务、方法、效益)上解析教育管理的逻辑框架,探讨大数据的基本特征及其对教育管理的深刻影响,在此基础上,探索构建以“主体、对象、资源、目标”为核心要素的教育大数据管理模式,进而讨论符合教育大数据管理特点的行动路线图,得出初步的意见在当今大数据时代,教育管理应全面走向数据挖掘与大数据引向,实现教育管理理论、手段、技术和文化上的方式转变与模式创新。
标签：大数据教育管理工具理性模式变革

全文阅读

大数据背景下社交媒体的自净功能研究

作者：曹晓勇林碧芸
学科：语言文字 > 语言学
创建时间：2018-09-19
出处：《复印报刊资料：语言文字学》 2018年第9期
机构：曹晓勇天津财经大学

简介：摘要社交媒体在谣言控制中具有自净功能，政务微博的出现为社交媒体谣言控制提供权威表达，专业辟谣网站是社交媒体谣言控制的“主力军”，要充分发挥社交媒体的便利条件，使得谣言真正“源于社交媒体，止于社交媒体。”
标签：社交媒体谣言自净

全文阅读

初中级汉语口语课课堂练习数据解析

作者：周梦圆;陆凯英
学科：语言文字 > 语言学
创建时间：2016-04-14
出处：《语言文字应用》 2016年第4期

简介：本研究从数据挖掘的视角出发，通过对优秀初中级口语课课堂教学录像中所使用的练习片断进行属性标注、数据采集、诊断与分析，验证了常用的练习类型，报告了练习的类型和数量分布情况，描述了主要练习类型和交际性强的练习类型的实施过程，并结合口语课的特点和相关理论对练习及其实施过程的特点进行了理论分析，希望能为口语教学提供一定的参考。
标签：数据挖掘口语课练习实施过程理论分析

全文阅读

北方话基本词汇数据库的研制

作者：刘连元;陈敏;龚彦如
学科：语言文字 > 语言学
创建时间：1992-02-12
出处：《语言文字应用》 1992年第2期

简介：<正>基本词汇是相对于某种语言的一般词汇而言的,它是构成语言词汇的核心。基本词汇是由基本词组成的集合,基本词是基本词汇集合的元素。基本词汇使用范围广,出现频率高,构词能力强,因此,基本词汇的研究和规范,对于整个语言词汇的研究和规范至关重要。现代汉民族共同语是以北京语音为标准音、以北方话为基础方言,以典范的现代白话文著作为语法规范的普通话。普通话基本词汇是在北方话基本词汇的基础上,吸收其它方言的词汇形成的。普通话词汇的规范工作,首先需要对北方话基本词汇进行全面、系统的调查研究,以便提供词汇规范的依据。
标签：基本词汇北方话太阳普通话汉语方言首字母

全文阅读