体功能更适合白话(传闻)进修挪动进修设备的挪动功能、多媒。合的汉语白话讲授资本话题场景与影视相结,化、多媒体化和集约化的特点与需求合适挪动进修资本的碎片化、话题。
视材料分为两种汉语讲授中的影。设想制造的电视教材一种是按照讲授目标,讲授消息集中其长处在于,明白目标,编排合理言语要素,缺情节性但故事欠,稍生硬言语,近糊口不敷贴。视剧改编而成的教材另一种是选用现有影,于故事完整其长处在,性强情节,动天然言语生,性和针对性但缺乏系统,度跨度狂言语难。

。Seay(1991)Herron 和 ,2011)曹莉敏(,认为影视可以或许为二语进修供给无效的言语输入Bahrani 和 Sim(2012)等,习结果加强学。
聚类方式操纵词语,对应的话题词语拔取各寒暄图式,题词语聚类主动进行话,将词语分级并按常费用。话题/语体)分布不服均性亲近相关词语聚类分类与词语的空间(类别/。
六)10:00正式开讲将于3月26日(下周,范式、研究东西及操作流程、研究案例阐发等展开刘教员将环绕语料库言语学的根基研究方式、研究,疑为大师全面拆解语料库言语学通过4次课程讲解及2次课程答,究供给方式、东西及思绪开导为大师更高效地开展言语研,书&赠书&发票消息登接待报名加入~培训证记
。如比,分歧话题语猜中呈现的频次几乎一样功能性虚词(如“的、在、和”)在,平均漫衍;的频次会远高于它们在其他话题(如“点餐、银行、打招待”)语猜中的频次而某些词语(如“的士、出租车、打的”)在“出行—的士”话题语猜中呈现,士”话题中的范畴词语因而它们是“出行—的。?方差是表现数据分布能否平均的很好的数学目标若何模仿词语在分歧话题语料平分布的不服均性,度的常用公式是TFIDF消息检索中暗示词语主要程,词语利用范畴的大小此中IDF描述的是。模仿分布的不服均性这两个目标皆可用来,语主动聚类以此进行词。
分类方式操纵文本,话题之间的相关程度计较各影视片段与,智能排序从高到低,话片段先教先学以便最相关的会。
常用词、句、式、篇”的会话资本库建立一个按话题分类的多媒体的“,挪动进修辅助汉语。话题相关的多个片子会话字幕、视频片段例如:智能获取“交通出行—买票订票”,易度排序分级按相关度和难;提出需求—确认消息—付费—取票”该话题的寒暄图式是“打招待— ;聚类后词语,“订、买、票价、机票、车票、预订”等图式“提出需求”的中级最常用词语为;度计较后例句常用,买一张去广州的票/……”中级最常用句子为“我要,(北京/广州/香港……)的(飞机/火车/汽车票)中级最常用构式为“我要买[(一/二……)张] 去。…”/…。
其生成性高常用还在于,上没有必然标识表记标帜常用句在布局,的框架式布局但仍然有必然,和空位部门具有骨架。如例,香港的飞机/火车/汽车票“我要订去北京/广州/。交通出行中的订票内容”这个句子表达的是,我要订去…… 的……票其寒暄构式可归纳综合为“。简直定与主动抽取仍是难点”可是对于句子常用性尺度。
二第,化进修”“集约,洁的多媒体资本(最简方案)扶植汉语进修最常用的、最简,快学”的目标达到“精学、。点决定了其进修内容该当高度浓缩汉语挪动进修挪动性、碎片化的特,最常用的、最简练的寒暄内容在无限的碎片时间内只进修。其“最简方案”汉语进修也有,入获得最大的进修报答该当以最小的进修投。
旨为:对峙准确的办刊标的目的和言论导向《国际中文教育(中英文)》办刊宗,育讲授政策和现状报道国表里中文教,广的优良功效和经验反映国际中文教育推,养模式和言语进修推广政策摸索总结科学无效的师资培,教育交换平台制造国际中文,教育与传布事业鞭策国际中文。
三第,化进修”“场景,际场景的话题的片段调集影视视频是基于各个交,场景展现给学生能将实在的寒暄,境、语境、语伴的难点、痛点能处理挪动进修中缺乏进修环。
应的寒暄图式阐发各话题对,式及常用会话按照寒暄图,题常用句子拔取各话,常用句子分级按常费用将。
对话流片段库4. 基于,语聚类进行词,的话题词语调集提取出该话题,合插手种子词中将话题词语集,种子词扩充,权重更新,始线)重构初,很少或对话流片段库添加很少直到提取的话题词语调集变化。
言语学方式连系计较,汇品级划分》中的“词汇品级划分”操纵《汉语国际教育用音节汉字词,视片段的常费用计较话题内各影,进行分级按常费用,话片段先教先学以便最常用的会。如下过程:
字幕中的会话语料基于教材和影视,会话—常用句子—常用词语”连系“话题—寒暄图式—常用,的常用词语库、句库、会话库提取多媒体的分级的、分话题。终最,
列图书为暨南大学刘华传授所著“言语计较与智能汉语讲授”系,社出书由外研,书共九卷系列图,和3本汉语讲授常用词表包含6本理论研究著作,法的面向智能汉语讲授的理论、方式方面的研究功效此中6本理论研究著作都是基于语料库和言语计较方,的与商务汉语讲授、华语讲授、汉语白话讲授理论相配套的分类分级的讲授资本3本汉语讲授常用词表则是基于上述理论著作中的语料库和言语计较方式建立。第七卷、第八卷已出书目前第一卷、第二卷、,将连续出书其他卷本也,关心敬请~
模子和夹角余弦的类似度计较方式我们操纵文天职类中的向量空间,其对于话题(类)的类似度为所有片段(文本)计较。降序陈列类似度,关度就从高到低分级了影视片段和话题的相。
华传授主讲的“语料库言语学——研究方式、东西与案例”专题系列直播由暨南大学博士生导师、“言语计较与智能汉语讲授”系列图书作者刘课
片段长度3. ,语数量即词,响常费用也会影,对数后(滑润其影响)我们将词语数取常用,权重相乘与平均,常费用即为。
、糊口化、多题材准绳我们基于影视的现代性,视资本库建立影,文本、视频文件包含字幕对话,二级线余个三级线示例)扶植汉语讲授常用线个。
视片段分词1.将影。辞书》作为词汇简直定尺度利用最新版的《现代汉语,语辞书》的词语对超出《现代汉,进行二次分词基于该辞书。
级词汇权重为12. 付与一,为2二级,为3三级,为4附录,权重为5纲外词汇。后的影视片段对于分词校对,予分歧权重将其词汇赋,汇的平均权重统计其所有词。
7大类建立共,二级话题45个,00余个话题常用词语表初、中、高三级总共1。
一第,片子“看,语”学汉,化的多媒体进修资本扶植话题化、场景,习趣味性提高学,“乐学”让学生。该基于新鲜的白话素材汉语挪动进修的内容应,、基于场景朋分应面向寒暄功能,性高的影视资本来提高讲授结果扶植针对具体寒暄话题的、趣味。
7大类建立共,二级话题45个,00余个话题常用句表初、中、高三级总共1。
华人民共和国教育部主管、北京外国语大学主办刊物简介《国际中文教育(中英文)》是由中,院、北外孔子学院工作处配合承办的学术刊物外语讲授与研究出书社、北外中国言语文学学。CN10—1718/H国内统连续续出书物号为,SSN2096—9716国际尺度持续出书物号为I。刊季, 开16,刊行公开。nese Language Education英文名称为International Chi。
阐发方式操纵话题,库为纲以话题,一话题对每,的相关度高的寒暄片段截取若干抢手影视剧中,际场景标识表记标帜交,片段库及其影视视频资本库建立话题对应的影视对话,0个短视频共约400。
|