语言智能与技术
计算语言学前沿
1.基础部分:语言计算研究的先驱:Markov链,zipf定律,熵,Bar-Hillel的范畴语法,Harris的语言串分析法,O.C.K 的语言集合论模型;(3-4课时)
2.提高部分:语言资源建设、跨语言信息处理、话题、事件计算方面的论文研读。(16-17课时)
语音信息处理
自然语言处理的统计方法
本课程主要讲授自然语言处理和计算语言学中的统计方法、关键技术和最新进展。主要内容包括语言处理的统计学基础和语言模型、因马尔科夫模型、最大熵模型以及NLP中常用的机器学习方法等等。
通过本课程的学习,希望学生能了解语言信息处理中基于统计的学术思想,掌握解决实际语言任务的能力,了解相关的最新研究成果,培养学生在语言信息处理领域和相关领域的科研能力。
授课内容:
第1周:自然语言处理综述
第2周:汉字编码
第3-4周:汉字统计和汉字处理
第5-6周:基于单字的输入法实现
第7-8周:音字转换的基本原理和实现
第9-10周:语言模型的基本原理和CMU工具包
第11-13周:汉语分词的理论和实践
第14-15周:词性标注与隐马尔可夫模型
第16-17周:全文检索的方法和实现
第18周:答疑与习题课
语料库语言学
教学目标:了解语料库语言学的基本理念——了解语料库语言学的学科位置、历史、研究状况、研究重点和发展趋势(实时);了解用语料库研究语言的意义和作用;掌握语料库语言学的基本概念;掌握语料库建设的基本原则和一般方法;掌握使用语料库的方法、技能、工具;了解语料库在语言信息处理研究和语言研究中的应用,最终能够独立的利用语料库,提出自己进行语言信息处理或语言学领域的研究问题。作为语言信息处理方向的研究生,重点要全面熟悉已有的中文语料库及其功能,掌握中文语料库建设、开发、利用的工程性和技术性的方法、手段。
授课内容:
1.绪论。包括语料库、语料库语言学概念;语料库语言学的位置、性质、学科基础;语料库语言学的发展历史(流派)、发展方向、研究内容等。 (6学时)
2.语料库的应用。介绍基于语料库的语言学研究成果、研究方面。以实例展现基于语料库语言学的研究过程(3~4学时)
3.语料库的设计、开发、管理。包括语料库设计原则、建库方法(包括开源的数据下载工具、检索、管理系统)、语料库类型、经典语料库介绍。(9~10学时)
4.语料库使用及加工技术。包括从计算的角度考虑语言的思维方式、语料库使用及相关工具、基本的统计量、语料库标注(原则、标注中涉及的问题、自动标注的方法、标注的检查方法等)(12学时)
5.基于语料库的语言学研究。包括词汇计量研究、句型统计、词典学研究、语言的多维特征分析方法、词语的自动语义分类方法、词汇-语法调查、Register Variation研究、语篇分析、故事库构建等。(9学时)
6.语料库方法在计算语言学中的应用。包括语言数据资源开发(LDC)、经典的词法分析算法。(6~7学时)
7.讨论:语言监测与语言教学。(6~9学时)
汉语教学技术前沿
授课目标:掌握教育技术前沿理论与实践,并将其用于对外汉语教学中。
主要内容:
一)信息技术与课程整合
二)移动学习
三)学习理论的变革
四)新技术应用
五)汉语教学设计
六)智慧教育