阅读: 2023/2/27 14:21:21
北京大学中国语言文学系
现代汉语前沿问题讲座(二)
机器语言能力评测研究
及ChatGPT引发的思考
主讲人:
詹卫东 北京大学中文系教授
时间:
2023年3月1日(星期三)18:40—20:30
地点:
北京大学第一教学楼204
线上直播地址:
1. 腾讯会议会议号 688 711 357(会议密码 230301)
2. 哔哩哔哩直播(请长按识别下方二维码进行预约)
讲座内容提要
在人类社会已发展到大数据和人工智能时代的背景下,语言数据资源建设工作,成为语言学研究,特别是面向应用的语言学研究的前沿领域。 在自然语言处理(NLP)的发展中,评测任务(benchmark)引导和推动着NLP模型和算法的不断进步。 近十年来随着深度学习(deep learning)引领人工智能领域飞速发展,新的NLP评测任务和相关数据集大量涌现。 与此同时,现有评测也暴露出不少问题。 为此,有必要参照人类语言能力评测模式,提出类人机器语言能力评测的任务设计理念。 本次报告介绍北京大学中文系和计算语言学教育部重点实验室课题组联合开展的评测研究工作,兼及ChatGPT对话系统在相关评测任务上的表现。 在机器语言能力评测任务设计以及语言数据集构建研究背景下,语言学理论研究传统观念和未来走向值得引发我们的进一步深入思考。
讲座相关文献
詹卫东,2018,近30年来中文语言知识资源发展及应用,《语言战略研究》2018年第4期。
詹卫东,2013,大数据时代的汉语语言学研究,《山西大学学报(哲社版》2013年第5期。
詹卫东、孙春晖、岳朋雪、唐乾桐、秦梓巍,2022,空间语义理解能力评测任务设计的新思路——SpaCE2021数据集的研制,《语言文字应用》2022年第2期(总第122期),pp.99-110。
詹卫东,2022,构式的形式与意义表征——语言数据资源建设视野下的构式研究,《语言学论丛》第64辑,pp.187-208。 商务印书馆。
董青秀、穗志方、詹卫东、常宝宝,2021,自然语言处理评测中的问题与对策, 《中文信息学报》2021年(35卷)第6期。 pp.1-15。
唐乾桐、常宝宝、詹卫东,2020,精细化的中文词性标注评测集的研制,《中文信息学报》2020年第9期,Vol.34, No.9,9-18。
詹卫东、曹晓玉、崔巍、常宝宝,2019,中文近义词辨析实验——机器学习程序与二语学习者的对比,《科技与中文教学》2019年6月,第10卷第1期, pp.1-25。
论文下载地址:
http://ccl.pku.edu.cn/doubtfire/CV-DF-chinese.htm
也可点击“阅读原文”访问下载。
本文来源:北京大学中文系
转自:“汉教学苑”微信公众号
如有侵权,请联系本站删除!