2016年12月16日下午,应国际交流学院邀请,北京语言大学对外汉语研究中心郑艳群教授在千佛山校区教学三楼一层报告厅为全院师生作了一场精彩的学术报告,报告的主题是“面向汉语教学的数据挖掘与数据分析”。报告会由王其和副教授主持。
郑艳群教授是我国系统地将计算机教学运用于汉语国际教育的第一人,多年来致力于研究多媒体技术和网络技术、语料库技术等,并将其应用于对外汉语教学的理论与实践。因此,此次讲座,郑教授依然着眼于现代化的技术与对外汉语教学的结合。“大数据”是计算机领域最新的热点问题,郑教授的讲座内容也主要围绕“大数据、数据挖掘、数据分析”来进行。
讲座伊始,郑教授用一个鲜明有趣的案例引发了诸位师生的思考。零售业巨头沃尔玛在搜集了大量消费数据的基础上进行分析,发现顾客经常把尿不湿与啤酒搭配购买。沃尔玛决定将尿不湿和啤酒的陈列区域进行调整,使顾客更容易选购,这一举措极大地提升了销量。郑教授指出,一般人们很难把尿不湿与啤酒结合起来,二者之间似乎没有什么必然联系,但是掌握了足够多的数据,并且对数据进行科学分析,就有可能发现一些新的关系,而这样的关系很难从经验出发获得。这个案例主要向我们阐明了大数据不仅仅是信息量的大,其更重要的特点在于打破了传统观念上对于结构的认识。
接下来,郑艳群教授用两个教学实例阐述了对外汉语教学中如何进行数据挖掘和数据分析,首先是大数据视角下的汉语综合课语法教学的结构与过程。综合课是对外汉语教学中不可忽视的重要课程,郑教授首先穷尽性搜集了2014之前所有的科研成果,并对不同教师的课堂教学步骤进行划分,对教师们的教学顺序进行归纳分析,从而发现最优秀的课堂倾向于使用的教学顺序,还可以发现教师们所持的不同教学观点和理念,这就是从分类到聚类的过程。
第二个案例是汉语口语课堂练习,探讨口语的不同教学环节练习题型之间的关系,即环节和练习这两个集合之间的关系。通过录像观察,教师们所运用的练习非常丰富,同一环节可能有不同的练习,不同的练习可能在同一环节当中,也有特定的练习在特定的环节当中。归纳后可以获得优秀口语课堂不同环节的最佳练习设置。因此,运用大数据,要从“实然”出发。通过多样本实现对问题尽可能客观、理性、全面、完整和具体的描写。
郑教授特别指出,数据的运用是研究科学性的重要体现。基于大量翔实可靠的数据,必然使得结论更趋于科学,趋于可靠。数据挖掘与数据分析必须结合进行,同时要充分考虑数据获取时的种种主客观影响因素,诸如学术背景、题材背景、被试者得到年龄与性别等。只有这样,才能从大数据中对既存研究结论进行验证,并且可能发现已有研究尚未覆盖的领域。
讲座结束后,郑教授与我院师生进行了丰富的交流互动。郭文娟副教授提出,我院也应该推广工作坊,将教学效果和学习效果分别对待,从大数据中找出二者的关联,用数据来支持结论,首要问题是需要找到科学提取数据的方法,这也得到了郑教授的积极回应。
王其和副教授主持时指出大数据在对外汉语教学中的重要性,它既是教学实践的汇总,也是科学研究的基础。此次学术报告聚焦前沿热点学术问题,开阔了师生们的学术视野,引发了大家对数据挖掘和数据分析在汉语教学中的深入思考,这对进一步促进我院的教学科研工作具有积极意义。
摄影:徐小雅