“中国主流报纸十大流行语”的统计和发布,始于2002年。从2003年起,由每年一项年度流行语发布增为每年春夏季流行语和年度流行语两项发布,本次发布为第5次。这项流行语动态监测研究工作,一直由北京语言大学、中国新闻技术工作者联合会、中国中文信息学会联合进行。今年,教育部国家语言资源监测中心加盟这项活动。有关人士称,这进一步显示国家对汉语语言资源监测工作的重视,进一步提高了发布的“权威性”。
进入本世纪,北京语言大学应用语言学研究所就开始了语言知识动态更新研究,他们建立了中国主流媒体报刊动态流通语料库,对新时期的语言变化进行动态监测研究。
据介绍,流行语的产生是一个复杂的过程:先要通过语料入库、合并媒体文件形成初始表文件,在此基础上计算出词语的全年平均流通度;接着,滤除全年中低频词和高频词;然后,提取流行语备选词汇;最后,考察词语的曲线类型,提取十大流行语。
2004年主流报纸十大流行语的研究方法以及提取过程,基本上延续了此前数年的做法。主办方依据“发行量”等因素,选取了14家主流报纸2004年1月1日至12月31日的全部语料,汇入北京语言大学应用语言学研究所DCC博士研究室的动态流通语料库,进行动态加工分析。
被选取的14家主流报纸(按音序排列)包括:北京青年报、北京日报、北京晚报、法制日报、光明日报、环球时报、今晚报、经济日报、南方周末、人民日报、深圳特区报、羊城晚报、扬子晚报、中国青年报。
据介绍,来自上述14家报纸过去一年的语料,多达4.9亿字。在筛选时考虑了流行语的起点、峰值与谷值的落差、流行高峰持续期等相关因素,分析了流行语的变化特点,从而使筛选过程更加精密化、效率化、科学化。
从2003年开始,这一流行语发布活动在分类上不断细分。比如,2003年增为四类:综合类、经济类、非典专题、国际专题。从2004年春夏季流行语发布开始,又进一步细分为六类:综合类、国际类、经济类、科技类、文化类、时事类。
【来源:中国青年报;作者:陈娉舒】