“2009年度中国主流媒体十大流行语”数据来源说明
规模:本次流行语的提取语料来源于国家语言资源监测与研究中心DCC动态流通语料库2009年1月1日——12月20日的全部语料。内容包括平面媒体语言分中心16家主流报纸语料库,有声媒体语言分中心10家电视台、7家广播电台的有声语料库以及网络媒体语言分中心2个门户网站的网络新闻,共计1 234 992个文本,1 330 013 723字次语料。
具体语料数据:
16家主流报纸(按音序排列):北京青年报、北京日报、北京晚报、法制日报、光明日报、广州日报、南方周末、华西都市报、钱江晚报、今晚报、人民日报、深圳特区报、新民晚报、羊城晚报、扬子晚报、中国青年报共计840 403个文本,652 117 686字次语料。
10家电视台和7家广播电台:包括中央电视台、北京电视台、上海文广新闻传媒集团等10家电视台以及中央人民广播电台、北京人民广播电台、上海文广新闻传媒集团(广播)等7家广播电台127个栏目的节目转写文本,共计14 589个文本,94 113 638字次语料。
2个门户网站:包括新浪、QQ新闻,共计380 000个文本,共计583 782 399字次语料。
Copyright ©1999-2024 chinanews.com. All Rights Reserved