摘要:时代特征是常见的词语附加义。时代特征能够体现词语所在时代的气息,人们能够根据已有的经验和知识获取词语时代信息,并进一步推断词语所在语篇的时代。计算机自动识别时代特征难度则很大。对此,我们提出了基于历时语料库的词语时代特征自动获取方法,提高计算机对社会体验的缺陷;使用TF-IDF算法为词语加权算分,量化词语的时代风格,并依此计算语篇的时代风格。我们以54年(1946-1999)的人民日报语料进行实验,取得了较理想的结果。
关键词:时代特征,语篇年代,语义计算
目录
摘要
ABSTRACT
1-引言-1
2-时代特征和动态流通语料库-1
3-语料来源和统计分析-2
3.1-语料来源-2
3.2-时代统计分析-3
3.2.1-年代高频词-3
3.2.2-月份高频词-3
4-基于TF-IDF的词语时代特征获取-4
4.1-TF-IDF-4
4.2-时代风格量化-4
5-语篇时代风格计算-6
6-结论及未来工作-7
7-谢辞-7
8-参考文献-8