有关中文情感挖掘的酒店评论语料英文关键词: 中文情感挖掘,酒店评论语料,自然语言处理,文本挖掘, 中文关键词: 中文情感挖掘、 酒店评论语料、 自然语言处理、 文本挖掘、 数据格式: TEXT 数据介绍: 为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波 收集整理了一个较大规模的酒店评论语料。语料规模为10000 料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4 个子集: 1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000 2.ChnSentiCorp-Htl-ba-4000:平衡语料,正负类各2000 3.ChnSentiCorp-Htl-ba-6000:平衡语料,正负类各3000 4.ChnSentiCorp-Htl-unba-10000:非平衡语料,正类为7000女人梦见掉头发