中文新闻评论生成数据集和论文

2019-03-14 15:21发布

【新闻评论生成】Automatic Article Commenting: the Task and Dataset

本文是由腾讯AI Lab发表于ACL 2018的工作,文章提出了新闻评论生成任务,并开放了4.5M级别的腾讯新闻评论数据集。文章针对生成式任务难以评价的问题,根据参考评论具有不同质量,提出了加权的评价方式(W-METEOR,W-BLEU,W-Rouge-L,W-CIDEr),并通过实验验证了加权的评价指标比未加权的评价指标更接近于人工评价的得分。文章设置了基于检索和基于深度学习的评论生成实验,对比了生成评论的质量,发现评论生成的质量仍是较低,呼吁研究者对评论自动生成任务提出更好的解决方法。

https://arxiv.org/pdf/1805.03668.pdf

文章来源: https://www.toutiao.com/group/6668144575174935048/