1.FakeNewsNet
下载链接:https://github.com/KaiDMML/FakeNewsNet
说明:该数据集包含新闻内容和正确标注真假新闻标签的社会语境特征。
使用论文:
(1)A Stylometric Inquiry into Hyperpartisan and Fake News
(2)Exploiting Tri-Relationship for Fake News Detection
2.BuzzFeedNews
链接:https://github.com/BuzzFeedNews/2016-10-facebookfact-check/tree/master/data
说明:该数据集包括完整的Facebook新闻发布于接近2016年美国大选从9月19日到23日以及9月26日和27日。
3.LIAR
链接:http://www.cs.ucsb.edu/~william/software.html
说明:该数据集是从PolitiFact收集,包括简短陈述,例如新闻稿,电视
或电台采访,竞选演讲等,并包含元数据。
使用论文:
(1)“Liar,LIar Pants on Fire”:A New Benchmark Dataset for Fake News Detection
(2)Multi-Source Multi-Class Fake News Detection
4.BS Detector
链接:https://github.com/bs-detector/bs-detector
说明:为新闻浏览器导出的数据集,包含新闻内容和正确标注真假新闻标签。
5.CREDBANK
链接:http://compsocial.github.io/CREDBANK-data/
说明:推特的大数据集,包含新闻内容和人工标注标签。
数据集涉及的内容如下:
6.Twitter and Weibo DataSet
链接:https://github.com/majingCUHK/Rumor_RvNN
http://alt.qcri.org/~wgao/data/rumdect.zip
说明:5000条言论带着500w的转发量
使用论文:
(1)CSI: A Hybrid Deep Model for Fake News Detection
(2)Detecting rumors from microblogs with recurrent neural network
(3)Early Detection of Fake News on Social Media Through Propagation Path Classification with Recurrent and Convolutional Networks
7.Twitter15 Twitter16
链接:https://www.dropbox.com/s/7ewzdrbelpmrnxu/rumdetect2017.zip?dl=0
说明:谣言数据
使用论文:
Detect Rumors in Microblog Posts Using Propagation Structure via Kernel Learning
8.推特语料
链接:http://www.cs.jhu.edu/svitlana/
说明:具体时间事件所搜集的数据集
使用论文:
Separating Facts from Fiction Linguistic Models to Classify Suspicious and Trusted News Posts on Twitter
9.包含图的假新闻数据集
链接:https://drive.google.com/open?id=0B3e3qZpPtccsMFo5bk9Ib3VCc2c
说明:文本+图像
使用论文
TI-CNN: Convolutional Neural Networks for Fake News Detection
10.谣言数据集
链接:http://mia.kaist.ac.kr/publications/rumor.
说明:数据集包含三个维度:时间,结构和语言
使用论文:
Prominent features of rumor propagation in online social media
转载自原文链接, 如需删除请联系管理员。
原文链接:虚假新闻检测数据集,转载请注明来源!