MediaBiasFactCheck|媒体偏见数据集|事实核查数据集
收藏
- MediaBiasFactCheck数据集首次发布,旨在提供对新闻媒体偏见和事实核查的评估。
- 数据集开始被学术界和媒体研究机构广泛引用,成为评估新闻媒体可信度的重要工具。
- MediaBiasFactCheck引入了新的分类系统,增加了对社交媒体和新兴新闻来源的评估。
- 数据集的评估标准进一步细化,增加了对深度伪造和虚假信息传播的分析。
- MediaBiasFactCheck与多个国际组织合作,开始提供多语言版本的数据集,扩大了其全球影响力。
- 1Media Bias Fact Check: A Comprehensive Dataset for Media Bias DetectionUniversity of Michigan · 2020年
- 2Detecting Media Bias in News Articles Using Machine LearningStanford University · 2021年
- 3A Survey on Media Bias Detection Using Natural Language ProcessingMassachusetts Institute of Technology · 2022年
- 4Evaluating the Impact of Media Bias on Public Opinion Using Machine LearningUniversity of California, Berkeley · 2022年
- 5Towards Automated Fact-Checking: A Deep Learning Approach Using MediaBiasFactCheck DatasetCarnegie Mellon University · 2021年
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录