有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?

PRBench
PRBench是一个大规模专家标注的专业领域高风险推理基准测试数据集,当前版本覆盖法律和金融领域。包含1,100个专家编写的跨金融和法律领域的对话,19,356个专家策划的评估标准(每个任务10-30条),覆盖114个国家、47个美国司法管辖区和25个专业主题,并包含最具挑战性任务的硬子集(Finance-300, Legal-250)。
github 收录
EcoInvent
EcoInvent是一个生命周期评估(LCA)数据库,包含了大量产品的环境影响数据。它提供了详细的产品生命周期数据,包括原材料提取、生产、使用和废弃处理等各个阶段的环境影响信息。
www.ecoinvent.org 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。时间为北京时间。
国家海洋科学数据中心 收录
YouTube-English
该数据集包含从各种YouTube频道提取的英语音频片段以及相应的转录元数据。数据用于训练自动语音识别(ASR)模型。数据来源于YouTube频道,处理过程包括下载、分割和保存音频及元数据。数据集总结部分详细列出了每个频道的视频数量、持续时间和占总数据集的百分比。
huggingface 收录
乳腺癌患者检查结果
该数据采集来自乳腺癌随访微信小程序,共采集499例患者肿瘤分级、分期、血生化检测等指标,目的在于通过监测乳腺癌患者指标的高低对患者进行预后风险评估,通过指标的高低及时发现复发征兆并及时采取措施,同时可为复发风险提供参考。
国家人口健康科学数据中心 收录