paoloitaliani/pubmedqa|生物医学数据集|问答系统数据集
收藏数据集详情
数据集配置
分类配置 (classification)
-
特征:
input
: 数据类型为string
gold_index
: 数据类型为int64
-
分割:
train
: 字节数为 1228597,样本数为 800validation
: 字节数为 153663,样本数为 100test
: 字节数为 153264,样本数为 100
-
下载大小: 847699 字节
-
数据集大小: 1535524 字节
生成配置 (generative)
-
特征:
input
: 数据类型为string
output
: 数据类型为string
-
分割:
train
: 字节数为 1227693,样本数为 800validation
: 字节数为 153553,样本数为 100test
: 字节数为 153160,样本数为 100
-
下载大小: 847342 字节
-
数据集大小: 1534406 字节
数据文件路径
分类配置 (classification)
- 训练集:
classification/train-*
- 验证集:
classification/validation-*
- 测试集:
classification/test-*
生成配置 (generative)
- 训练集:
generative/train-*
- 验证集:
generative/validation-*
- 测试集:
generative/test-*

Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
China Air Quality Historical Data
该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。
www.cnemc.cn 收录
AFD-dataset
我们创建了迄今为止最大的亚洲人脸数据集,包含360,000张人脸图片,涉及2019个人。相比之下,第二大的亚洲人脸数据集CASIA-FaceV5仅包括2500张图片和500个人。
github 收录
Cultural Dimensions Dataset
该数据集包含了霍夫斯泰德文化维度理论(Hofstede's Cultural Dimensions Theory)的相关数据,涵盖了多个国家和地区的文化维度评分,如权力距离、个人主义与集体主义、男性化与女性化、不确定性规避、长期取向与短期取向等。这些数据有助于研究不同文化背景下的行为模式和价值观。
geerthofstede.com 收录