tonative/healthbench-africa-extension
收藏Hugging Face2026-03-26 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/tonative/healthbench-africa-extension
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-4.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: example_tags
list: string
- name: ideal_completions_data
struct:
- name: ideal_completion
dtype: string
- name: ideal_completions_group
dtype: string
- name: ideal_completions_ref_completions
list: string
- name: translated_ideal_completion
dtype: string
- name: translated_ref_completions
list: string
- name: prompt
list:
- name: content
dtype: string
- name: role
dtype: string
- name: translated_content
dtype: string
- name: prompt_id
dtype: string
- name: rubrics
list:
- name: criterion
dtype: string
- name: points
dtype: int64
- name: tags
list: string
- name: canary
dtype: string
- name: translation_info
struct:
- name: lang
dtype: string
- name: model
dtype: string
- name: provider
dtype: string
- name: translated_at
dtype: string
- name: language
dtype: string
splits:
- name: train
num_bytes: 40900460
num_examples: 2000
download_size: 14020254
dataset_size: 40900460
---
许可证:cc-by-4.0(知识共享署名4.0国际许可协议)
配置项:
- 配置名称:default(默认配置)
数据文件:
- 划分集:train(训练集)
数据路径:data/train-*
数据集信息:
特征字段:
- 示例标签(example_tags):字符串列表类型
- 理想补全数据(ideal_completions_data):结构体类型,包含以下字段:
- 理想补全内容(ideal_completion):字符串类型
- 理想补全分组(ideal_completions_group):字符串类型
- 参考补全集(ideal_completions_ref_completions):字符串列表类型
- 翻译后理想补全内容(translated_ideal_completion):字符串类型
- 翻译后参考补全集(translated_ref_completions):字符串列表类型
- 提示文本(prompt):列表类型,列表元素为结构体,结构体包含以下字段:
- 内容(content):字符串类型
- 角色(role):字符串类型
- 翻译后内容(translated_content):字符串类型
- 提示ID(prompt_id):字符串类型
- 评分标准(rubrics):列表类型,列表元素为结构体,结构体包含以下字段:
- 评分准则(criterion):字符串类型
- 分值(points):int64整数类型
- 标签(tags):字符串列表类型
- 金丝雀字符串(canary):字符串类型
- 翻译信息(translation_info):结构体类型,包含以下字段:
- 语言(lang):字符串类型
- 翻译模型(model):字符串类型
- 服务商(provider):字符串类型
- 翻译时间(translated_at):字符串类型
- 数据集语言(language):字符串类型
数据划分:
- 划分集名称:train(训练集),字节数:40900460,样本数量:2000
下载大小:14020254字节
数据集占用大小:40900460字节
提供机构:
tonative



