five

yuancarrieyjy/tulu3_infinite-chats-taxonomy_mix_10k

收藏
Hugging Face2026-04-23 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/yuancarrieyjy/tulu3_infinite-chats-taxonomy_mix_10k
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: data_source dtype: large_string - name: extra_info struct: - name: index dtype: int64 - name: question dtype: string - name: reference_generated_responses list: string - name: reference_max_score dtype: float64 - name: reference_mean_score dtype: float64 - name: reference_min_score dtype: float64 - name: reference_score dtype: 'null' - name: split dtype: string - name: extra_info_no_thinking struct: - name: index dtype: int64 - name: question dtype: string - name: reference_generated_responses list: string - name: reference_max_score dtype: float64 - name: reference_mean_score dtype: float64 - name: reference_min_score dtype: float64 - name: reference_score dtype: 'null' - name: split dtype: string - name: prompt list: - name: content dtype: string - name: role dtype: string - name: reward_model struct: - name: ground_truth dtype: string - name: style dtype: string - name: type dtype: large_string splits: - name: train num_bytes: 217248359 num_examples: 10347 - name: validation num_bytes: 54392233 num_examples: 2587 download_size: 272473821 dataset_size: 271640592 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* ---

数据集信息: 特征: - 名称:数据源(data_source),数据类型:large_string - 名称:额外信息(extra_info),结构体类型,包含子字段: - 名称:索引(index),数据类型:int64 - 名称:问题(question),数据类型:string - 名称:参考生成回复(reference_generated_responses),数据类型:list: string - 名称:参考最高得分(reference_max_score),数据类型:float64 - 名称:参考平均得分(reference_mean_score),数据类型:float64 - 名称:参考最低得分(reference_min_score),数据类型:float64 - 名称:参考得分(reference_score),数据类型:null - 名称:划分(split),数据类型:string - 名称:无思考过程额外信息(extra_info_no_thinking),结构体类型,包含子字段: - 名称:索引(index),数据类型:int64 - 名称:问题(question),数据类型:string - 名称:参考生成回复(reference_generated_responses),数据类型:list: string - 名称:参考最高得分(reference_max_score),数据类型:float64 - 名称:参考平均得分(reference_mean_score),数据类型:float64 - 名称:参考最低得分(reference_min_score),数据类型:float64 - 名称:参考得分(reference_score),数据类型:null - 名称:划分(split),数据类型:string - 名称:提示词(prompt),列表类型,列表元素包含: - 名称:内容(content),数据类型:string - 名称:角色(role),数据类型:string - 名称:奖励模型(reward_model),结构体类型,包含子字段: - 名称:真实标签(ground_truth),数据类型:string - 名称:风格(style),数据类型:string - 名称:数据类型(type),数据类型:large_string 数据集划分: - 名称:训练集(train),字节大小:217248359,样本数:10347 - 名称:验证集(validation),字节大小:54392233,样本数:2587 下载大小:272473821 数据集总大小:271640592 配置项: - 配置名称:默认配置(default),数据文件: - 划分:训练集(train),路径:data/train-* - 划分:验证集(validation),路径:data/validation-*
提供机构:
yuancarrieyjy
二维码
社区交流群
二维码
科研交流群
商业服务