five

sft-datasets/openr1_dataset_math_verify_answer_true

收藏
Hugging Face2025-02-26 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/sft-datasets/openr1_dataset_math_verify_answer_true
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: problem dtype: large_string - name: solution dtype: large_string - name: answer dtype: large_string - name: problem_type dtype: large_string - name: question_type dtype: large_string - name: problem_is_valid dtype: large_string - name: solution_is_valid dtype: large_string - name: source dtype: large_string - name: synthetic dtype: bool - name: generations large_list: large_string - name: generations_count dtype: int64 - name: correctness struct: - name: llama_verification sequence: bool - name: math_verify_answer sequence: bool - name: math_verify_reparsed_answer sequence: bool - name: reparsed_answers sequence: string - name: messages list: - name: content dtype: string - name: role dtype: string splits: - name: train num_bytes: 4722250232.06201 num_examples: 88652 download_size: 1671142341 dataset_size: 4722250232.06201 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征字段: - 字段名:问题(problem),数据类型:大字符串(large_string) - 字段名:解答(solution),数据类型:大字符串(large_string) - 字段名:答案(answer),数据类型:大字符串(large_string) - 字段名:问题类型(problem_type),数据类型:大字符串(large_string) - 字段名:题目类型(question_type),数据类型:大字符串(large_string) - 字段名:问题有效性(problem_is_valid),数据类型:大字符串(large_string) - 字段名:解答有效性(solution_is_valid),数据类型:大字符串(large_string) - 字段名:来源(source),数据类型:大字符串(large_string) - 字段名:是否合成(synthetic),数据类型:布尔类型(bool) - 字段名:生成结果(generations),数据类型:大字符串列表(large_list<large_string>) - 字段名:生成次数(generations_count),数据类型:64位整型(int64) - 正确性(correctness):结构体类型,包含以下字段: - 字段名:LLaMA验证(llama_verification),数据类型:布尔值序列(sequence<bool>) - 字段名:数学答案验证(math_verify_answer),数据类型:布尔值序列(sequence<bool>) - 字段名:重解析答案数学验证(math_verify_reparsed_answer),数据类型:布尔值序列(sequence<bool>) - 字段名:重解析答案(reparsed_answers),数据类型:字符串序列(sequence<string>) - 消息(messages):列表类型,列表元素为结构体,包含以下字段: - 字段名:内容(content),数据类型:字符串(string) - 字段名:角色(role),数据类型:字符串(string) 数据拆分: - 拆分集名称:训练集(train),字节数:4722250232.06201,样本数量:88652 下载大小:1671142341 数据集大小:4722250232.06201 配置项: - 配置名称:默认配置(default),数据文件: - 拆分集:训练集(train),文件路径:data/train-*
提供机构:
sft-datasets
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作