five

JingweiNi/train_prm800k_gpt-oss-120b_annotated_qwen3_1.7b_thinking_5000_shards_4_7_16

收藏
Hugging Face2025-12-16 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/JingweiNi/train_prm800k_gpt-oss-120b_annotated_qwen3_1.7b_thinking_5000_shards_4_7_16
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个字段,如question(问题)、answer(答案)、input_ids(输入ID)、reply(回复)、original_index(原始索引)、claims(声明)和verified(已验证)。claims字段进一步细分为aligned_token_ids(对齐的标记ID)、claim_text(声明文本)和sentence(句子)。数据集只有一个名为train的分割,包含2,500个示例,总大小为44,325,911字节。该数据集适用于涉及问答和声明验证的任务。

The dataset includes various fields such as question, answer, input_ids, reply, original_index, claims, and verified. The claims field is further subdivided into aligned_token_ids, claim_text, and sentence. The dataset has a single split named train with 2,500 examples and a total size of 44,325,911 bytes. This dataset is designed for tasks involving question-answering and claim verification.
提供机构:
JingweiNi
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作