five

DCAgent/rl__32GPU_shaped_entropy__mix_v2_baseline_uniform__GLM-4_7-swesmith-san__20-0

收藏
Hugging Face2026-03-22 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/DCAgent/rl__32GPU_shaped_entropy__mix_v2_baseline_uniform__GLM-4_7-swesmith-san__20-0
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: conversations list: - name: content dtype: string - name: role dtype: string - name: agent dtype: string - name: model dtype: string - name: model_provider dtype: string - name: date dtype: string - name: task dtype: string - name: episode dtype: string - name: run_id dtype: string - name: trial_name dtype: string - name: result dtype: string - name: instruction dtype: string - name: verifier_output dtype: string splits: - name: train num_bytes: 13520593 num_examples: 979 download_size: 13520593 dataset_size: 13520593 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征项: - 名称为`conversations`的特征:类型为列表,列表内包含两个子特征: - 子特征`content`:数据类型为字符串 - 子特征`role`:数据类型为字符串 - 名称为`agent`的特征:即AI智能体(AI Agent),数据类型为字符串 - 名称为`model`的特征:数据类型为字符串 - 名称为`model_provider`的特征:数据类型为字符串 - 名称为`date`的特征:数据类型为字符串 - 名称为`task`的特征:数据类型为字符串 - 名称为`episode`的特征:数据类型为字符串 - 名称为`run_id`的特征:数据类型为字符串 - 名称为`trial_name`的特征:数据类型为字符串 - 名称为`result`的特征:数据类型为字符串 - 名称为`instruction`的特征:数据类型为字符串 - 名称为`verifier_output`的特征:数据类型为字符串 数据集划分: - 划分集名称为`train`,字节大小为13520593,样本数量为979 下载大小:13520593 数据集总大小:13520593 配置项: - 配置名称为`default`,数据文件信息: - 对应划分集`train`,文件路径为`data/train-*`
提供机构:
DCAgent
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作