five

essobi/ok_bert2

收藏
Hugging Face2026-03-22 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/essobi/ok_bert2
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: messages list: - name: content dtype: string - name: name dtype: string - name: role dtype: string - name: tool_calls list: - name: function struct: - name: arguments struct: - name: answer dtype: string - name: expected dtype: string - name: expression dtype: string - name: name dtype: string - name: type dtype: string - name: tools dtype: string - name: n_steps dtype: int64 - name: difficulty dtype: string - name: expected_answer dtype: string splits: - name: train num_bytes: 19891530 num_examples: 7473 - name: eval num_bytes: 413650 num_examples: 150 - name: test num_bytes: 3082442 num_examples: 1151 download_size: 13896569 dataset_size: 23387622 configs: - config_name: default data_files: - split: train path: data/train-* - split: eval path: data/eval-* - split: test path: data/test-* ---

## 数据集信息 ### 数据特征 1. `messages`:列表类型,其元素包含以下字段: - `content`:字符串类型,即消息内容 - `name`:字符串类型,即消息标识名称 - `role`:字符串类型,即消息角色 - `tool_calls`:列表类型,其元素包含以下字段: - `function`:结构体类型,内部字段包括: - `arguments`:结构体类型,包含三个字符串类型子字段:`answer`(应答内容)、`expected`(预期结果)、`expression`(表达式) - `name`:字符串类型,即函数名称 - `type`:字符串类型,即工具调用类型 2. `tools`:字符串类型,用于描述当前数据集所用的工具集合 3. `n_steps`:`int64` 整型,代表任务执行的总步数 4. `difficulty`:字符串类型,用于标注任务难度等级 5. `expected_answer`:字符串类型,即任务的预期标准答案 ### 数据划分 - 训练集(train):占用存储空间19891530字节,共包含7473条样本 - 验证集(eval):占用存储空间413650字节,共包含150条样本 - 测试集(test):占用存储空间3082442字节,共包含1151条样本 ### 全局统计指标 数据集下载总大小为13896569字节,完整解压后的总数据集大小为23387622字节 ### 数据集配置 默认配置下,各划分的数据文件路径对应如下: - 训练集:`data/train-*` - 验证集:`data/eval-*` - 测试集:`data/test-*`
提供机构:
essobi
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作