essobi/ok_bert2
收藏Hugging Face2026-03-22 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/essobi/ok_bert2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: messages
list:
- name: content
dtype: string
- name: name
dtype: string
- name: role
dtype: string
- name: tool_calls
list:
- name: function
struct:
- name: arguments
struct:
- name: answer
dtype: string
- name: expected
dtype: string
- name: expression
dtype: string
- name: name
dtype: string
- name: type
dtype: string
- name: tools
dtype: string
- name: n_steps
dtype: int64
- name: difficulty
dtype: string
- name: expected_answer
dtype: string
splits:
- name: train
num_bytes: 19891530
num_examples: 7473
- name: eval
num_bytes: 413650
num_examples: 150
- name: test
num_bytes: 3082442
num_examples: 1151
download_size: 13896569
dataset_size: 23387622
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: eval
path: data/eval-*
- split: test
path: data/test-*
---
## 数据集信息
### 数据特征
1. `messages`:列表类型,其元素包含以下字段:
- `content`:字符串类型,即消息内容
- `name`:字符串类型,即消息标识名称
- `role`:字符串类型,即消息角色
- `tool_calls`:列表类型,其元素包含以下字段:
- `function`:结构体类型,内部字段包括:
- `arguments`:结构体类型,包含三个字符串类型子字段:`answer`(应答内容)、`expected`(预期结果)、`expression`(表达式)
- `name`:字符串类型,即函数名称
- `type`:字符串类型,即工具调用类型
2. `tools`:字符串类型,用于描述当前数据集所用的工具集合
3. `n_steps`:`int64` 整型,代表任务执行的总步数
4. `difficulty`:字符串类型,用于标注任务难度等级
5. `expected_answer`:字符串类型,即任务的预期标准答案
### 数据划分
- 训练集(train):占用存储空间19891530字节,共包含7473条样本
- 验证集(eval):占用存储空间413650字节,共包含150条样本
- 测试集(test):占用存储空间3082442字节,共包含1151条样本
### 全局统计指标
数据集下载总大小为13896569字节,完整解压后的总数据集大小为23387622字节
### 数据集配置
默认配置下,各划分的数据文件路径对应如下:
- 训练集:`data/train-*`
- 验证集:`data/eval-*`
- 测试集:`data/test-*`
提供机构:
essobi



