swesmith-unified-3160
收藏Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/laion/swesmith-unified-3160
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含对话数据,每个实例包含一个对话列表(包含内容和角色字段)、实例ID和数据来源标识。数据集仅包含训练集,共3,160个样本。数据以结构化格式存储,适用于对话系统训练或自然语言处理相关任务。
This dataset contains dialogue data. Each instance includes a dialogue list with content and role fields, an instance ID, and a data source identifier. The dataset only contains the training set, with a total of 3,160 samples. The data is stored in a structured format and is applicable to dialogue system training or other natural language processing (NLP) related tasks.
提供机构:
LAION eV
创建时间:
2026-03-25
原始信息汇总
数据集概述
数据集基本信息
- 数据集名称: swesmith-unified-3160
- 发布者/组织: laion
- 数据集地址: https://huggingface.co/datasets/laion/swesmith-unified-3160
数据集结构与内容
- 数据格式: 包含多个字段的结构化数据。
- 核心特征:
conversations: 一个列表,其中每个元素包含:content: 字符串类型,表示对话内容。role: 字符串类型,表示对话角色。
instance_id: 字符串类型,表示实例的唯一标识符。source: 字符串类型,表示数据来源。
数据集规模与版本
- 数据拆分: 仅包含一个拆分:
train(训练集):- 样本数量: 3160 个示例。
- 数据集大小: 154,426,169 字节 (约 154.4 MB)。
- 下载信息:
- 下载文件大小: 42,177,996 字节 (约 42.2 MB)。
- 数据集存储大小: 154,426,169 字节 (约 154.4 MB)。
数据获取与配置
- 默认配置名称:
default - 数据文件路径:
- 对于
train拆分,数据文件路径模式为:data/train-*
- 对于



