five

swesmith-unified-3160

收藏
Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/laion/swesmith-unified-3160
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含对话数据,每个实例包含一个对话列表(包含内容和角色字段)、实例ID和数据来源标识。数据集仅包含训练集,共3,160个样本。数据以结构化格式存储,适用于对话系统训练或自然语言处理相关任务。

This dataset contains dialogue data. Each instance includes a dialogue list with content and role fields, an instance ID, and a data source identifier. The dataset only contains the training set, with a total of 3,160 samples. The data is stored in a structured format and is applicable to dialogue system training or other natural language processing (NLP) related tasks.
提供机构:
LAION eV
创建时间:
2026-03-25
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称: swesmith-unified-3160
  • 发布者/组织: laion
  • 数据集地址: https://huggingface.co/datasets/laion/swesmith-unified-3160

数据集结构与内容

  • 数据格式: 包含多个字段的结构化数据。
  • 核心特征:
    • conversations: 一个列表,其中每个元素包含:
      • content: 字符串类型,表示对话内容。
      • role: 字符串类型,表示对话角色。
    • instance_id: 字符串类型,表示实例的唯一标识符。
    • source: 字符串类型,表示数据来源。

数据集规模与版本

  • 数据拆分: 仅包含一个拆分:
    • train (训练集):
      • 样本数量: 3160 个示例。
      • 数据集大小: 154,426,169 字节 (约 154.4 MB)。
  • 下载信息:
    • 下载文件大小: 42,177,996 字节 (约 42.2 MB)。
    • 数据集存储大小: 154,426,169 字节 (约 154.4 MB)。

数据获取与配置

  • 默认配置名称: default
  • 数据文件路径:
    • 对于 train 拆分,数据文件路径模式为: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作