five

mlgawd/english

收藏
Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/mlgawd/english
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征字段,如自定义指令、主题、模型名称、模型、跳过提示格式化、类别、对话、浏览量、语言、ID、标题、索引、哈希、头像URL、系统提示和来源。数据集主要用于存储与模型相关的对话数据,可能用于训练或评估对话系统。数据集包含1000个示例,总大小为1341339字节,下载大小为746761字节。

This dataset includes multiple feature fields such as custom instruction, topic, model name, model, skip prompt formatting, category, conversations, views, language, ID, title, index, hash, avatar URL, system prompt, and source. The dataset is primarily used for storing conversation data related to models, potentially for training or evaluating dialogue systems. It contains 1000 examples, with a total size of 1341339 bytes and a download size of 746761 bytes.
提供机构:
mlgawd
原始信息汇总

数据集概述

数据集信息

特征

  • custom_instruction: 数据类型为 null
  • topic: 数据类型为 null
  • model_name: 数据类型为 null
  • model: 数据类型为 null
  • skip_prompt_formatting: 数据类型为 null
  • category: 数据类型为 null
  • conversations:
    • from: 数据类型为 string
    • value: 数据类型为 string
    • weight: 数据类型为 null
  • views: 数据类型为 float64
  • language: 数据类型为 string
  • id: 数据类型为 null
  • title: 数据类型为 null
  • idx: 数据类型为 null
  • hash: 数据类型为 null
  • avatarUrl: 数据类型为 null
  • system_prompt: 数据类型为 null
  • source: 数据类型为 string
  • index_level_0: 数据类型为 int64

数据分割

  • train:
    • 字节数: 1341339
    • 样本数: 1000

数据集大小

  • 下载大小: 746761 字节
  • 数据集大小: 1341339 字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作