mlgawd/english
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/mlgawd/english
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如自定义指令、主题、模型名称、模型、跳过提示格式化、类别、对话、浏览量、语言、ID、标题、索引、哈希、头像URL、系统提示和来源。数据集主要用于存储与模型相关的对话数据,可能用于训练或评估对话系统。数据集包含1000个示例,总大小为1341339字节,下载大小为746761字节。
This dataset includes multiple feature fields such as custom instruction, topic, model name, model, skip prompt formatting, category, conversations, views, language, ID, title, index, hash, avatar URL, system prompt, and source. The dataset is primarily used for storing conversation data related to models, potentially for training or evaluating dialogue systems. It contains 1000 examples, with a total size of 1341339 bytes and a download size of 746761 bytes.
提供机构:
mlgawd
原始信息汇总
数据集概述
数据集信息
特征
- custom_instruction: 数据类型为
null - topic: 数据类型为
null - model_name: 数据类型为
null - model: 数据类型为
null - skip_prompt_formatting: 数据类型为
null - category: 数据类型为
null - conversations:
- from: 数据类型为
string - value: 数据类型为
string - weight: 数据类型为
null
- from: 数据类型为
- views: 数据类型为
float64 - language: 数据类型为
string - id: 数据类型为
null - title: 数据类型为
null - idx: 数据类型为
null - hash: 数据类型为
null - avatarUrl: 数据类型为
null - system_prompt: 数据类型为
null - source: 数据类型为
string - index_level_0: 数据类型为
int64
数据分割
- train:
- 字节数: 1341339
- 样本数: 1000
数据集大小
- 下载大小: 746761 字节
- 数据集大小: 1341339 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



