TwinDoc/template-dataset-sft-gpt
收藏Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/TwinDoc/template-dataset-sft-gpt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个名为messages的列表,每个列表元素包含from和value两个字段,均为字符串类型。数据集分为训练集、验证集和测试集,分别包含100,000、10,000和10,000个示例。数据集的下载大小为566,694,306字节,总大小为1,346,627,683.949559字节。
The dataset contains a list named messages, where each element in the list includes two fields: from and value, both of which are of string type. The dataset is divided into training, validation, and test sets, containing 100,000, 10,000, and 10,000 examples respectively. The download size of the dataset is 566,694,306 bytes, and the total size is 1,346,627,683.949559 bytes.
提供机构:
TwinDoc
原始信息汇总
数据集概述
基本信息
- 名称: template-dataset-sft-gpt
- 描述: TwinDoc/template-dataset-sft-gpt 数据集托管在 HF Mirror 上,由 HF Datasets 社区贡献。
- 别名: TwinDoc/template-dataset-sft-gpt
- 创建者: TwinDoc
- 网址: https://hf-mirror.com/datasets/TwinDoc/template-dataset-sft-gpt
数据集详情
- 格式: Parquet
- 关键词:
- 100K - 1M
- parquet
- Text
- Datasets
- Dask
- Croissant
- 🇺🇸 Region: US
- 分布:
- 类型: cr:FileObject
- 名称: repo
- 描述: The HF Mirror git repository.
- 内容地址: https://hf-mirror.com/datasets/TwinDoc/template-dataset-sft-gpt/tree/refs%2Fconvert%2Fparquet
- 编码格式: git+https
- 类型: cr:FileSet
- 名称: parquet-files-for-config-default
- 描述: The underlying Parquet files as converted by HF Mirror (see: https://hf-mirror.com/docs/datasets-server/parquet).
- 包含于: repo
- 编码格式: application/x-parquet
- 包含: default//.parquet
- 类型: cr:FileObject
记录集
- 类型: cr:RecordSet
- 名称: default
- 描述: TwinDoc/template-dataset-sft-gpt - default 子集
- 3 个分割: train, validation, test
- 1 个跳过的列: messages
- 字段: []



