AyushS9020/lima_dataset_processed
收藏Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/AyushS9020/lima_dataset_processed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含1000个样本,主要用于训练。每个样本包含三个特征:conversations(对话内容,类型为字符串序列)、source(来源,类型为字符串)和__index_level_0__(索引级别,类型为int64)。数据集总大小为2829833字节,下载大小为1630188字节。数据文件路径为data/train-*。
This dataset contains 1000 samples, primarily used for training. Each sample includes three features: conversations (dialogue content, type as string sequence), source (source, type as string), and __index_level_0__ (index level, type as int64). The total size of the dataset is 2829833 bytes, with a download size of 1630188 bytes. The data file path is data/train-*.
提供机构:
AyushS9020
原始信息汇总
数据集概述
基本信息
- 名称: lima_dataset_processed
- 描述: AyushS9020/lima_dataset_processed 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献。
- 别名: AyushS9020/lima_dataset_processed
- 创建者: Ayush Singhal
- URL: https://hf-mirror.com/datasets/AyushS9020/lima_dataset_processed
数据集详情
- 符合标准: http://mlcommons.org/croissant/1.0
- 关键词:
- 1K - 10K
- parquet
- Text
- Datasets
- pandas
- Croissant
- 🇺🇸 Region: US
数据分布
-
类型: cr:FileObject
-
名称: repo
-
描述: HF Mirror git 仓库。
-
内容 URL: https://hf-mirror.com/datasets/AyushS9020/lima_dataset_processed/tree/refs%2Fconvert%2Fparquet
-
编码格式: git+https
-
类型: cr:FileSet
-
名称: parquet-files-for-config-default
-
描述: 由 HF Mirror 转换的底层 Parquet 文件(参见:https://hf-mirror.com/docs/datasets-server/parquet)。
-
包含于: repo
-
编码格式: application/x-parquet
-
包含: default//.parquet
记录集
- 类型: cr:RecordSet
- 名称: default
- 描述: AyushS9020/lima_dataset_processed - default 子集
- 1 个跳过的列: conversations
字段
-
类型: cr:Field
-
名称: default/source
-
描述: HF Mirror parquet 文件中的 source 列。
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取: source 列
-
类型: cr:Field
-
名称: default/index_level_0
-
描述: HF Mirror parquet 文件中的 index_level_0 列。
-
数据类型: sc:Integer
-
来源:
- 文件集: parquet-files-for-config-default
- 提取: index_level_0 列



