AyushS9020/lima_dataset_processed

Name: AyushS9020/lima_dataset_processed
Creator: AyushS9020
Published: 2024-07-18 16:49:53
License: 暂无描述

Hugging Face2024-07-18 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/AyushS9020/lima_dataset_processed

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含1000个样本，主要用于训练。每个样本包含三个特征：conversations（对话内容，类型为字符串序列）、source（来源，类型为字符串）和__index_level_0__（索引级别，类型为int64）。数据集总大小为2829833字节，下载大小为1630188字节。数据文件路径为data/train-*。

This dataset contains 1000 samples, primarily used for training. Each sample includes three features: conversations (dialogue content, type as string sequence), source (source, type as string), and __index_level_0__ (index level, type as int64). The total size of the dataset is 2829833 bytes, with a download size of 1630188 bytes. The data file path is data/train-*.

提供机构：

AyushS9020

原始信息汇总

数据集概述

基本信息

名称: lima_dataset_processed
描述: AyushS9020/lima_dataset_processed 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献。
别名: AyushS9020/lima_dataset_processed
创建者: Ayush Singhal
URL: https://hf-mirror.com/datasets/AyushS9020/lima_dataset_processed

数据集详情

符合标准: http://mlcommons.org/croissant/1.0
关键词:
- 1K - 10K
- parquet
- Text
- Datasets
- pandas
- Croissant
- 🇺🇸 Region: US

数据分布

类型: cr:FileObject
名称: repo
描述: HF Mirror git 仓库。
内容 URL: https://hf-mirror.com/datasets/AyushS9020/lima_dataset_processed/tree/refs%2Fconvert%2Fparquet
编码格式: git+https
SHA256: https://github.com/mlcommons/croissant/issues/80
类型: cr:FileSet
名称: parquet-files-for-config-default
描述: 由 HF Mirror 转换的底层 Parquet 文件（参见：https://hf-mirror.com/docs/datasets-server/parquet）。
包含于: repo
编码格式: application/x-parquet
包含: default//.parquet

记录集

类型: cr:RecordSet
名称: default
描述: AyushS9020/lima_dataset_processed - default 子集
- 1 个跳过的列: conversations

字段

类型: cr:Field
名称: default/source
描述: HF Mirror parquet 文件中的 source 列。
数据类型: sc:Text
来源:
- 文件集: parquet-files-for-config-default
- 提取: source 列
类型: cr:Field
名称: default/index_level_0
描述: HF Mirror parquet 文件中的 index_level_0 列。
数据类型: sc:Integer
来源:
- 文件集: parquet-files-for-config-default
- 提取: index_level_0 列

5,000+

优质数据集

54 个

任务类型

进入经典数据集