Kamyar-zeinalipour/ita_cw_text_mistal_v3
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Kamyar-zeinalipour/ita_cw_text_mistal_v3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个名为text的字符串类型特征。数据集分为训练集和测试集,训练集包含4900个样本,测试集包含100个样本。数据集的下载大小为3342612字节,总大小为6517068字节。数据文件路径分别为data/train-*和data/test-*。
The dataset contains a feature named text of string type. The dataset is divided into a training set and a test set, with the training set containing 4900 samples and the test set containing 100 samples. The download size of the dataset is 3342612 bytes, and the total size is 6517068 bytes. The data file paths are data/train-* and data/test-*.
提供机构:
Kamyar-zeinalipour
原始信息汇总
数据集概述
基本信息
- 名称: ita_cw_text_mistal_v3
- 描述: Kamyar-zeinalipour/ita_cw_text_mistal_v3 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献。
- 创建者: Kamyar Zeinalipour
- 关键词:
- 1K - 10K
- parquet
- Text
- Datasets
- pandas
- Croissant
- 🇺🇸 Region: US
数据集结构
- 分布:
-
类型: cr:FileObject
-
名称: repo
-
描述: HF Mirror git 仓库。
-
编码格式: git+https
-
类型: cr:FileSet
-
名称: parquet-files-for-config-default
-
描述: 由 HF Mirror 转换的基础 Parquet 文件(参见:https://hf-mirror.com/docs/datasets-server/parquet)。
-
包含于: repo
-
编码格式: application/x-parquet
-
包含: default//.parquet
-
记录集
- 类型: cr:RecordSet
- 名称: default
- 描述: Kamyar-zeinalipour/ita_cw_text_mistal_v3 - default 子集
- 2 个分割: train, test
- 字段:
- 类型: cr:Field
- 名称: default/text
- 描述: HF Mirror parquet 文件中的 text 列。
- 数据类型: sc:Text
- 来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: text



