Kamyar-zeinalipour/ita_cw_text_llama3_v3
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Kamyar-zeinalipour/ita_cw_text_llama3_v3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要部分:训练集和测试集。训练集包含4900个样本,总大小为7743777字节;测试集包含100个样本,总大小为163291字节。数据集的总大小为7907068字节,下载大小为3489524字节。数据集的特征包括一个名为text的字段,其数据类型为字符串。
The dataset consists of two main parts: a training set and a test set. The training set contains 4900 samples with a total size of 7743777 bytes, while the test set contains 100 samples with a total size of 163291 bytes. The total size of the dataset is 7907068 bytes, and the download size is 3489524 bytes. The dataset features include a field named text with a data type of string.
提供机构:
Kamyar-zeinalipour
原始信息汇总
数据集概述
基本信息
- 名称: ita_cw_text_llama3_v3
- 描述: Kamyar-zeinalipour/ita_cw_text_llama3_v3 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献。
- 创建者: Kamyar Zeinalipour
- URL: 数据集链接
数据集详情
- 格式: Parquet
- 关键词: 1K - 10K, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- 子集: default
- 描述: Kamyar-zeinalipour/ita_cw_text_llama3_v3 - default 子集
- 分割: train, test
- 字段:
- 名称: default/text
- 描述: 来自 HF Mirror parquet 文件的 text 列
- 数据类型: Text
数据分布
- 类型: FileObject
- 名称: repo
- 描述: HF Mirror git 仓库
- 内容 URL: 仓库链接
- 编码格式: git+https
- 类型: FileSet
- 名称: parquet-files-for-config-default
- 描述: 由 HF Mirror 转换的基础 Parquet 文件(参见: Parquet 文档)
- 包含于: repo
- 编码格式: application/x-parquet
- 包含: default//.parquet
其他信息
- 符合标准: MLCommons Croissant 1.0



