aertit/xglm_enth2
收藏Hugging Face2023-06-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/aertit/xglm_enth2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: nb_token
dtype: int64
- name: metadata
dtype: string
splits:
- name: train
num_bytes: 358768.0
num_examples: 200
- name: test
num_bytes: 179384.0
num_examples: 100
download_size: 227036
dataset_size: 538152.0
task_categories:
- text-generation
- conversational
language:
- th
- en
---
# Dataset Card for "xglm_enth2"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
dataset_info:
特征字段:
- 名称:文本(text),数据类型:字符串(string)
- 名称:Token数(nb_token),数据类型:64位整型(int64)
- 名称:元数据(metadata),数据类型:字符串(string)
划分集:
- 名称:训练集(train),字节数:358768.0,样本数:200
- 名称:测试集(test),字节数:179384.0,样本数:100
下载大小:227036
数据集总大小:538152.0
任务类别:
- 文本生成(text-generation)
- 对话式(conversational)
支持语言:
- 泰语(th)
- 英语(en)
---
# 「xglm_enth2」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
aertit
原始信息汇总
数据集概述
数据集名称
- xglm_enth2
数据特征
- text:字符串类型
- nb_token:整数类型(int64)
- metadata:字符串类型
数据分割
- 训练集:
- 示例数量:200
- 数据大小:358768字节
- 测试集:
- 示例数量:100
- 数据大小:179384字节
数据集大小
- 下载大小:227036字节
- 总数据集大小:538152.0字节
任务类别
- 文本生成
- 对话系统
支持语言
- 泰语(th)
- 英语(en)



