Suchinthana/databricks-dolly-15k-tamil
收藏Hugging Face2023-11-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Suchinthana/databricks-dolly-15k-tamil
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个泰米尔语问答数据集,包含15012个训练样本。每个样本包括instruction(指令)、context(上下文)、response(回答)和category(类别)四个特征,数据类型均为字符串。数据集的总大小为35396494字节,下载大小为12881336字节。数据集的任务类别是问答,适用于10K到100K样本规模的应用场景。
提供机构:
Suchinthana
原始信息汇总
数据集概述
许可证
- 许可证类型:cc-by-sa-3.0
数据集信息
-
特征信息
- 名称:instruction
- 数据类型:string
- 名称:context
- 数据类型:string
- 名称:response
- 数据类型:string
- 名称:category
- 数据类型:string
- 名称:instruction
-
数据分割
- 名称:train
- 字节数:35396494
- 样本数:15012
- 名称:train
-
数据大小
- 下载大小:12881336
- 数据集大小:35396494
配置信息
- 配置名称:default
- 数据文件:
- 分割:train
- 路径:data/train-*
- 数据文件:
任务类别
- 任务类别:question-answering
语言
- 语言:ta
数据集大小类别
- 大小类别:10K<n<100K



