abhinand/tamil-alpaca
收藏Hugging Face2023-11-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/abhinand/tamil-alpaca
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Alpaca数据集的泰米尔语翻译版本,属于泰米尔LLaMA模型家族的一部分,旨在推动泰米尔语大语言模型的发展。数据集包含instruction、input、output、text和system_prompt等字段,主要用于文本生成任务。数据集的语言为泰米尔语,大小类别为10K<n<100K。
提供机构:
abhinand
原始信息汇总
数据集概述
数据集信息
特征
- instruction: 字符串类型
- input: 字符串类型
- output: 字符串类型
- text: 字符串类型
- system_prompt: 字符串类型
数据分割
- train: 包含51876个样本,总大小为287556653字节
数据集大小
- 下载大小: 0字节
- 数据集大小: 287556653字节
配置
- default: 数据文件路径为
data/train-*
许可证
- GPL-3.0
任务类别
- 文本生成
语言
- 泰米尔语
数据集名称
- tamil-alpaca
数据集规模
- 10K<n<100K



