aaditya/databricks-dolly-15k-Hindi
收藏Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/aaditya/databricks-dolly-15k-Hindi
下载链接
链接失效反馈官方服务:
资源简介:
`aaditya/databricks-dolly-15k-Hindi` 是一个开源的印地语版本数据集,基于 `databricks/databricks-dolly-15k` 数据集。该数据集可用于学术或商业目的,遵循 [Creative Commons Attribution-ShareAlike 3.0 Unported License](https://creativecommons.org/licenses/by-sa/3.0/legalcode) 许可协议。支持的任务包括训练大型语言模型、生成合成数据和数据增强。数据集语言为印地语,版本为1.0。
`aaditya/databricks-dolly-15k-Hindi` 是一个开源的印地语版本数据集,基于 `databricks/databricks-dolly-15k` 数据集。该数据集可用于学术或商业目的,遵循 [Creative Commons Attribution-ShareAlike 3.0 Unported License](https://creativecommons.org/licenses/by-sa/3.0/legalcode) 许可协议。支持的任务包括训练大型语言模型、生成合成数据和数据增强。数据集语言为印地语,版本为1.0。
提供机构:
aaditya
原始信息汇总
数据集概述
数据集信息
- 特征列表:
en_instruction: 字符串类型en_input: 字符串类型en_output: 字符串类型id: 字符串类型en_category: 字符串类型hindi_instruction: 字符串类型hindi_input: 字符串类型hindi_output: 字符串类型hindi_category: 字符串类型
- 数据分割:
train: 包含15010个样本,占用38525353字节
- 下载大小: 18858317字节
- 数据集大小: 38525353字节
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:
标签
hindi
支持的任务
- 训练大型语言模型(LLMs)
- 合成数据生成
- 数据增强
语言
- 印地语(Hindi)
版本
- 1.0
引用
@misc {dolly_hindi, author = { Pal, Ankit }, title = { databricks-dolly-15k-Hindi}, year = 2024, url = { https://huggingface.co/datasets/aaditya/databricks-dolly-15k-Hindi }, doi = { 10.57967/hf/1676 }, publisher = { Hugging Face } }



