azharmo/tamil-orca-transliterated
收藏Hugging Face2024-03-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/azharmo/tamil-orca-transliterated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个泰米尔语Orca风格的转写数据集,旨在增强大型语言模型在泰米尔语中的推理能力。数据集包含三列:Instruction、Query和Answer。它是通过GPT-4和Gemini模型生成的翻译和回答的融合版本。数据集的使用旨在显著提高AI语言模型在泰米尔语中的推理能力。如果在研究中使用此数据集或其任何组件,请在引用中予以承认。
该数据集是一个泰米尔语Orca风格的转写数据集,旨在增强大型语言模型在泰米尔语中的推理能力。数据集包含三列:Instruction、Query和Answer。它是通过GPT-4和Gemini模型生成的翻译和回答的融合版本。数据集的使用旨在显著提高AI语言模型在泰米尔语中的推理能力。如果在研究中使用此数据集或其任何组件,请在引用中予以承认。
提供机构:
azharmo
原始信息汇总
Tamil Orca-Style Dataset 概述
数据集基本信息
- 许可证: Apache-2.0
- 任务类别: 文本生成
- 语言: 泰米尔语
- 标签:
- orca
- 推理
- 泰米尔语
- 生成
- 转写
- 数据集大小: 10K<n<100K
数据集详情
- 内容: 包含三个列 - Instruction, Query, 和 Answer。
- 目的: 旨在显著提升泰米尔语AI语言模型的推理能力。
- 使用: 如在研究中使用此数据集或其任何部分,请在引用中予以承认。
研究进展
- 基于此数据集的研究正在进行中,并将很快发布,为泰米尔语语言模型训练和性能提供宝贵见解。
创建者
- 创建者: Mohamed Azharudeen



