five

azharmo/tamil-orca-transliterated

收藏
Hugging Face2024-03-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/azharmo/tamil-orca-transliterated
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个泰米尔语Orca风格的转写数据集,旨在增强大型语言模型在泰米尔语中的推理能力。数据集包含三列:Instruction、Query和Answer。它是通过GPT-4和Gemini模型生成的翻译和回答的融合版本。数据集的使用旨在显著提高AI语言模型在泰米尔语中的推理能力。如果在研究中使用此数据集或其任何组件,请在引用中予以承认。

该数据集是一个泰米尔语Orca风格的转写数据集,旨在增强大型语言模型在泰米尔语中的推理能力。数据集包含三列:Instruction、Query和Answer。它是通过GPT-4和Gemini模型生成的翻译和回答的融合版本。数据集的使用旨在显著提高AI语言模型在泰米尔语中的推理能力。如果在研究中使用此数据集或其任何组件,请在引用中予以承认。
提供机构:
azharmo
原始信息汇总

Tamil Orca-Style Dataset 概述

数据集基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本生成
  • 语言: 泰米尔语
  • 标签:
    • orca
    • 推理
    • 泰米尔语
    • 生成
    • 转写
  • 数据集大小: 10K<n<100K

数据集详情

  • 内容: 包含三个列 - Instruction, Query, 和 Answer。
  • 目的: 旨在显著提升泰米尔语AI语言模型的推理能力。
  • 使用: 如在研究中使用此数据集或其任何部分,请在引用中予以承认。

研究进展

  • 基于此数据集的研究正在进行中,并将很快发布,为泰米尔语语言模型训练和性能提供宝贵见解。

创建者

  • 创建者: Mohamed Azharudeen
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作