five

dipteshkanojia/llama-2-qe-2023-indic-multi

收藏
Hugging Face2023-08-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dipteshkanojia/llama-2-qe-2023-indic-multi
下载链接
链接失效反馈
官方服务:
资源简介:
这是用于微调meta-llama/Llama-2-13b-chat-hf模型的WMT 2023共享任务数据集。数据集包含了从训练集和验证集中连接并打乱的En-Gu, Hi, Mr, Ta, Te数据,并排除了大约10个样本提示用于上下文学习场景。示例提示展示了如何从英语到马拉地语的翻译中预测z_score。
提供机构:
dipteshkanojia
原始信息汇总

数据集概述

许可证

  • CC BY-NC-SA 4.0

语言

  • 英语 (en)
  • 印地语 (hi)
  • 马拉地语 (mr)
  • 古吉拉特语 (gu)
  • 泰米尔语 (ta)
  • 泰卢固语 (te)

标签

  • 质量评估
  • llama-2-format
  • 指令调优
  • WMT 2023 数据

数据规模

  • 10K<n<100K

描述

  • 该数据集用于微调 meta-llama/Llama-2-13b-chat-hf 模型,作为 WMT 2023 共享任务的一部分。
  • 数据集包含从训练和验证集中拼接和打乱的 En-Gu, Hi, Mr, Ta, Te 数据。
  • 排除了约 10 个以上的样本提示,用于上下文学习场景的测试集。

样本提示

<s>[INST] <<SYS>> You are a quality estimation model which accuractely predicts the translation quality as mean z_score. For perfectly meaningful translation, predict high z_score and for a meaningless or erroneous translation predict low z_score. Penalize the z_score on translation errors within [TGT] based on source sentence in [SRC]. Do not consider any other exisiting translation evaluation metrics. <</SYS>> For the following translation from English to Marathi, [SRC] Mudiyettu performers purify themselves through fasting and prayer, then draw a huge image of goddess Kali, called as kalam, on the temple floor with coloured powders, wherein the spirit of the goddess is invoked. [/SRC][TGT] मुडियेट्टु कलाकार उपवास आणि प्रार्थनेद्वारे स्वतःला शुद्ध करतात, त्यानंतर मंदिराच्या मजल्यावर काळम नावाच्या देवीची मोठी प्रतिमा काढतात, ज्यात देवीच्या आत्म्याची प्रार्थना केली जाते. [/TGT], predict the z_score [/INST] z_score: -0.4986</s>

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作