Aratako/LimaRP-augmented-ja-WizardLM

Name: Aratako/LimaRP-augmented-ja-WizardLM
Creator: Aratako
Published: 2024-05-16 13:55:22
License: 暂无描述

Hugging Face2024-05-16 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Aratako/LimaRP-augmented-ja-WizardLM

下载链接

链接失效反馈

官方服务：

资源简介：

LimaRP-augmented-ja-WizardLM是一个基于grimulkan/LimaRP-augmented数据集，使用WizardLM-2-8x22B模型进行日语翻译的角色扮演学习数据集。翻译过程中使用了DeepInfra服务，并采用了3-shots prompting技术，同时限制了输出不超过8000个token。对于LLM特有的重复输出现象，采取了终止翻译并删除相应记录的措施。

提供机构：

Aratako

原始信息汇总

数据集概述

数据集名称

LimaRP-augmented-ja-WizardLM

数据集来源

基于grimulkan/LimaRP-augmented数据集，使用WizardLM-2-8x22B进行日语翻译。

数据集用途

用于角色扮演学习。

数据集特点

包含不适合所有观众的内容。
数据集大小：小于1000条记录。

翻译方法

使用3-shots prompting进行翻译。
使用mistral的tokenizer，翻译输出限制在不超过8000个tokens。
对于原始数据集中非常长的对话，在满足上述条件时，会在中途的回合结束翻译。
遇到LLM特有的重复输出现象时，会终止该记录的翻译。
由于上述原因，删除了12件不足1回合的记录。

许可证

Apache-2.0

5,000+

优质数据集

54 个

任务类型

进入经典数据集