five

QEU/databricks-dolly-16k-line_ja-2_of_4

收藏
Hugging Face2023-09-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/QEU/databricks-dolly-16k-line_ja-2_of_4
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是2023年流行的databrick-15k的日语版本,数据被分成了四部分。内容方面,数据集进行了多项修改,包括在片假名词汇后添加了英文注释,修正了异常记录,删除了信息价值低的内容,并添加了其他信息作为试验。

This dataset is the Japanese version of the widely used Databricks-15k in 2023, with the data split into four parts. In terms of content, multiple modifications have been made to the dataset: adding English annotations after katakana terms, correcting abnormal records, removing content with low informational value, and adding supplementary information for experimental trials.
提供机构:
QEU
原始信息汇总

数据集概述

数据集简介

  • 该数据集是2023年知名的databrick-15k的日本语版本。
  • 数据被分为四部分。

数据内容变更

  • 添加了括号中的英语到片假名词汇中。
  • 修正了作为问答的异常记录。
  • 删除了与“ゲームオブスローン”相关的低价值信息。
  • 作为各种试验,增加了其他信息。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作