hatakeyama-llm-team/AutoGeneratedJapaneseQA-other
收藏Hugging Face2024-05-19 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hatakeyama-llm-team/AutoGeneratedJapaneseQA-other
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过使用MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF模型自动生成的日语Q&A。数据来源包括团队创建的数据和Common Crawl。为了降低与原文的相似度,采用了随机部分摘录的方式生成文本,但可能存在不自然的句子,因此建议进行清理。
该数据集是通过使用MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF模型自动生成的日语Q&A。数据来源包括团队创建的数据和Common Crawl。为了降低与原文的相似度,采用了随机部分摘录的方式生成文本,但可能存在不自然的句子,因此建议进行清理。
提供机构:
hatakeyama-llm-team
原始信息汇总
数据集概述
数据集特征
- question: 数据类型为字符串
- database: 数据类型为字符串
- answer: 数据类型为字符串
- score: 数据类型为浮点数
数据集划分
- train:
- 数据量: 28000609.4768689 字节
- 示例数量: 21899
数据集大小
- 下载大小: 12881375 字节
- 数据集大小: 28000609.4768689 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:
语言
- 日语 (ja)



