kanhatakeyama/AutoWikiQA
收藏Hugging Face2024-05-09 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/kanhatakeyama/AutoWikiQA
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-4.0
task_categories:
- question-answering
language:
- ja
tags:
- synthetic
---
# Wikipedia日本語版からのQ&Aの自動生成
- [Mixtral 8x22bのGGUF(5bit)](https://huggingface.co/MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF)をベースに、Wikipedia日本語版の記事から、
- [自動生成コード1](https://github.com/KanHatakeyama/AutoGenQA/blob/master/GenQuestionsFromText.py)
- [自動生成コード2](https://github.com/KanHatakeyama/AutoGenQA/blob/master/DirctGenQAFromText.py)
- を使ってQ&Aを作成しました。
- 計算には東京工業大学のスーパーコンピュータTSUBAME4.0を利用しました。
# 注意
- 回答にハルシネーション等が含まれている可能性があるので、フィルタリングをかける必要があるかもしれません。
提供机构:
kanhatakeyama
原始信息汇总
数据集概述
数据集名称
- Wikipedia日本語版からのQ&Aの自動生成
数据集内容
- 基于Mixtral 8x22bのGGUF(5bit),从Wikipedia日本語版文章中自动生成问答。
- 使用以下自動生成代码:
数据集特点
- 可能包含需要过滤的敏感内容。
数据集语言
- 日语(ja)
数据集类别
- 问答(question-answering)
数据集标签
- 合成(synthetic)
许可证
- CC-BY-4.0



