five

llm-jp/llm-jp-longbench-JEMHop

收藏
Hugging Face2026-02-26 更新2026-04-05 收录
下载链接:
https://hf-mirror.com/datasets/llm-jp/llm-jp-longbench-JEMHop
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - ja license: cc-by-sa-4.0 task_categories: - question-answering task_types: - extractive-qa - multi-hop-qa pretty_name: llm-jp-longbench-JEMHopQA dataset_tags: - japanese - long-context - multi-hop - explainable-qa - benchmarking --- # llm-jp-longbench-JEMHopQA ## llm-jp LongBench ベンチマークについて このデータセットは,GitHub リポジトリ https://github.com/llm-jp/llm-jp-longbench で公開されているllm-jp LongBenchベンチマークの評価対象データセットの一部として構築されています。 llm-jp LongBench ベンチマークは,日本語大型言語モデル(LLM)の ロングコンテキスト処理能力を体系的に評価することを目的としており, 複数の長文コンテキスト QA データセットを含んでいます。 本データセットはその一つです。 --- ## データセット概要 本データセットは、日本語の説明可能マルチホップ質問応答データセットJEMHopQA (Ishii et al., 2024)を基に、Wikipedia記事を付与することで構築した ロングコンテキストQA評価用データセットです。 最大65,536トークン規模の入力を想定しており、LLMのロングコンテキスト処理能力を評価することを目的としています。 --- ## 元データセットと改変内容 ### 元データセット - JEMHopQA - 回答導出ステップ情報を含む、日本語の根拠付きマルチホップ QA データセット - ライセンス:CC BY-SA 4.0 - 出典:Ishii et al. (2024) ### 本データセットで行った改変 本データセットはJEMHopQAを基にした派生データセットです(CC BY-SA 4.0 準拠)。 以下の改変を行っています。 - 各質問に対し、日本語 Wikipedia 記事をコンテキストとして付与 派生物であるため、ライセンスはCC BY-SA 4.0を継承しています。 --- ## データ構造 各サンプルは以下のカラムを持ちます。 | カラム名 | 説明 | |--------|------| | `qid` | 質問 ID | | `question` | 質問文(日本語) | | `context` | Wikipedia 由来の長文コンテキスト | | `answer` / `gold` | 正解回答 | 主に以下のファイルで構成されています。 - `jemhop_with_context.csv`(評価用) | トークン長の範囲 | 平均トークン長 | 質問数 | |---|---:|---:| | 0以上8K未満 | 5,453 | 126 | | 8K以上16K未満 | 12,388 | 262 | | 16K以上32K未満 | 23,485 | 332 | | 32K以上64K未満 | 46,048 | 258 | | 64K以上 | 96,293 | 81 | 上表は、JEMHopQA を基に構築した本データセットにおける、 各質問に付与されたコンテキストのトークン長分布を示しています。ここで,K=1,024とします。 --- ## 使用例 ```python from datasets import load_dataset dataset = load_dataset("llm-jp/llm-jp-longbench-jemhop") ``` --- ## 参考文献 * Ai Ishii, Naoya Inoue, Hisami Suzuki, and Satoshi Sekine. 2024. JEMHopQA: Dataset for Japanese Explainable Multi-Hop Question Answering. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 9515–9525, Torino, Italia. ELRA and ICCL.
提供机构:
llm-jp
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作