llm-jp/llm-jp-longbench-JEMHop

Name: llm-jp/llm-jp-longbench-JEMHop
Creator: llm-jp
Published: 2026-02-26 04:02:13
License: 暂无描述

Hugging Face2026-02-26 更新2026-04-05 收录

下载链接：

https://hf-mirror.com/datasets/llm-jp/llm-jp-longbench-JEMHop

下载链接

链接失效反馈

官方服务：

资源简介：

--- language: - ja license: cc-by-sa-4.0 task_categories: - question-answering task_types: - extractive-qa - multi-hop-qa pretty_name: llm-jp-longbench-JEMHopQA dataset_tags: - japanese - long-context - multi-hop - explainable-qa - benchmarking --- # llm-jp-longbench-JEMHopQA ## llm-jp LongBench ベンチマークについてこのデータセットは，GitHub リポジトリ https://github.com/llm-jp/llm-jp-longbench で公開されているllm-jp LongBenchベンチマークの評価対象データセットの一部として構築されています。 llm-jp LongBench ベンチマークは，日本語大型言語モデル（LLM）のロングコンテキスト処理能力を体系的に評価することを目的としており，複数の長文コンテキスト QA データセットを含んでいます。本データセットはその一つです。 --- ## データセット概要本データセットは、日本語の説明可能マルチホップ質問応答データセットJEMHopQA （Ishii et al., 2024）を基に、Wikipedia記事を付与することで構築したロングコンテキストQA評価用データセットです。最大65,536トークン規模の入力を想定しており、LLMのロングコンテキスト処理能力を評価することを目的としています。 --- ## 元データセットと改変内容 ### 元データセット - JEMHopQA - 回答導出ステップ情報を含む、日本語の根拠付きマルチホップ QA データセット - ライセンス：CC BY-SA 4.0 - 出典：Ishii et al. (2024) ### 本データセットで行った改変本データセットはJEMHopQAを基にした派生データセットです（CC BY-SA 4.0 準拠）。以下の改変を行っています。 - 各質問に対し、日本語 Wikipedia 記事をコンテキストとして付与派生物であるため、ライセンスはCC BY-SA 4.0を継承しています。 --- ## データ構造各サンプルは以下のカラムを持ちます。 | カラム名 | 説明 | |--------|------| | `qid` | 質問 ID | | `question` | 質問文（日本語） | | `context` | Wikipedia 由来の長文コンテキスト | | `answer` / `gold` | 正解回答 | 主に以下のファイルで構成されています。 - `jemhop_with_context.csv`（評価用） | トークン長の範囲 | 平均トークン長 | 質問数 | |---|---:|---:| | 0以上8K未満 | 5,453 | 126 | | 8K以上16K未満 | 12,388 | 262 | | 16K以上32K未満 | 23,485 | 332 | | 32K以上64K未満 | 46,048 | 258 | | 64K以上 | 96,293 | 81 | 上表は、JEMHopQA を基に構築した本データセットにおける、各質問に付与されたコンテキストのトークン長分布を示しています。ここで，K=1,024とします。 --- ## 使用例 ```python from datasets import load_dataset dataset = load_dataset("llm-jp/llm-jp-longbench-jemhop") ``` --- ## 参考文献 * Ai Ishii, Naoya Inoue, Hisami Suzuki, and Satoshi Sekine. 2024. JEMHopQA: Dataset for Japanese Explainable Multi-Hop Question Answering. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 9515–9525, Torino, Italia. ELRA and ICCL.

提供机构：

llm-jp

5,000+

优质数据集

54 个

任务类型

进入经典数据集