tiny_qa_benchmark_pp
收藏Tiny QA Benchmark++ (TQB++) 数据集概述
基本信息
- 许可证:
- 核心数据集: Apache-2.0
- 预生成合成数据集包: Eval-Only, Non-Commercial, No-Derivatives
- 数据集卡片和元数据: CC0-1.0
- 任务类别: 问答系统
- 任务ID: 抽取式问答、闭卷问答
- 语言: 英语(en)、德语(de)、阿拉伯语(ar)、韩语(ko)、法语(fr)、葡萄牙语(pt)、中文(zh)、日语(ja)、西班牙语(es)、土耳其语(tr)、俄语(ru)
- 标签: 合成数据、问答、评估、基准测试、LLMOps、冒烟测试
- 数据规模: 小于1K样本
数据集组成
-
核心英语数据集 (
core_en)- 52个手工制作的英语问答对
- 涵盖地理、历史、科学、数学、文学等通用知识
- 用于确定性回归测试的不可变黄金标准
-
合成生成的数据包 (
packs)- 多语言和主题微基准测试(如
pack_fr_40、pack_en_science_10) - 使用TQB++生成工具包创建
- 包含
id、lang(语言代码)和sha256(来源验证)字段
- 多语言和主题微基准测试(如
数据格式
- JSON Lines (
.jsonl)格式 - 每个JSON对象包含字段:
text: 问题提示label: 正确答案metadata.context: 支持答案的事实陈述tags.category: 问题所属的广泛类别tags.difficulty: 难度级别(easy、medium、hard)
主要用途
- 快速CI/CD检查
- 提示工程
- 跨语言漂移检测
- 针对性评估
- 评估工具集成
引用信息
bibtex @misc{koctinyqabenchmarkpp, author = {Vincent Koc}, title = {Tiny QA Benchmark++ (TQB++) Datasets and Toolkit}, year = {2025}, publisher = {Hugging Face & GitHub}, doi = {10.57967/hf/5531}, howpublished = {https://huggingface.co/datasets/vincentkoc/tiny_qa_benchmark_pp}, note = {See also: https://github.com/vincentkoc/tiny_qa_benchmark_pp} }
@misc{koctinyqabenchmark_original, author = {Vincent Koc}, title = {tiny_qa_benchmark}, year = {2025}, publisher = {Hugging Face}, journal = {Hugging Face Hub}, doi = {10.57967/hf/5417}, url = {https://huggingface.co/datasets/vincentkoc/tiny_qa_benchmark} }




