jon-tow/okapi_truthfulqa
收藏okapi_truthfulqa
数据集概述
okapi_truthfulqa 是一个多语言版本的 TruthfulQA 数据集。TruthfulQA 是一个用于衡量语言模型在生成问题答案时是否真实的基准测试。该基准包含 817 个问题,涵盖 38 个类别,包括健康、法律、金融和政治等领域。这些问题设计得使一些人类会因错误信念或误解而给出错误答案。为了表现良好,模型必须避免生成从模仿人类文本中学习到的错误答案。
数据集详情
数据集描述
- 创建者: Dac Lai, Viet 和 Van Nguyen, Chien 和 Ngo, Nghia Trung 和 Nguyen, Thuat 和 Dernoncourt, Franck 和 Rossi, Ryan A 和 Nguyen, Thien Huu
- 许可证: CC BY NC 4.0(仅允许非商业使用)
数据集来源
- 仓库: http://nlp.uoregon.edu/download/okapi-eval/datasets/
- 论文: Okapi (Lai et al., 2023)
引用
bibtex @article{dac2023okapi, title={Okapi: Instruction-tuned Large Language Models in Multiple Languages with Reinforcement Learning from Human Feedback}, author={Dac Lai, Viet and Van Nguyen, Chien and Ngo, Nghia Trung and Nguyen, Thuat and Dernoncourt, Franck and Rossi, Ryan A and Nguyen, Thien Huu}, journal={arXiv e-prints}, pages={arXiv--2307}, year={2023} }
bibtex @misc{lin2021truthfulqa, title={TruthfulQA: Measuring How Models Mimic Human Falsehoods}, author={Stephanie Lin and Jacob Hilton and Owain Evans}, year={2021}, eprint={2109.07958}, archivePrefix={arXiv}, primaryClass={cs.CL} }




