RoMQA
收藏RoMQA 数据集概述
数据来源与获取
- 数据生成:RoMQA 数据集可以通过脚本从标注、Wikidata 和 T-REx 中重新生成,脚本位于
dataset_construction目录下。 - 第三方数据下载:也可以从第三方下载已生成的数据集,下载链接为 romqa_data.zip。
- 数据解压与放置:下载后需解压至
./data目录,实验代码默认该目录包含正确数据文件。
数据集结构
- 数据分割:如果自行生成数据,应将分割文件手动放置在
data/{open,closed,gold}目录中。
实验运行
-
开放设置: bash python train_baselines.py --config-name open --multirun hydra/launcher=slurm hydra.launcher.partition=<partition> model=seq2seq_nl,seq2seq_dpr_nl hydra.launcher.constraint=volta32gb seed=1,2,3,4,5 project=open-1
-
封闭设置: bash python train_baselines.py --config-name closed --multirun hydra/launcher=slurm hydra.launcher.partition=<partition> model=binary_nl,binary_dpr_nl hydra.launcher.constraint=volta32gb seed=1,2,3,4,5 project=closed-1
-
黄金证据设置: bash python train_baselines.py --config-name gold --multirun hydra/launcher=slurm hydra.launcher.partition=<partition> model=binary_gold_sent_nl hydra.launcher.constraint=volta32gb seed=1,2,3,4,5 project=gold-1
提交与评估
-
提交格式:提交的 JSON 文件应包含示例
id和模型预测的 top-k 实体列表。 -
开发集验证: bash python predict.py --fdata data/open/top_20.dev.json.bz2 --fout pred.open.dev.json saves/open-1/sweep/15-seq2seq_dpr_nl-default/ python evaluation.py --fpred saves/open-1/sweep/15-seq2seq_dpr_nl-default/pred.open.dev.json --fdata data/gold/dev.json.bz2 --fout open.dev.eval.json
-
测试集预测: bash python predict.py --fdata data/open/top_20.test.noanswer.json.bz2 --fout pred.open.test.json saves/open-1/sweep/15-seq2seq_dpr_nl-default/ python predict.py --fdata data/closed/top_20.test.noanswer.json.bz2 --fout pred.closed.test.json saves/closed-1/sweep/15-binary_dpr_nl-default/
-
CodaLab 提交与评估: bash cl upload pred.open.dev.json cl run -n <open_or_closed>dev<my_model_name> -d "<model_name> by <my_name> at <my_affiliation>" --request-docker-image vzhong/romqa:0.1 --request-memory 8g evaluation.py:0x627bae34595e4bf4971197c9cb917f5e pred.json:<my_open_dev_uid> data.json.bz2:0x110deb430b3d46459099462ea65ceaf1 --- python evaluation.py --fpred pred.json --fdata data.json.bz2 --fout results.json
提交限制
- 每月提交次数:每个团队每月最多提交一次。
- 滥用处理:滥用提交系统的作者将被从排行榜中除名。
匿名提交
- 匿名处理:如需匿名提交,请在 CodaLab 中使用
anonymous作为名称和机构,并通过电子邮件联系作者获取结果。
许可证
- 主要许可证:RoMQA 主要采用 CC-BY-NC 许可证。
- 部分组件许可证:部分组件采用其他许可证,如 Apache 2.0、MIT 等。



