RoD-TAL

Name: RoD-TAL
Creator: 布加勒斯特科学与技术国家大学，自动控制与计算机学院，布加勒斯特，罗马尼亚
Published: 2025-07-26 04:40:39
License: 暂无描述

arXiv2025-07-26 更新2025-07-30 收录

下载链接：

https://anonymous.4open.science/r/rodtal-exp-1F67

下载链接

链接失效反馈

官方服务：

资源简介：

RoD-TAL是一个包含罗马尼亚驾驶考试问题、文本和图像问题、带注释的法律参考和人工解释的新型多模态数据集。该数据集旨在评估大型语言模型和视觉语言模型在理解罗马尼亚交通法规方面的能力。数据集包括罗马尼亚法律文本、交通标志和驾驶考试问题，共1200个样本。数据集可用于研究信息检索、问答、视觉信息检索和视觉问答等领域。

RoD-TAL is a novel multimodal dataset encompassing Romanian driving test questions, text and image-based questions, annotated legal references and human-provided explanations. This dataset aims to evaluate the capabilities of large language models (LLMs) and vision-language models in comprehending Romanian traffic regulations. It contains 1200 samples covering Romanian legal texts, traffic signs and driving test questions, and can be used for research in fields such as information retrieval, question answering, visual information retrieval and visual question answering.

提供机构：

布加勒斯特科学与技术国家大学，自动控制与计算机学院，布加勒斯特，罗马尼亚

创建时间：

2025-07-26

搜集汇总

数据集介绍

构建方式

RoD-TAL数据集是一个多模态数据集，专注于罗马尼亚驾驶考试中的问题回答任务。该数据集由两部分组成：RoD-Law法律语料库和RoD-QA问答数据集。RoD-Law语料库从罗马尼亚官方法律来源中精心挑选，确保所有法律条文的时效性和相关性，涵盖了交通法规、道路法规、刑法等多个领域。RoD-QA数据集则基于罗马尼亚驾驶执照笔试中的多选题构建，每道问题均标注了相关的法律条文引用，并包含了基于文本和图像的问题。数据集的构建过程还包括对交通标志的详细注释，每个标志均提供名称、类别和简明解释，以支持问答和视觉问答任务。

特点

RoD-TAL数据集的特点在于其多模态性和法律基础性。它不仅包含文本形式的问题，还包含图像形式的问题，涵盖了18个主要类别和3个次要类别。每个问题都严格基于罗马尼亚法律条文，确保答案的可追溯性和法律准确性。此外，数据集还提供了丰富的视觉内容，包括140种不同的交通标志，每种标志均经过详细注释。数据集的结构设计支持多种任务评估，包括信息检索、问答、视觉信息检索和视觉问答，使其成为评估大型语言模型和视觉语言模型在法律领域应用的理想基准。

使用方法

RoD-TAL数据集的使用方法多样，适用于多种自然语言处理和计算机视觉任务。在信息检索任务中，可以利用RoD-Law语料库进行法律条文的检索和匹配。在问答任务中，可以通过RoD-QA数据集评估模型在理解和回答驾驶考试问题上的表现。视觉问答任务则结合了图像和文本信息，要求模型在理解图像内容的基础上回答问题。数据集还支持检索增强生成（RAG）管道的评估，通过结合检索和生成技术提升模型的表现。使用该数据集时，建议结合领域特定的微调和推理优化模型，以获得最佳效果。

背景与挑战

背景概述

RoD-TAL（Romanian Driving Tests And Laws）是一个专注于罗马尼亚驾驶法律的多模态数据集，由布加勒斯特理工大学等机构的研究团队于2025年创建。该数据集旨在评估大型语言模型（LLMs）和视觉语言模型（VLMs）在罗马尼亚驾驶法律文本和视觉问答任务中的理解和推理能力。RoD-TAL包含罗马尼亚驾驶考试中的文本和图像问题，并附有法律参考和人工解释的注释。该数据集的推出填补了低资源语言（如罗马尼亚语）在法律教育领域的空白，为智能法律教育工具的开发提供了重要资源。

当前挑战

RoD-TAL数据集面临的挑战主要包括两个方面：1) 领域问题的挑战：该数据集旨在解决罗马尼亚驾驶法律的多模态问答任务，但视觉推理任务仍然具有挑战性，尤其是在处理交通标志和复杂驾驶场景时。2) 构建过程中的挑战：数据集的构建需要从罗马尼亚法律官方来源收集和整理大量法律文档，并确保其相关性和时效性。此外，标注过程需要专业的法律知识，以确保问答对的法律参考和解释的准确性。另一个挑战是处理低资源语言（罗马尼亚语）的语义表示和检索问题，特别是在法律领域，术语和表达方式较为专业和复杂。

常用场景

经典使用场景

RoD-TAL数据集作为罗马尼亚驾驶法律领域的多模态基准，其经典使用场景主要集中在评估大型语言模型（LLMs）和视觉语言模型（VLMs）在理解与推理罗马尼亚交通法规方面的能力。通过结合文本和视觉问答任务，该数据集为研究者提供了一个标准化平台，用于测试模型在信息检索（IR）、视觉信息检索（VIR）、问答（QA）及视觉问答（VQA）等任务中的表现。特别是在低资源语言（如罗马尼亚语）和法律领域的交叉研究中，RoD-TAL通过标注的法律引用和人类解释，支持模型在复杂法律条文下的多模态推理能力验证。

解决学术问题

RoD-TAL解决了法律人工智能领域的关键学术问题：一是填补了低资源语言（罗马尼亚语）在法律问答任务中高质量数据集的空白；二是通过多模态设计（文本+图像）探索了法律知识的跨模态表示难题；三是验证了检索增强生成（RAG）在提升法律问答准确性中的作用。其标注的法律依据链（每答案对应具体法律条文）为可解释性法律AI研究提供了基础，而实验证明领域特定的微调可使检索召回率提升18%，推理优化模型（如o4-mini）的QA准确率超过驾驶考试通过线，为法律教育场景的模型部署提供了技术参考。

衍生相关工作

RoD-TAL衍生出三类经典工作：1) 法律密集检索器优化，如基于mE5small的领域微调方法，通过硬负例挖掘提升法律条文检索精度；2) 多模态提示工程，如结合图像描述生成（Caption+QA）和视觉查询重构的VQA策略，在交通标志识别任务中实现70%召回率；3) 低资源法律模型评估框架，被后续研究（如GRAF、RoQLLama）扩展至罗马尼亚其他法律领域。其构建的检索-问答协同范式也启发了EXAMS-V、LegalBench等跨领域基准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集