Short-Answer-Feedback/saf_legal_domain_german
收藏Hugging Face2023-03-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Short-Answer-Feedback/saf_legal_domain_german
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为SAF - Legal Domain - German,主要包含德语法律领域的短答案反馈数据。数据集由专家生成,语言为德语,且为单语数据集。数据集规模在1K到10K之间,来源于原始数据。数据集的任务类别为文本生成,具体用于短答案反馈任务。数据集包含训练集、验证集和两个测试集(未见过的答案和未见过的问题)。每个数据实例包含问题、参考答案、提供的答案、答案反馈、验证反馈、错误类别和评分等信息。
提供机构:
Short-Answer-Feedback
原始信息汇总
数据集概述
数据集名称
- 名称: SAF - Legal Domain - German
- 别名: saf_legal_domain_german
数据集属性
- 语言: 德语 (de)
- 多语言性: 单语种
- 大小: 1K<n<10K
- 来源: 原创数据集
- 标签: 短答案反馈, 法律领域
- 任务类别: 文本到文本生成
数据集内容
- 特征:
- id: 字符串类型
- question: 字符串类型
- reference_answer: 字符串类型
- provided_answer: 字符串类型
- answer_feedback: 字符串类型
- verification_feedback: 字符串类型
- error_class: 字符串类型
- score: 浮点数类型 (float64)
数据集结构
- 分割:
- 训练集: 1596个实例
- 验证集: 400个实例
- 测试集 - 未见答案: 221个实例
- 测试集 - 未见问题: 275个实例
许可证
- 许可证: cc-by-4.0
搜集汇总
背景与挑战
背景概述
该数据集是德语法律领域的短答案反馈数据集,规模中等(1K-10K),包含多维度标注信息,适用于文本生成任务,尤其适合短答案反馈模型的训练和评估。
以上内容由遇见数据集搜集并总结生成



