five

Short-Answer-Feedback/saf_legal_domain_german

收藏
Hugging Face2023-03-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Short-Answer-Feedback/saf_legal_domain_german
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为SAF - Legal Domain - German,主要包含德语法律领域的短答案反馈数据。数据集由专家生成,语言为德语,且为单语数据集。数据集规模在1K到10K之间,来源于原始数据。数据集的任务类别为文本生成,具体用于短答案反馈任务。数据集包含训练集、验证集和两个测试集(未见过的答案和未见过的问题)。每个数据实例包含问题、参考答案、提供的答案、答案反馈、验证反馈、错误类别和评分等信息。
提供机构:
Short-Answer-Feedback
原始信息汇总

数据集概述

数据集名称

  • 名称: SAF - Legal Domain - German
  • 别名: saf_legal_domain_german

数据集属性

  • 语言: 德语 (de)
  • 多语言性: 单语种
  • 大小: 1K<n<10K
  • 来源: 原创数据集
  • 标签: 短答案反馈, 法律领域
  • 任务类别: 文本到文本生成

数据集内容

  • 特征:
    • id: 字符串类型
    • question: 字符串类型
    • reference_answer: 字符串类型
    • provided_answer: 字符串类型
    • answer_feedback: 字符串类型
    • verification_feedback: 字符串类型
    • error_class: 字符串类型
    • score: 浮点数类型 (float64)

数据集结构

  • 分割:
    • 训练集: 1596个实例
    • 验证集: 400个实例
    • 测试集 - 未见答案: 221个实例
    • 测试集 - 未见问题: 275个实例

许可证

  • 许可证: cc-by-4.0
搜集汇总
背景与挑战
背景概述
该数据集是德语法律领域的短答案反馈数据集,规模中等(1K-10K),包含多维度标注信息,适用于文本生成任务,尤其适合短答案反馈模型的训练和评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作