five

philipp-zettl/german-structured-output

收藏
Hugging Face2026-04-23 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/philipp-zettl/german-structured-output
下载链接
链接失效反馈
官方服务:
资源简介:
德国结构化输出数据集是一个专门用于训练语言模型从德语文本生成结构化输出(如JSON、函数调用、遵循模式的生成)的数据集。它包含4,521个示例,覆盖7种任务类型,包括命名实体识别、关系提取、函数调用、表单填写、模式遵循生成和GDPR匿名化。数据集89%的内容为德语,主要针对DACH地区,且完全符合GDPR和欧盟AI法案的要求。数据集采用CC BY-SA 4.0许可,可用于商业用途。

The German Structured Output Dataset is designed for training language models to produce structured outputs (JSON, function calls, schema-following generation) from German text. It contains 4,521 examples across 7 task types, including NER extraction, relation extraction, function calling, form filling, schema-following generation, and GDPR anonymization. The dataset is 89% German, domain-specific to the DACH region, and fully compliant with GDPR and EU AI Act requirements. It is licensed under CC BY-SA 4.0 for commercial use.
提供机构:
philipp-zettl
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作