five

lcalvobartolome/ende_mind_topics

收藏
Hugging Face2025-10-06 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/lcalvobartolome/ende_mind_topics
下载链接
链接失效反馈
官方服务:
资源简介:
ENDE-MIND-Topics(英语-德语)是一个包含25,148个来自维基百科的文档片段的双语语料库,这些片段包含由PLTM模型训练得到的25个主题的主题模型信息。该数据集作为MIND管道的输入,用于多语言问答生成和差异检测。

ENDE-MIND-Topics (English–German) is a bilingual corpus of 25,148 Wikipedia-derived document chunks containing topic modeling information derived from training a PLTM model on this data with 25 topics. The dataset serves as input for the MIND pipeline, which performs multilingual question–answer generation and discrepancy detection.
提供机构:
lcalvobartolome
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作