five

llm-bg/bemir

收藏
Hugging Face2025-08-31 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/llm-bg/bemir
下载链接
链接失效反馈
官方服务:
资源简介:
BEMIR数据集是一个保加利亚语和英语双语的医学信息检索数据集,包含7,266个文档(3,633个保加利亚语和3,633个英语)和6,474个查询(3,237个保加利亚语和3,237个英语),以及134,294个相关性判断对,分为训练集、验证集和测试集。数据集可用于文本检索任务,并遵循cc-by-4.0许可。

The BEMIR dataset is a bilingual Bulgarian-English medical information retrieval dataset containing 7,266 documents (3,633 Bulgarian and 3,633 English) and 6,474 queries (3,237 Bulgarian and 3,237 English), along with 134,294 relevance judgments split into training, development, and test sets. The dataset is suitable for text retrieval tasks and is licensed under cc-by-4.0.
提供机构:
llm-bg
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作