five

BEIR-PL|波兰语信息检索数据集|自然语言处理数据集

收藏
arXiv2024-05-16 更新2024-06-21 收录
波兰语信息检索
自然语言处理
下载链接:
https://huggingface.co/clarin-knext
下载链接
链接失效反馈
资源简介:
BEIR-PL是一个专为波兰语设计的大型异构信息检索基准数据集,由弗罗茨瓦夫理工大学创建。该数据集包含13个子数据集,旨在促进现代波兰语模型的开发、训练和评估。数据集内容涵盖多种信息检索任务,如问题回答和实体链接,数据来源于多个开放资源。创建过程中,研究团队使用机器翻译技术将原始数据集翻译成波兰语,并进行了细致的评估和比较。BEIR-PL数据集的应用领域广泛,特别适用于零样本学习方法,为波兰语自然语言处理领域提供了重要的资源和基准。
提供机构:
弗罗茨瓦夫理工大学
创建时间:
2023-05-31
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

Cultural Dimensions Dataset

该数据集包含了霍夫斯泰德文化维度理论(Hofstede's Cultural Dimensions Theory)的相关数据,涵盖了多个国家和地区的文化维度评分,如权力距离、个人主义与集体主义、男性化与女性化、不确定性规避、长期取向与短期取向等。这些数据有助于研究不同文化背景下的行为模式和价值观。

geerthofstede.com 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

California Housing

Housing prices for residencies in California

kaggle 收录