five

selmanbaysan/quora-tr

收藏
Hugging Face2025-02-28 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/selmanbaysan/quora-tr
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个单语种的数据集,主要语言为土耳其语。 数据集用于文本检索任务,来源于Quora问答社区。 数据集包含三种配置:默认、语料库和查询。 默认配置包括查询ID、语料库ID和分数等特征,分为开发和测试两个部分,分别有7626和15675个示例。 语料库配置包括标题和文本等特征,共有522931个示例。 查询配置包括查询文本,共有15000个示例。

This is a monolingual dataset primarily in Turkish. The dataset is for text retrieval tasks and is sourced from the Quora question-and-answer community. The dataset includes three configurations: default, corpus, and queries. The default configuration includes features such as query-id, corpus-id, and score, and is split into development and test parts with 7626 and 15675 examples respectively. The corpus configuration includes features like title and text, with a total of 522931 examples. The queries configuration includes query text and has 15000 examples.
提供机构:
selmanbaysan
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作