five

ORCAS-I (Queries Annotated with Intent using Weak Supervision)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ORCAS-I
下载链接
链接失效反馈
官方服务:
资源简介:
ORCAS-I 是 ORCAS 数据集 (Craswell et al., 2020) 的注释版本,使用弱监督使用用户意图进行注释。它允许您根据各种类型的用户意图训练您的算法。这些意图最初取自 Broder (2002) 的分类:信息性、导航性和事务性。我们还改进了这一分类,并在信息类别中添加了两个子类别:事实和工具。如果意图在信息类别中没有得到任何标签,则将其归类为弃权。

ORCAS-I is an annotated version of the ORCAS dataset (Craswell et al., 2020), which was annotated with user intents via weak supervision. It enables the training of algorithms using various types of user intents. These intents were originally derived from the taxonomy proposed by Broder (2002): informational, navigational, and transactional. We further refined this taxonomy by adding two subcategories under the informational category: factual and instrumental. If an intent receives no labels within the informational category, it is classified as abstained.
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ORCAS-I是基于ORCAS数据集通过弱监督方法标注用户意图的版本,旨在支持算法训练以识别信息性、导航性和事务性等意图类别。该数据集由Radboud University和Vienna University of Technology于2022年发布,扩展了原始分类并包含事实和工具子类别。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作