FewJoint 小样本联合学习基准数据集
收藏超神经2024-02-21 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/29239
下载链接
链接失效反馈官方服务:
资源简介:
FewJoint 基准数据集是来自于讯飞 AIUI 开放平台上真实用户语料和专家构造的语料(比例约为 3:7),包含 59 个真实领域,目前域最多的对话数据集之一。该数据集可以避免构造模拟域,非常适合小样本和元学习方法。
The FewJoint benchmark dataset consists of real user utterances and expert-constructed utterances from the iFLYTEK AIUI Open Platform, with a corpus ratio of approximately 3:7. It covers 59 real-world domains, making it one of the dialogue datasets with the largest number of domains currently available. This dataset eliminates the need to construct simulated domains, making it highly suitable for few-shot and meta-learning approaches.
创建时间:
2024-02-01
搜集汇总
数据集介绍

背景与挑战
背景概述
FewJoint是一个包含59个真实领域的小样本联合学习基准数据集,适合小样本和元学习方法评测。数据集来源于讯飞AIUI开放平台的真实用户语料和专家构造语料,并提供了配套的NLP few-shot learning工具平台MetaDialog,支持复杂任务如序列标注与多任务联合学习。
以上内容由遇见数据集搜集并总结生成



