McGill-NLP/WebLINX
收藏Hugging Face2024-12-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/McGill-NLP/WebLINX
下载链接
链接失效反馈官方服务:
资源简介:
WebLINX是一个用于多轮对话中真实世界网站导航任务的数据集。该数据集包含图像到文本、文本生成、文本到文本生成和句子相似性等任务类别。数据集提供了多种配置,包括聊天和重新排序任务,并提供了训练、验证和测试等数据分割。数据集的使用受限于Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0)许可证,用户在使用时需要遵守相关条款。
WebLINX是一个用于多轮对话中真实世界网站导航任务的数据集。该数据集包含图像到文本、文本生成、文本到文本生成和句子相似性等任务类别。数据集提供了多种配置,包括聊天和重新排序任务,并提供了训练、验证和测试等数据分割。数据集的使用受限于Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0)许可证,用户在使用时需要遵守相关条款。
提供机构:
McGill-NLP
原始信息汇总
数据集概述
基本信息
- 名称: WebLINX
- 语言: 英语
- 大小: 10K<n<100K
- 配置名称: chat
- 许可证: CC BY-NC-SA 4.0
数据结构
- 配置:
- 默认: 是
- 数据文件:
- 训练集:
data/train.csv - 验证集:
data/valid.csv - 测试集 (IID):
data/test_iid.csv - 测试集 (地理):
data/test_geo.csv - 测试集 (视觉):
data/test_vis.csv - 测试集 (分类):
data/test_cat.csv - 测试集 (网页):
data/test_web.csv
- 训练集:
任务类别
- 图像到文本
- 文本生成
- 文本到文本生成
- 句子相似性
标签
- 对话式
- 图像到文本
- 视觉
- convAI
引用格式
bibtex @misc{lu-2024-weblinx, title={WebLINX: Real-World Website Navigation with Multi-Turn Dialogue}, author={Xing Han Lù and Zdeněk Kasner and Siva Reddy}, year={2024}, eprint={2402.05930}, archivePrefix={arXiv}, primaryClass={cs.CL} }



