five

NLP - fast.ai datasets

收藏
aws亚马逊开源数据集2024-03-07 收录
下载链接:
https://registry.opendata.aws/fast-ai-nlp
下载链接
链接失效反馈
官方服务:
资源简介:
Some of the most important datasets for NLP, with a focus on classification, including IMDb, AG-News, Amazon Reviews (polarity and full), Yelp Reviews (polarity and full), Dbpedia, Sogou News (Pinyin), Yahoo Answers, Wikitext 2 and Wikitext 103, and ACL-2010 French-English 10^9 corpus. This is part of the fast.ai datasets collection hosted by AWS for convenience of fast.ai students. See documentation link for citation and license details for each dataset.

本数据集集合收录了自然语言处理(Natural Language Processing, NLP)领域极具代表性的一批以分类任务为核心的数据集,涵盖IMDb、AG-News、亚马逊评论(极性版与完整版)、Yelp评论(极性版与完整版)、DBpedia、搜狗新闻(拼音版)、雅虎问答、Wikitext 2与Wikitext 103,以及ACL 2010法语-英语10^9语料库。该集合隶属于fast.ai数据集库,由亚马逊云科技(Amazon Web Services, AWS)托管,旨在为fast.ai学员提供便捷的使用途径。如需获取各数据集的引用规范与授权详情,请查阅对应文档链接。
提供机构:
fast.ai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作