five

Nexdata | Large Language Model Data | SFT Data| Pre-training Data| LLM Data|Text AI & ML Training Data | Natural Language Processing (NLP) Data

收藏
Datarade2024-04-19 收录
下载链接:
https://datarade.ai/data-products/nexdata-large-language-model-data-foundation-model-text-nexdata
下载链接
链接失效反馈
官方服务:
资源简介:
1. Overview Nexdata has a vast collection of unlabeled text data, Natural Language Processing (NLP) Data, multiligual parallel corpus and multi-scene image-text caption data, available for delivery in seconds. 2. About Nexdata Nexdata owns off-the-shelf 200,000 hours of speech recognition data, 800TB of Annotated Imagery Data, about 2 billion pieces of Natural Language Processing (NLP) Data. These ready-to-go Natural Language Processing (NLP) Data support instant delivery, quickly improve the accuracy of AI models. For more details, please visit us at https://www.nexdata.ai/llm?source=Datarade

1. 概述 Nexdata拥有海量未标注文本数据、自然语言处理(Natural Language Processing, NLP)数据、多语言平行语料库及多场景图文描述数据,可实现秒级交付。 2. 关于Nexdata Nexdata现有现成可用的20万小时语音识别数据、800TB标注图像数据,以及约20亿条自然语言处理(NLP)数据。此类即拿即用的自然语言处理(NLP)数据支持即时交付,可快速提升AI模型的准确率。如需了解更多详情,请访问:https://www.nexdata.ai/llm?source=Datarade
提供机构:
Nexdata
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供海量无标注文本、多语言语料和图文描述数据,涵盖NLP、语音识别等多模态资源。供应商Nexdata拥有20万小时语音数据、800TB标注图像及20亿条NLP数据,支持即时交付以提升AI模型精度。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作