five

mlfoundations-dev/OH_DCFT_v3_wo_evol_instruct_70k

收藏
Hugging Face2024-10-30 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/mlfoundations-dev/OH_DCFT_v3_wo_evol_instruct_70k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含对话和源标签信息,主要用于自然语言处理任务。对话部分由from和value两个字段组成,分别表示对话的来源和内容,数据类型均为字符串。源标签部分是一个字符串序列,用于标识数据的来源。数据集包含一个训练集分割,包含947,056个示例,总大小为1,835,845,060字节。数据集的下载大小为966,652,896字节。

This dataset contains conversations and source label information, primarily used for natural language processing tasks. The conversation part consists of two fields: from and value, representing the source and content of the conversation, respectively, both of which are of string type. The source label part is a sequence of strings used to identify the source of the data. The dataset includes a training split with 947,056 examples, totaling 1,835,845,060 bytes. The download size of the dataset is 966,652,896 bytes.
提供机构:
mlfoundations-dev
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作