ai2-adapt-dev/daring-anteater-specialized

Name: ai2-adapt-dev/daring-anteater-specialized
Creator: ai2-adapt-dev
Published: 2024-07-30 00:07:41
License: 暂无描述

Hugging Face2024-07-30 更新2025-04-12 收录

下载链接：

https://hf-mirror.com/datasets/ai2-adapt-dev/daring-anteater-specialized

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: system dtype: string - name: mask dtype: string - name: dataset dtype: string - name: conversations list: - name: from dtype: string - name: value dtype: string splits: - name: train num_bytes: 166293498.773721 num_examples: 17082 download_size: 35834893 dataset_size: 166293498.773721 configs: - config_name: default data_files: - split: train path: data/train-* --- Made with: ``` from datasets import load_dataset data = load_dataset("json", data_files="https://huggingface.co/datasets/nvidia/Daring-Anteater/resolve/main/train.jsonl") data_filtered = data.filter(lambda ex: ex['dataset'] != "synthetic_conv") data_filtered.push_to_hub("ai2-adapt-dev/daring-anteater-specialized") ```

数据集信息：特征： - 名称：system 数据类型(dtype)：字符串(string) - 名称：mask 数据类型(dtype)：字符串(string) - 名称：dataset 数据类型(dtype)：字符串(string) - 名称：conversations 列表(list)： - 名称：from 数据类型(dtype)：字符串(string) - 名称：value 数据类型(dtype)：字符串(string) 拆分： - 名称：train 字节数(num_bytes)：166293498.773721 样本数(num_examples)：17082 下载大小：35834893 数据集大小：166293498.773721 配置： - 配置名称：default 数据文件： - 拆分：train 路径：data/train-* 使用以下代码创建： from datasets import load_dataset data = load_dataset("json", data_files="https://huggingface.co/datasets/nvidia/Daring-Anteater/resolve/main/train.jsonl") data_filtered = data.filter(lambda ex: ex['dataset'] != "synthetic_conv") data_filtered.push_to_hub("ai2-adapt-dev/daring-anteater-specialized")

提供机构：

ai2-adapt-dev

5,000+

优质数据集

54 个

任务类型

进入经典数据集