five

alpaca-gpt4-data-en|自然语言处理数据集|机器学习数据集

收藏
魔搭社区2025-06-11 更新2024-05-15 收录
自然语言处理
机器学习
下载链接:
https://modelscope.cn/datasets/hurner/alpaca-gpt4-data-en
下载链接
链接失效反馈
资源简介:
## 数据集描述 该数据集为GPT-4生成的英文数据集,用于LLM的指令精调和强化学习等。 ### 数据集加载方式 ```python from modelscope.msdatasets import MsDataset ds = MsDataset.load("alpaca-gpt4-data-en", namespace="AI-ModelScope", split="train") print(next(iter(ds))) ``` ### 数据分片 数据已经预设了train分片。 ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/AI-ModelScope/alpaca-gpt4-data-en.git ``` ## 数据集版权信息 数据集已经开源,license为CC BY NC 4.0(仅用于非商业化用途),如有违反相关条款,随时联系modelscope删除。 ## 引用方式 ``` @article{peng2023gpt4llm, title={Instruction Tuning with GPT-4}, author={Baolin Peng, Chunyuan Li, Pengcheng He, Michel Galley, Jianfeng Gao}, journal={arXiv preprint arXiv:2304.03277}, year={2023} } ``` ## 参考链接 ``` https://huggingface.co/datasets/c-s-ale/alpaca-gpt4-data https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM ```
提供机构:
maas
创建时间:
2023-07-21
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

Data_on_Data_Analysts

我们正在探索数据分析师职位的就业市场趋势:需求技能、薪资变化和招聘模式。该数据集汇编了美国数据分析师职位的招聘信息,直接来源于Google的职位搜索结果。数据收集始于2022年11月4日,并持续增长,每天新增约100个职位信息,提供了当前就业市场的持续更新快照。

github 收录

CCPD

CCPD是一个大型的、多样化的、经过仔细标注的中国城市车牌开源数据集。CCPD数据集主要分为CCPD2019数据集和CCPD2020(CCPD-Green)数据集。CCPD2019数据集车牌类型仅有普通车牌(蓝色车牌),CCPD2020数据集车牌类型仅有新能源车牌(绿色车牌)。在CCPD数据集中,每张图片仅包含一张车牌,车牌的车牌省份主要为皖。CCPD中的每幅图像都包含大量的标注信息,但是CCPD数据集没有专门的标注文件,每张图像的文件名就是该图像对应的数据标注。

github 收录

Kaggle Stock Market Data

该数据集包含多个股票市场的历史数据,涵盖了股票的开盘价、收盘价、最高价、最低价、成交量等信息。数据集还包括了股票的代码、日期和市场名称等基本信息。

www.kaggle.com 收录