five

hfl/stem_zh_instruction

收藏
Hugging Face2024-05-13 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/hfl/stem_zh_instruction
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 --- ## stem_zh_instruction 内容:STEM相关指令(gpt-3.5爬取),包含物理、化学、医学、生物学、地球科学;共计256K条。 Content: STEM related instructions (gpt-3.5 crawled), including physics, chemistry, medicine, biology, and earch science. 256K instruction data in total. | 学科 / Subject | 文件名 / File Name | 数量 / Num | | ------------------------ | :----------------: | :--------: | | 物理 / Physics | phy_50380.json | 50,380 | | 化学 / Chemistry | chem_50839.json | 50,839 | | 医学 / Medicine | med_54617.json | 54,617 | | 生物学 / Biology | bio_50282.json | 50,282 | | 地球科学 / Earth Science | earth_50068.json | 50,068 | | **总计** | | 256,186 | **项目地址 / Project:https://github.com/ymcui/Chinese-LLaMA-Alpaca-3**

许可证:Apache-2.0 ## stem_zh_instruction 本数据集为科学、技术、工程与数学(Science, Technology, Engineering, Mathematics,简称STEM)相关指令数据(由GPT-3.5爬取获取),涵盖物理、化学、医学、生物学、地球科学五大领域,总计包含256,186条指令样本。 | 学科 | 文件名 | 数据量 | | :----------------------- | :----------------: | :--------: | | 物理(Physics) | phy_50380.json | 50,380 | | 化学(Chemistry) | chem_50839.json | 50,839 | | 医学(Medicine) | med_54617.json | 54,617 | | 生物学(Biology) | bio_50282.json | 50,282 | | 地球科学(Earth Science)| earth_50068.json | 50,068 | | **总计** | | 256,186 | **项目地址:** https://github.com/ymcui/Chinese-LLaMA-Alpaca-3
提供机构:
hfl
原始信息汇总

数据集概述

数据集名称

  • stem_zh_instruction

数据集内容

  • 学科范围:物理、化学、医学、生物学、地球科学
  • 数据来源:gpt-3.5爬取
  • 数据总量:256K条

数据集详细信息

学科 / Subject 文件名 / File Name 数量 / Num
物理 / Physics phy_50380.json 50,380
化学 / Chemistry chem_50839.json 50,839
医学 / Medicine med_54617.json 54,617
生物学 / Biology bio_50282.json 50,282
地球科学 / Earth Science earth_50068.json 50,068
总计 256,186

许可证

  • 许可证类型:Apache-2.0
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作