five

IndustryInstruction

收藏
huggingface.co2025-01-22 收录
下载链接:
https://huggingface.co/datasets/BAAI/IndustryInstruction
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集为行业指令数据集,目前包含的行业中英文对照名称如下,本次数据旨在补充当前行业指令数据的空白,并挖掘BAAI/IndustryCorpus2预训练数据集中高质量预训练语料中包含的行业高价值知识。 汽车 : Automobiles 航空航天 : Aerospace 人工智能_机器学习 : Artificial-Intelligence 交通运输 : Transportation 科技_科学研究 : Technology-Research 法律_司法 : Law-Justice 金融_经济 : Finance-Economics 文学_情感 : Literature-Emotions 旅游_地理 : Travel-Geography 住宿_餐饮_酒店 : Hospitality-Catering 医疗 : Health-Medicine 学科教育 : Subject-Education 我们为每个数据集目录下面都提供了对应行业数据的 词云可视化和 数据质量分布曲线。如果需要单独行业的数据,可以跳转到单独的行业数据集地址… See the full description on the dataset page: https://huggingface.co/datasets/BAAI/IndustryInstruction.

This dataset is an industry instruction dataset, currently containing Chinese and English corresponding names of industries as follows. The aim of this dataset is to fill the gap in the current industry instruction data and to explore the high-value industry knowledge contained in the high-quality pre-trained corpus of the BAAI/IndustryCorpus2 pre-training dataset.
提供机构:
huggingface.co
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作