IndustryInstruction
收藏huggingface.co2025-01-22 收录
下载链接:
https://huggingface.co/datasets/BAAI/IndustryInstruction
下载链接
链接失效反馈官方服务:
资源简介:
本数据集为行业指令数据集,目前包含的行业中英文对照名称如下,本次数据旨在补充当前行业指令数据的空白,并挖掘BAAI/IndustryCorpus2预训练数据集中高质量预训练语料中包含的行业高价值知识。
汽车 : Automobiles
航空航天 : Aerospace
人工智能_机器学习 : Artificial-Intelligence
交通运输 : Transportation
科技_科学研究 : Technology-Research
法律_司法 : Law-Justice
金融_经济 : Finance-Economics
文学_情感 : Literature-Emotions
旅游_地理 : Travel-Geography
住宿_餐饮_酒店 : Hospitality-Catering
医疗 : Health-Medicine
学科教育 : Subject-Education
我们为每个数据集目录下面都提供了对应行业数据的 词云可视化和 数据质量分布曲线。如果需要单独行业的数据,可以跳转到单独的行业数据集地址… See the full description on the dataset page: https://huggingface.co/datasets/BAAI/IndustryInstruction.
This dataset is an industry instruction dataset, currently containing Chinese and English corresponding names of industries as follows. The aim of this dataset is to fill the gap in the current industry instruction data and to explore the high-value industry knowledge contained in the high-quality pre-trained corpus of the BAAI/IndustryCorpus2 pre-training dataset.
提供机构:
huggingface.co



