five

Dataset of ‘A Literature Mining Method of Fusing Text and Table Extraction in Materials Science’

收藏
Mendeley Data2026-04-18 收录
下载链接:
https://data.mendeley.com/datasets/jxk2pmh8bt
下载链接
链接失效反馈
官方服务:
资源简介:
We propose a named entity recognition model for material text, called SciBERT-Fasttext-BiLSTM-CRF (SFBC). We used this model to identify named entities from texts in the stainless steel scientific literature and shared data on the frequency of occurrence of selected entities in this database between 2012 and 2021. By analysing the data in this dataset, researchers are able to understand the top research trends in stainless steel materials over the last decade.

我们提出了一种面向材料文本的命名实体识别(Named Entity Recognition, NER)模型,命名为SciBERT-Fasttext-BiLSTM-CRF(SFBC)。我们借助该模型从不锈钢领域的科技文献文本中识别命名实体,并共享了2012至2021年间该数据库内选定实体的出现频次数据。研究人员可通过分析该数据集内的数据,明晰近十年来不锈钢材料领域的主流研究趋势。
创建时间:
2022-11-14
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作