MSRA NER|命名实体识别数据集|中文数据集数据集
收藏
- MSRA NER数据集首次发表,由微软亚洲研究院(MSRA)发布,旨在为中文命名实体识别任务提供标准化的数据集。
- MSRA NER数据集首次应用于学术研究,成为中文自然语言处理领域的重要基准数据集之一。
- MSRA NER数据集在多个国际会议和期刊上被广泛引用,进一步巩固了其在命名实体识别研究中的地位。
- 随着深度学习技术的发展,MSRA NER数据集被用于训练和评估多种基于神经网络的命名实体识别模型。
- MSRA NER数据集继续被广泛使用,并在多个最新的研究成果中作为基准数据集进行性能评估。
- 1Chinese Named Entity Recognition Based on Conditional Random FieldsMicrosoft Research Asia · 2006年
- 2A Survey on Deep Learning for Named Entity RecognitionUniversity of Waterloo · 2018年
- 3Named Entity Recognition with Bidirectional LSTM-CNNsUniversity of Cambridge · 2016年
- 4Neural Architectures for Named Entity RecognitionStanford University · 2016年
- 5A Unified MRC Framework for Named Entity RecognitionTsinghua University · 2020年
Hang Seng Index
恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。
www.hsi.com.hk 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
TerraClimate
TerraClimate是一个全球月度气候和水分平衡数据集,涵盖了1958年至今的气候数据。该数据集包括温度、降水、蒸散量、径流、雪水当量、潜在蒸散量和土壤水分等变量。数据集的分辨率为4千米,适用于全球范围内的气候和水分平衡研究。
www.climatologylab.org 收录
IVLLab/MultiDialog
该数据集包含手动注释的元数据,将音频文件与转录、情感和其他属性链接起来。数据集支持多种任务,包括多模态对话生成、自动语音识别和文本到语音转换。数据集的语言为英语,并提供了一个黄金情感对话子集,用于研究对话中的情感动态。数据集的结构包括音频文件、对话ID、话语ID、来源、音频特征、转录文本、情感标签和原始路径等信息。
hugging_face 收录
UCF-Crime
UCF-犯罪数据集是128小时视频的新型大规模第一个数据集。它包含1900年长而未修剪的真实世界监控视频,其中包含13个现实异常,包括虐待,逮捕,纵火,殴打,道路交通事故,入室盗窃,爆炸,战斗,抢劫,射击,偷窃,入店行窃和故意破坏。之所以选择这些异常,是因为它们对公共安全有重大影响。这个数据集可以用于两个任务。首先,考虑一组中的所有异常和另一组中的所有正常活动的一般异常检测。第二,用于识别13个异常活动中的每一个。
OpenDataLab 收录