I2B2 2010|医学信息提取数据集|自然语言处理数据集
收藏
- I2B2 2010数据集首次发表,作为I2B2挑战赛的一部分,旨在评估自然语言处理技术在临床文本中的应用。
- I2B2 2010数据集首次应用于多个研究项目,包括疾病预测、患者风险评估和临床决策支持系统。
- 基于I2B2 2010数据集的研究成果在多个国际会议上展示,推动了临床自然语言处理领域的发展。
- I2B2 2010数据集被纳入多个学术数据库,成为临床自然语言处理研究的标准数据集之一。
- I2B2 2010数据集的相关研究成果开始应用于实际临床环境中,提升了医疗信息系统的智能化水平。
- 1The I2B2 2010 Challenge on Clinical Concept ExtractionIndiana University School of Medicine · 2010年
- 2A Deep Learning Approach to I2B2 2010 Challenge: Clinical Concept ExtractionUniversity of Waterloo · 2018年
- 3Clinical Concept Extraction Using a Temporal Convolutional Network for the I2B2 2010 ChallengeUniversity of California, San Diego · 2020年
- 4A Hybrid Approach for Clinical Concept Extraction in the I2B2 2010 ChallengeUniversity of Texas Health Science Center at Houston · 2017年
- 5Evaluating the Performance of Named Entity Recognition in the I2B2 2010 ChallengeUniversity of Pittsburgh · 2016年
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)
中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。
地球大数据科学工程 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录