five

liy140/multidomain-measextract-corpus

收藏
Hugging Face2023-09-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/liy140/multidomain-measextract-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个多领域语料库,用于测量提取(Seq2Seq变体)。它包含了三个数据集(measeval、bm和msp)的训练、验证和测试数据。其中,measeval和msp数据集分别改编自MeasEval(Harper等人,2021)和Material Synthesis Procedual(Mysore等人,2019)语料库。该仓库将msp和measeval的提取任务聚合到段落级别,并以json格式提供标签,以便进行Seq2Seq训练。
提供机构:
liy140
原始信息汇总

多领域测量提取语料库(Seq2Seq变体)

数据集配置

  • measeval

    • 训练集: measeval_paragraph_level_no_spans_train.json
    • 验证集: measeval_paragraph_level_no_spans_val.json
    • 测试集: measeval_paragraph_level_no_spans_test.json
  • bm

    • 训练集: bm_paragraph_level_no_spans_train.json
    • 验证集: bm_paragraph_level_no_spans_val.json
    • 测试集: bm_paragraph_level_no_spans_test.json
  • msp

    • 训练集: msp_paragraph_level_no_spans_train.json
    • 验证集: msp_paragraph_level_no_spans_val.json
    • 测试集: msp_paragraph_level_no_spans_test.json
  • all

    • 训练集:
      • measeval_paragraph_level_no_spans_train.json
      • bm_paragraph_level_no_spans_train.json
      • msp_paragraph_level_no_spans_train.json
    • 验证集:
      • measeval_paragraph_level_no_spans_val.json
      • bm_paragraph_level_no_spans_val.json
      • msp_paragraph_level_no_spans_val.json
    • 测试集:
      • measeval_paragraph_level_no_spans_test.json
      • bm_paragraph_level_no_spans_test.json
      • msp_paragraph_level_no_spans_test.json

任务类别

  • 令牌分类

语言

  • 英语

标签

  • 化学
  • 生物学

数据集大小

  • n<1K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作