NTU Chinese Causal Corpus|中文文本分析数据集|因果关系研究数据集
收藏NTU Chinese Causal Corpus
概述
- 数据集名称:NTU Chinese Causal Corpus
- 包含内容:1,314对因果论证
- 基础来源:基于Chinese Discourse Treebank (CDTB)
数据格式
- 每行结构:每行代表一个实例,包含七个字段,字段间以制表符分隔。
- 字段说明:
- DOC_ID:CDTB文档名称
- Sentence_ID:文档中的句子编号
- Causal directionality:因果方向(Reason-Effect 或 Effect-Reason)
- Causal type:因果类型(Purpose, Background, Hypothetical, Inference, Condition, Cause-Result)
- Explicity/Implicity:显式或隐式
- Tense of Argument 1:第一个论证的时态(Past, Present, Future)
- Tense of Argument 2:第二个论证的时态(Past, Present, Future)
示例
- 示例内容:001.xml 14 Reason-Effect Purpose Explicit Present Past
- 示例解释:表示CDTB文档001.xml中第14句的因果信息,因果关系为Purpose(显式),因果方向为Reason-Effect,第一个论证时态为Present,第二个论证时态为Past。
数据下载
- 下载文件:chinese_tense.txt

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
NREL Wind Integration National Dataset (WIND) Toolkit
NREL Wind Integration National Dataset (WIND) Toolkit 是一个包含美国大陆风能资源和电力系统集成数据的综合数据集。该数据集提供了高分辨率的风速、风向、风能密度、电力输出等数据,覆盖了美国大陆的多个地理区域。这些数据有助于研究人员和工程师进行风能资源评估、电力系统规划和集成研究。
www.nrel.gov 收录