theatticusproject/cuad-qa|法律合同审查数据集|自然语言处理数据集
收藏数据集概述
名称: CUAD (Contract Understanding Atticus Dataset)
语言: 英语
许可证: CC-BY-4.0
多语言性: 单语种
大小: 10K<n<100K
源数据集: 原始数据
任务类别: 问答
任务ID:
- closed-domain-qa
- extractive-qa
训练与评估索引:
- 配置: default
- 任务: question-answering
- 任务ID: extractive_question_answering
- 分割:
- 训练分割: train
- 评估分割: test
- 列映射:
- 问题: question
- 上下文: context
- 答案:
- 文本: text
- 答案开始位置: answer_start
- 指标:
- 类型: cuad
- 名称: CUAD
数据集结构
特征:
- id: 字符串类型
- title: 字符串类型
- context: 字符串类型
- question: 字符串类型
- answers: 序列类型,包含:
- text: 字符串类型
- answer_start: int32类型
分割:
- 训练集: 22450个样本
- 测试集: 4182个样本
数据集创建
源数据:
- 包含510份商业合同,来自25种不同类型的合同。
注释:
- 由法律学生和律师进行多步骤注释过程,确保准确性。
个人和敏感信息:
- 部分合同条款因保护机密性而被编辑。
数据集使用考虑
社会影响: 未提供详细信息
偏见讨论: 未提供详细信息
其他已知限制: 未提供详细信息

Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
熟肉制品在全国需求价格弹性分析数据
为更好了解各市对熟肉制品的市场需求情况,本行业所有企业对相关熟肉制品需求弹性数据进行采集计算。如果熟肉制品需求量变动的比率大于价格变动的比率,那么熟肉制品需求富有弹性,说明顾客对于熟肉制品价格变化的敏感程度大,弹性越大,需求对价格变化越敏感,本行业所有企业可以在该市适当的降低熟肉制品价格来获得较多的收益。如果熟肉制品需求缺乏弹性,本行业所有企业可以在该市适当的提高熟肉制品价格来获得较多的收益。该项数据对本行业所有企业在全国的市场营销决策有重要意义。1.数据采集:采集相关熟肉制品在某一时间段全国的的需求数据和价格数据,按照市级进行整理归纳,得到该熟肉制品的需求量变动数值和价格变化数值。 2.算法规则:对采集得到的数据按照如下公式进行计算:需求弹性系数Ed=-(△Q/Q)÷(△P/P),得到需求弹性系数。式中:Q表示产品的需求量,单位为份;P表示产品的价格,单位为元;△Q表示需求量同比变动值,单位为份;△P表示价格同比变动值,单位为元。取需求弹性系数的绝对值|Ed|作为分析数据时的参考系数。 3.数据分析:根据|Ed|的数值可分析该熟肉制品的需求价格弹性。(1)|Ed|=1(单位需求价格弹性),说明需求量变动幅度与价格变动幅度相同;(2)1<|Ed|(需求富有弹性),说明需求量变动幅度大于价格变动幅度;(3)|Ed|<1(需求缺乏弹性),说明需求量变动幅度小于价格变动幅度。
浙江省数据知识产权登记平台 收录
ISIC 2018
ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。
challenge2018.isic-archive.com 收录