loremipsum3658/jur-entailment
收藏Hugging Face2023-08-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/loremipsum3658/jur-entailment
下载链接
链接失效反馈官方服务:
资源简介:
该数据集可能用于法律文本的相似性分析,包含三个分割:训练集、测试集和验证集。每个分割包含两个法律文本(ementa1和ementa2)以及它们之间的相似性分数(similarity)。
This dataset may be utilized for legal text similarity analysis, consisting of three splits: training set, test set, and validation set. Each split contains two legal texts (ementa1 and ementa2) and their similarity score, denoted as similarity.
提供机构:
loremipsum3658
原始信息汇总
数据集概述
数据集配置
- 默认配置 (
default)- 数据文件路径:
- 训练集 (
train):data/train-* - 测试集 (
test):data/test-* - 验证集 (
validation):data/validation-*
- 训练集 (
- 数据文件路径:
数据集信息
-
特征字段:
ementa1: 字符串类型 (string)ementa2: 字符串类型 (string)similarity: 浮点数类型 (float64)__index_level_0__: 整数类型 (int64)
-
数据分割:
- 训练集 (
train):- 字节数: 39538896
- 样本数: 17448
- 测试集 (
test):- 字节数: 8539490
- 样本数: 3739
- 验证集 (
validation):- 字节数: 8441857
- 样本数: 3739
- 训练集 (
-
数据集大小:
- 下载大小: 30802928 字节
- 数据集总大小: 56520243 字节



