five

tasksource/lsat-lr|法律考试数据集|逻辑推理数据集

收藏
hugging_face2024-03-25 更新2024-06-11 收录
法律考试
逻辑推理
下载链接:
https://hf-mirror.com/datasets/tasksource/lsat-lr
下载链接
链接失效反馈
资源简介:
数据集lsat-lr包含训练、验证和测试三个分割,每个分割的数据文件分别存储在data/train-*, data/validation-*, 和 data/test-*路径下。数据集的特征包括context, id_string, answers, label, 和 question,其中answers是字符串序列,其他特征为字符串或整数类型。训练集包含3504个样本,验证集506个样本,测试集510个样本。数据集总大小为5201824字节,下载大小为2725576字节。
提供机构:
tasksource
原始信息汇总

数据集概述

数据集配置

  • 配置名称: default
  • 数据文件:
    • 验证集: 路径为 data/validation-*
    • 训练集: 路径为 data/train-*
    • 测试集: 路径为 data/test-*

数据集信息

  • 特征:

    • context: 数据类型为 string
    • id_string: 数据类型为 string
    • answers: 数据类型为 string 的序列
    • label: 数据类型为 int64
    • question: 数据类型为 string
  • 数据集划分:

    • 验证集:
      • 字节数: 570916
      • 样本数: 506
    • 训练集:
      • 字节数: 4047956
      • 样本数: 3504
    • 测试集:
      • 字节数: 582952
      • 样本数: 510
  • 下载大小: 2725576 字节

  • 数据集大小: 5201824 字节

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录