five

Pile-FreeLaw|法律文本数据集|自然语言处理数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
法律文本
自然语言处理
下载链接:
https://opendatalab.org.cn/OpenDataLab/Pile-FreeLaw
下载链接
链接失效反馈
资源简介:
Pile-FreeLaw数据集是The Pile项目的一部分,它是一个面向法律文本的开放源代码数据集。该数据集旨在提供大量的法律相关文本,以支持自然语言处理和机器学习研究。
提供机构:
OpenDataLab
创建时间:
2023-07-19
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

Religious Composition by Country

该数据集包含了全球各个国家的宗教构成信息,包括主要宗教的信徒数量和比例。数据涵盖了基督教、伊斯兰教、佛教、印度教等多种宗教。

www.pewforum.org 收录

Air Quality Data from U.S. Embassies

该存储库包含从美国驻外使领馆收集的历史空气质量数据。

github 收录