five

ayang903/maple

收藏
Hugging Face2024-03-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ayang903/maple
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于生成马萨诸塞州法案的摘要和分类标签,旨在通过机器学习和大型语言模型简化法律语言,使其更易于理解(达到9年级理解水平)。数据集包含从马萨诸塞州立法机构获取的法案,利用马萨诸塞州通用法律章节生成摘要和标签,并创建了一个仪表板来展示和保存生成的文本,最终集成到MAPLE平台中。

该数据集用于生成马萨诸塞州法案的摘要和分类标签,旨在通过机器学习和大型语言模型简化法律语言,使其更易于理解(达到9年级理解水平)。数据集包含从马萨诸塞州立法机构获取的法案,利用马萨诸塞州通用法律章节生成摘要和标签,并创建了一个仪表板来展示和保存生成的文本,最终集成到MAPLE平台中。
提供机构:
ayang903
原始信息汇总

Maple Bill Summarization and Tagging 数据集概述

数据集基本信息

  • 许可证: GPL-3.0
  • 任务类别:
    • 摘要生成
    • 文本分类
  • 语言: 英语
  • 标签: 法律
  • 名称: Maple Bill Summarization and Tagging
  • 大小类别: 100M<n<1B

数据集配置

  • 配置名称: main_data
  • 数据文件: demoapp/all_bills.csv

数据集描述

该项目旨在为马萨诸塞州的法案生成摘要和分类标签,以简化法律语言和内容,使其更容易被广大受众理解(9年级阅读水平)。通过探索不同的机器学习和大型语言模型服务,该项目从马萨诸塞州立法机构获取法案,生成摘要和分类标签,创建一个仪表板来显示和保存生成的文本,并将其部署和集成到MAPLE平台中。

数据集目录结构

  • Documentation: 包含项目的研究文档和操作细节。
  • EDA: 包含数据探索和分析的笔记本。
  • demoapp: 包含使用Streamlit构建的Web应用程序代码。
  • Prompts Engineering: 存储测试过的提示。
  • Tagging: 包含分类和标签列表。
  • Deployment: 包含部署的Streamlit Web应用程序链接。

伦理影响

该数据集完全开源,可通过马萨诸塞州一般法律API访问。项目团队和MAPLE同意在AI生成的文本中添加免责声明。尽管使用了开源的转换器来评估幻觉,但仍需专家和人工评估以维护可信赖的大型语言模型系统。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作