ayang903/maple
收藏Hugging Face2024-03-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ayang903/maple
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于生成马萨诸塞州法案的摘要和分类标签,旨在通过机器学习和大型语言模型简化法律语言,使其更易于理解(达到9年级理解水平)。数据集包含从马萨诸塞州立法机构获取的法案,利用马萨诸塞州通用法律章节生成摘要和标签,并创建了一个仪表板来展示和保存生成的文本,最终集成到MAPLE平台中。
该数据集用于生成马萨诸塞州法案的摘要和分类标签,旨在通过机器学习和大型语言模型简化法律语言,使其更易于理解(达到9年级理解水平)。数据集包含从马萨诸塞州立法机构获取的法案,利用马萨诸塞州通用法律章节生成摘要和标签,并创建了一个仪表板来展示和保存生成的文本,最终集成到MAPLE平台中。
提供机构:
ayang903
原始信息汇总
Maple Bill Summarization and Tagging 数据集概述
数据集基本信息
- 许可证: GPL-3.0
- 任务类别:
- 摘要生成
- 文本分类
- 语言: 英语
- 标签: 法律
- 名称: Maple Bill Summarization and Tagging
- 大小类别: 100M<n<1B
数据集配置
- 配置名称: main_data
- 数据文件:
demoapp/all_bills.csv
数据集描述
该项目旨在为马萨诸塞州的法案生成摘要和分类标签,以简化法律语言和内容,使其更容易被广大受众理解(9年级阅读水平)。通过探索不同的机器学习和大型语言模型服务,该项目从马萨诸塞州立法机构获取法案,生成摘要和分类标签,创建一个仪表板来显示和保存生成的文本,并将其部署和集成到MAPLE平台中。
数据集目录结构
- Documentation: 包含项目的研究文档和操作细节。
- EDA: 包含数据探索和分析的笔记本。
- demoapp: 包含使用Streamlit构建的Web应用程序代码。
- Prompts Engineering: 存储测试过的提示。
- Tagging: 包含分类和标签列表。
- Deployment: 包含部署的Streamlit Web应用程序链接。
伦理影响
该数据集完全开源,可通过马萨诸塞州一般法律API访问。项目团队和MAPLE同意在AI生成的文本中添加免责声明。尽管使用了开源的转换器来评估幻觉,但仍需专家和人工评估以维护可信赖的大型语言模型系统。



