notoxicpeople/japan_diet_q_and_a_sessions_20k
收藏Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/notoxicpeople/japan_diet_q_and_a_sessions_20k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过爬取日本国会问答网页创建的,包含了截至2024年3月27日的216次会议的数据。数据字段包括id、title和content,其中id由三部分组成,分别表示问题或回答、会议次数和问题编号。数据来源于日本国会的官方网站,并且提供了用于爬取数据的代码链接。数据集的语言为日语,许可证为MIT。
该数据集是通过爬取日本国会问答网页创建的,包含了截至2024年3月27日的216次会议的数据。数据字段包括id、title和content,其中id由三部分组成,分别表示问题或回答、会议次数和问题编号。数据来源于日本国会的官方网站,并且提供了用于爬取数据的代码链接。数据集的语言为日语,许可证为MIT。
提供机构:
notoxicpeople
原始信息汇总
Japan Diet Q&A Sessions Dataset
概要
- 该数据集是通过抓取议会问答网页创建的。
- 截至2024年3月27日,包含216个会议。
数据字段
- id: 由三部分组成。
- 初始字母表示是问题(a)还是回答(b)。
- 接下来的三位数字表示议会会议的编号。
- 最后三位数字是议会会议中的问题编号。
- title: 问题或回答的标题。
- content: 问题或回答的内容。
数据来源
- 数据来源于以下网站:
- https://www.shugiin.go.jp/Internet/itdb_shitsumon.nsf/html/shitsumon/menu_m.htm
抓取代码
- 数据是通过以下代码抓取的:
- https://github.com/notoxicpeople/japan_diet_q_and_a_scraping
许可证
- MIT



