five

notoxicpeople/japan_diet_q_and_a_sessions_20k

收藏
Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/notoxicpeople/japan_diet_q_and_a_sessions_20k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过爬取日本国会问答网页创建的,包含了截至2024年3月27日的216次会议的数据。数据字段包括id、title和content,其中id由三部分组成,分别表示问题或回答、会议次数和问题编号。数据来源于日本国会的官方网站,并且提供了用于爬取数据的代码链接。数据集的语言为日语,许可证为MIT。

该数据集是通过爬取日本国会问答网页创建的,包含了截至2024年3月27日的216次会议的数据。数据字段包括id、title和content,其中id由三部分组成,分别表示问题或回答、会议次数和问题编号。数据来源于日本国会的官方网站,并且提供了用于爬取数据的代码链接。数据集的语言为日语,许可证为MIT。
提供机构:
notoxicpeople
原始信息汇总

Japan Diet Q&A Sessions Dataset

概要

  • 该数据集是通过抓取议会问答网页创建的。
  • 截至2024年3月27日,包含216个会议。

数据字段

  • id: 由三部分组成。
    • 初始字母表示是问题(a)还是回答(b)。
    • 接下来的三位数字表示议会会议的编号。
    • 最后三位数字是议会会议中的问题编号。
  • title: 问题或回答的标题。
  • content: 问题或回答的内容。

数据来源

  • 数据来源于以下网站:
    • https://www.shugiin.go.jp/Internet/itdb_shitsumon.nsf/html/shitsumon/menu_m.htm

抓取代码

  • 数据是通过以下代码抓取的:
    • https://github.com/notoxicpeople/japan_diet_q_and_a_scraping

许可证

  • MIT
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作