five

un-general-debate-corpus-chunked

收藏
Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/kalebr/un-general-debate-corpus-chunked
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1970年至2016年联合国一般性辩论的转录文本,被分割成约250字符的片段,共计37307条。每条数据包含元数据(如联合国会议届次、发言国家、年份、原始完整转录文本)、嵌入向量(使用all-mpnet-base-v2模型生成)、UMAP降维向量以及信息权重分数。原始数据集由Alexander Baturo、Niheer Dasandi和Slava Mikhaylov准备,相关研究发表于2017年的《Research & Politics》期刊。数据集在Google Colab中准备,相关笔记本已公开。
创建时间:
2026-03-12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作