un-general-debate-corpus-chunked
收藏Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/kalebr/un-general-debate-corpus-chunked
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含1970年至2016年联合国一般性辩论的转录文本,被分割成约250字符的片段,共计37307条。每条数据包含元数据(如联合国会议届次、发言国家、年份、原始完整转录文本)、嵌入向量(使用all-mpnet-base-v2模型生成)、UMAP降维向量以及信息权重分数。原始数据集由Alexander Baturo、Niheer Dasandi和Slava Mikhaylov准备,相关研究发表于2017年的《Research & Politics》期刊。数据集在Google Colab中准备,相关笔记本已公开。
创建时间:
2026-03-12



