five

GiliGold/KnessetCorpus

收藏
Hugging Face2026-02-26 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/GiliGold/KnessetCorpus
下载链接
链接失效反馈
官方服务:
资源简介:
Knesset(以色列议会)会议记录语料库是一个包含以色列议会会议记录的文本数据集,主要用于文本分类和文本生成任务。数据集使用希伯来语,涉及政治、议会、Knesset(以色列议会)、希伯来语和性别等标签。数据集大小为8,818,936,320字节,训练集包含32,261,066个示例。

The Knesset (Israeli Parliament) Proceedings Corpus is a text dataset containing proceedings of the Israeli Parliament, primarily intended for text-classification and text-generation tasks. The dataset is in Hebrew and includes tags such as politics, parliamentary, Knesset, Hebrew, and gender. The dataset size is 8,818,936,320 bytes, with a training set containing 32,261,066 examples.
提供机构:
GiliGold
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作