LocalDoc/news_azerbaijan_2
收藏Hugging Face2024-04-02 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/LocalDoc/news_azerbaijan_2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自https://musavat.com/的阿塞拜疆语新闻,创建于2024年,包含753k条新闻(约1100万句子)。数据集以CSV格式提供,每条新闻包含id、date、category、title和text字段。
该数据集包含来自https://musavat.com/的阿塞拜疆语新闻,创建于2024年,包含753k条新闻(约1100万句子)。数据集以CSV格式提供,每条新闻包含id、date、category、title和text字段。
提供机构:
LocalDoc
原始信息汇总
数据集概述
基本信息
- 语言: 阿塞拜疆语 (az)
- 许可证: Creative Commons Attribution-NonCommercial 4.0 International (cc-by-nc-4.0)
- 大小: 100K<n<1M
- 任务类别: 文本生成, 填充掩码
- 美观名称: 来自https://musavat.com/的阿塞拜疆新闻数据集
- 标签: 新闻
数据集详情
- 特征:
- id: 整数类型 (int64)
- date: 字符串类型 (string)
- category: 字符串类型 (string)
- title: 字符串类型 (string)
- text: 字符串类型 (string)
- 分割:
- 训练集:
- 字节数: 1678632196
- 示例数: 753359
- 训练集:
- 下载大小: 936135505
- 数据集大小: 1678632196
格式
- 文件格式: CSV
- 字段:
- id: 新闻唯一ID
- date: 新闻日期
- category: 新闻类别
- title: 新闻标题
- text: 新闻文本
许可证
- 版权归属: https://musavat.com/
- 使用要求: 引用时必须链接到相关资源
- 许可限制: 禁止商业使用
联系方式
- 邮箱: v.resad.89@gmail.com



