community-datasets/times_of_india_news_headlines
收藏数据集卡片:印度时报新闻标题
数据集描述
数据集摘要
该新闻数据集是一个持久的印度次大陆历史事件档案,从2001年初到2020年中,由印度记者实时记录。它包含印度时报发布的约330万个事件。作为一家新闻机构,印度时报集团覆盖了整个亚洲的广大受众,每天发布的英文文章数量远超其他任何机构。由于多年来的每日大量发布,该数据提供了对印度社会、其优先事项、事件、问题和讨论点的深入见解,以及它们随时间的发展。可以根据一个或多个方面将该数据集切割成更小的部分进行更集中的分析。
支持的任务和排行榜
[更多信息需补充]
语言
数据集中的文本为英语。
数据集结构
数据实例
json { "publish_date": "20010530", "headline_category": "city.kolkata", "headline_text": "Malda fake notes" }
数据字段
publish_date: 发布日期,格式为yyyyMMddheadline_category: 事件类别,使用ASCII码,点分隔值headline_text: 文章标题
数据分割
该数据集没有分割。
数据集创建
策划理由
[更多信息需补充]
源数据
初始数据收集和规范化
[更多信息需补充]
源语言生产者
[更多信息需补充]
注释
注释过程
[更多信息需补充]
注释者
[更多信息需补充]
个人和敏感信息
[更多信息需补充]
使用数据的注意事项
数据集的社会影响
[更多信息需补充]
偏见的讨论
[更多信息需补充]
其他已知限制
[更多信息需补充]
附加信息
数据集策展人
数据集由Rohit Kulkarni创建。
许可信息
数据集采用CC0: 公共领域许可。
引用信息
bibtex @data{DVN/DPQMQH_2020, author = {Kulkarni, Rohit}, publisher = {Harvard Dataverse}, title = {{Times of India News Headlines}}, year = {2020}, version = {V1}, doi = {10.7910/DVN/DPQMQH}, url = {https://doi.org/10.7910/DVN/DPQMQH} }
贡献
感谢@tanmoyio添加此数据集。



