TalTechNLP/err-newsroom-keyphrases
收藏Hugging Face2023-09-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TalTechNLP/err-newsroom-keyphrases
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是ERR Newsroom数据集的一个子集,每个新闻文章最多分配了5个关键词短语。这些关键词短语是使用OpenAI API的`gpt-3.5-turbo`模型生成的。
提供机构:
TalTechNLP
原始信息汇总
ERR Newsroom Keyphrases
概述
- 数据集名称: ERR Newsroom Keyphrases
- 许可证: cc-by-4.0
- 任务类别:
- 摘要生成
- 文本到文本生成
- 语言:
- 爱沙尼亚语
- 别名: ERR Newsroom Keyphrases
详细描述
- 数据来源: 该数据集是ERR Newsroom的一个子集。
- 内容描述: 每个新闻文章最多分配5个关键词。
- 关键词生成方法: 使用OpenAI API和
gpt-3.5-turbo模型生成关键词(参见脚本extract-keywords-openai.py)。



