ceadar-ie/AIVision360-8k
收藏Hugging Face2023-08-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ceadar-ie/AIVision360-8k
下载链接
链接失效反馈官方服务:
资源简介:
AIVision360-8k是一个专门为媒体和新闻领域设计的数据集,旨在用于大型语言模型的微调。该数据集从专注于人工智能新闻的平台ainewshub.ie中精选而来,提供了超过8,000个条目,每个条目包含问题、回答和上下文三列,全面展示了AI相关讨论的当前发展和趋势。数据集的特点包括领域特异性、来源可靠性、Apache 2.0开源许可证、公共可访问性和大量数据量。适用于模型训练和AI趋势分析、情感分析及语言模式研究。
AIVision360-8k是一个专门为媒体和新闻领域设计的数据集,旨在用于大型语言模型的微调。该数据集从专注于人工智能新闻的平台ainewshub.ie中精选而来,提供了超过8,000个条目,每个条目包含问题、回答和上下文三列,全面展示了AI相关讨论的当前发展和趋势。数据集的特点包括领域特异性、来源可靠性、Apache 2.0开源许可证、公共可访问性和大量数据量。适用于模型训练和AI趋势分析、情感分析及语言模式研究。
提供机构:
ceadar-ie
原始信息汇总
数据集卡片 for AIVision360-8k
数据集描述
AIVision360 是一个专为媒体和新闻领域定制的领域特定数据集,旨在用于大型语言模型(LLMs)的指令微调。AIVision360-8k 数据集是从专注于人工智能新闻的 "ainewshub.ie" 平台精心挑选的集合,旨在全面展示 AI 相关讨论,突出该领域的当前发展和趋势。每个条目包含三列:"question"、"response" 和 "context"。这些列提供了 AI 新闻交互的结构化视图,其中 "question" 和 "response" 提供对 AI 主题的洞察,"context" 列提供额外的背景信息。
关键特性
- 领域特定性:数据集专注于 AI 新闻,适合该领域的研究人员、开发人员和专家。
- 来源可靠性:数据来自 "ainewshub.ie" 上的知名出版商,确保内容可靠性。
- 许可:数据集在 Apache 2.0 开源许可下发布,便于使用和修改。
- 可访问性:旨在供公众使用,支持 AI 社区的协作和分析。
- 数据量:包含超过 8,000 条记录,是 AI 新闻分析的重要资源。
预期用途
- 模型训练:适用于训练语言模型,增强其在 AI 新闻讨论中的能力。
- 研究:适用于 AI 趋势分析、情感分析和语言模式研究。
局限性
- 尽管经过精心策划,AI 新闻来源的潜在偏见可能仍存在于数据集中。
- 其专注于 AI 新闻,可能反映该特定领域的特定视角。
语言
英语
数据隐私
数据集包含公开的新闻文章,不包括私人标识符或敏感信息。
许可/归属
Copyright © 2023 CeADAR Connect Group。由 CeADAR (ceadar.ie) 开发,使用受 Apache 2.0 许可约束。
来源
仅从公认的 AI 新闻平台 ainewshub.ie 精心挑选。
标注指南
- Question:代表从新闻文章中提取的查询。
- Response:根据文章内容提供答案。
- Context:为查询-答案对提供背景信息。
反馈
如有关于数据集的问题或反馈,请联系 ahtsham.zafar@ucd.ie
免责声明
本数据集“按原样”提供,不附带任何保证或担保。尽管数据经过精心处理,但 CeADAR Connect Group 不对数据中的任何错误、遗漏或差异负责。用户应自行决定使用此数据集并承担相关风险。



