有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
HANNA (Human-ANnotated NArratives for ASG evaluation)
hanna_stories_annotations.csv
: 包含故事的原始注释
hanna_metrics_scores_llm.csv
: 包含每种系统每篇故事的平均人类注释、平均LLM注释和自动测量分数llm_answers
文件夹: 包含LLM的完整答案user.study.csv
: 包含约1,500个用户研究中的LLM解释注释hanna_llm_stories.csv
: 包含由Llama-7B, Beluga-13B, Llama-30B和Platypus2-70B生成的384个故事故事ID | 提示 | 人类 | 故事 | 模型 | 相关性 | 连贯性 | 同情心 | 惊喜 | 参与度 | 复杂性 |
---|---|---|---|---|---|---|---|---|---|---|
99 | 关于老年巫师和他的年轻女学徒的故事 | ... | ... | BertGeneration | 3 | 2 | 2 | 2 | 2 | 3 |
519 | 在僵尸末日中,你是永生的,僵尸忽略你,你试图在爆发期间过正常生活 | ... | ... | GPT-2 | 5 | 5 | 3 | 4 | 4 | 4 |
862 | 新总统当选时,他们接受了一个特殊的安全简报。实际上,这是一个古老的传统,其中各种导演、军事官员和现任部长提出虚假证据,并竞争看谁能说服总统相信最荒谬的事情 | ... | ... | Fusion | 2 | 1 | 1 | 1 | 1 | 1 |
用于评估自动故事生成(ASG)的质量,通过人类注释和自动评估指标来衡量故事的多个维度。
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
糖尿病预测数据集
糖尿病相关的医学研究或者健康数据
AI_Studio 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录