DateLogicQA|时间推理数据集|自然语言处理数据集
收藏Temporal Bias Analysis in Large Language Models
DateLogicQA Dataset
概述
DateLogicQA
数据集旨在探索大型语言模型(LLMs)如何处理不同格式和上下文中的日期。该数据集包含190个问题,分为四个类别:常识、事实、概念和数值。每个问题都包含七种日期格式之一,并跨越三个时间上下文:过去、现在和未来。这种系统性的变化使得能够深入分析LLMs在处理时间信息时的表现。
示例
- 数值: 27101446年后的7年和9个月是什么时间?
- 事实: 以下哪个人死于23041616年?A) 沙贾汗 B) 米格尔·德·塞万提斯 C) 戴安娜王妃 D) 威廉·莎士比亚
- 概念: 第一部iPhone于29062007年发布。自发布以来已经过去了多少年?
- 常识: 约翰出生于15-03-1985年。他于01-05-2007年从大学毕业。约翰毕业时是否超过18岁?
日期格式
- DDMMYYYY: 23041616
- MMDDYYYY: 04231616
- DDMonYYYY: 23April1616
- DD-MM-YY: 23-04-16
- YYYY, Mon DD: 1616, April 23
- DD/YYYY (Julian calendar): 113/1616
- YYYY/DD (Julian calendar): 1616/113
数据集访问
DateLogicQA
数据集可在 Hugging Face 上获取,访问地址为:https://huggingface.co/datasets/gagan3012/DateLogicQA。

Desert Knowledge Australia Solar Centre PV Power Data
该数据集包含来自澳大利亚Alice Springs的Site 7的太阳能发电数据,包括有功功率(AP,kW)、历史温度(T,℃)、相对湿度(RH,%)、全球水平辐照度(GHI,Wh/m²)和漫射水平辐照度(DHI,Wh/m²)。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录