有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
ICLR数据集
模型 | 高维准确率 | 二维准确率 |
---|---|---|
TF-IDF | 59.2% | 52.0% |
SVD | 58.9% | 55.9% |
SVD, $L^2$ | 60.7% | 56.7% |
SimCSE | 45.1% | 36.3% |
DeCLUTR-sci | 52.7% | 47.1% |
SciNCL | 58.8% | 54.9% |
SPECTER2 | 58.8% | 54.1% |
ST5 | 57.0% | 52.6% |
SBERT | 61.6% | 56.8% |
Cohere v3 | 61.1% | 56.4% |
OpenAI v3 | 62.3% | 57.1% |
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
COVID-19 Data Hub
COVID-19 Data Hub是一个全球性的COVID-19数据集,包含了来自多个国家和地区的疫情数据,涵盖了病例数、死亡数、康复数、测试数等信息。此外,数据集还包括了与疫情相关的经济、社会和政策数据。
covid19datahub.io 收录
VisDrone2019
适用于小目标航拍图像检测的数据集,已提前下载并在datasets文件夹下划分了训练集、测试集和验证集。
github 收录
CrowdHuman
CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性,包含训练、验证和测试集,共计47万个标注的人体实例,平均每张图像有23个人,包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。
github 收录