AdaptLLM/FiQA_SA|金融数据集|情感分析数据集
收藏数据集概述
数据集名称
- FiQA_SA
数据集配置
- config_name: FiQA_SA
- data_files:
- split: train
- path: train.csv
- split: test
- path: test.csv
- split: train
任务类别
- text-classification
- question-answering
- zero-shot-classification
语言
- en
标签
- finance
数据集来源
- 该数据集用于ICLR 2024论文《Adapting Large Language Models via Reading Comprehension》。
数据集用途
- 用于探索大型语言模型在特定领域文本上的继续预训练,以及通过阅读理解方法改进模型在生物医学、金融和法律领域的提示性能。
相关模型
- 该数据集支持的模型包括从LLaMA-1-7B和LLaMA-1-13B派生的领域特定模型,以及从LLaMA-2-Chat-7B派生的聊天模型。
数据集更新
- 2024/4/2: 发布了所有评估数据集的原始数据分割(训练和测试)。

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
CAMUS_public-ImageMask-Dataset
这是一个用于图像分割的CAMUS_public(心脏多结构超声分割采集)数据集。该数据集包含来自500名患者的临床检查,这些检查在法国圣艾蒂安大学医院进行,并根据当地伦理委员会的规定进行了完全匿名化处理。数据集旨在执行左心室射血分数测量,并反映了临床实践中的数据多样性,包括图像质量和病理情况的广泛变异。数据集分为训练集(450名患者)和测试集(50名新患者),原始输入图像以raw/mhd文件格式提供。
github 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
FLAME
FLAME数据集是由无人机拍摄的火灾图像和视频组成的公开数据集,主要用于森林火灾的监控和应急响应。该数据集包含615个训练样本和134个测试样本,分辨率为254×254。数据集的创建旨在通过高分辨率的视频和图像,帮助研究人员开发和验证用于火灾检测和监控的轻量级高效模型。FLAME数据集的应用领域主要集中在森林火灾的实时监控和应急响应,旨在提高火灾检测的准确性和效率,减少计算资源的消耗。
arXiv 收录