昆虫数据集|昆虫识别数据集|图像分类数据集
收藏Kaggle Financial Statement Data
该数据集包含公司财务报表的数据,涵盖了多个公司的财务信息,如资产负债表、利润表和现金流量表等。数据以CSV格式提供,便于分析和处理。
www.kaggle.com 收录
stock_predicted
该数据集可用于循环神经网络的学习,股票预测数据集通常包含与股票市场相关的各种数据,目的是用于训练和测试机器学习模型,以预测股票价格或市场趋势。以下是一些常见的特征和数据类型,通常会在股票预测数据集中找到: 1. 基本特征 日期:每个数据点的日期。 开盘价(Open):股票在交易开始时的价格。 收盘价(Close):股票在交易结束时的价格。 数据集下载链接见:http://t.csdnimg.cn/VnnfE 代码学习也可见博主海里有太阳
阿里云天池 收录
TimeExtractor
该数据集由JioNLP创建,旨在微调大型语言模型(LLMs)以从文本中提取时间实体,并将其标准化为JSON格式。数据集分为两部分:general.json包含从各种新闻来源提取的样本,smartspeaker.json包含从语音助手获取的样本。提取过程首先从文本中提取原始时间实体字符串,然后通过大型模型进行标准化处理,最终结果可以输入到JioNLP的时间解析模块jio.parse中进行处理,以获得准确可靠的结果。数据集目前规模较小,未来可以通过添加各种类型的文本来扩展。
huggingface 收录
CodeGen
CodeGen数据集是一个用于代码生成和理解的大型数据集,包含了多种编程语言的代码片段和相应的自然语言描述。该数据集旨在帮助研究人员和开发者训练和评估代码生成模型,提高代码生成的准确性和效率。
github.com 收录
Asteroids by the Minor Planet Center
包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。
github 收录