five

investopedia-embedding-dataset

收藏
Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/investopedia-embedding-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
investopedia-embedding数据集专注于金融领域,利用从Investopedia抓取的非结构化数据,通过大型语言模型(LLM)生成结构化数据,适用于微调嵌入模型。该数据集包含主题、标题、问题和答案等字段,其中问题和答案构成训练嵌入模型的正样本对。数据集规模较大,分为90%训练集和10%测试集。数据生成过程采用自验证方法,以确保生成的问题-答案对的准确性。本数据集采用cc-by-nc-4.0授权许可。
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作