investopedia-embedding-dataset
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/investopedia-embedding-dataset
下载链接
链接失效反馈官方服务:
资源简介:
investopedia-embedding数据集专注于金融领域,利用从Investopedia抓取的非结构化数据,通过大型语言模型(LLM)生成结构化数据,适用于微调嵌入模型。该数据集包含主题、标题、问题和答案等字段,其中问题和答案构成训练嵌入模型的正样本对。数据集规模较大,分为90%训练集和10%测试集。数据生成过程采用自验证方法,以确保生成的问题-答案对的准确性。本数据集采用cc-by-nc-4.0授权许可。
创建时间:
2024-07-19



