five

EcomGPT eval

收藏
github2023-08-01 更新2025-02-07 收录
下载链接:
https://github.com/Alibaba-NLP/EcomGPT
下载链接
链接失效反馈
资源简介:
EcomGPT评估数据集旨在评估大型语言模型(LLMs)在电子商务领域任务中的效能。该数据集包含6000个实例,每个实例是从12个专门用于电子商务评估的保留数据集中各抽取500个样本组成的。电子商务领域的任务被分为四大类:分类、生成、提取和杂项。这些任务涵盖了从粗粒度到细粒度的产品分类、产品标题生成、属性值检测以及电子商务命名实体识别等。

The EcomGPT evaluation dataset is designed to assess the performance of large language models (LLMs) in e-commerce domain tasks. The dataset consists of 6000 instances, each composed of 500 samples drawn from 12 dedicated data collections specifically for e-commerce evaluation. E-commerce tasks are categorized into four major types: classification, generation, extraction, and miscellaneous. These tasks encompass a range of activities from coarse-grained to fine-grained product classification, product title generation, attribute value detection, and e-commerce named entity recognition.
提供机构:
Alibaba
创建时间:
2023-08-01
原始信息汇总

EcomGPT数据集概述

数据集基本信息

  • 名称: EcomInstruct
  • 规模: 250万条指令数据
  • 特点: 首个电子商务领域指令数据集,通过构建原子任务扩展数据规模和任务多样性
  • 数据类型: 电子商务基础数据类型(产品信息、用户评论等)

数据集构成

  • 评估数据集: 12个(已开源)
  • 语言: 英文(EN)和中文(ZH)
  • 任务类型:
    • 命名实体识别
    • 实体跨度检测
    • 抽取式问答
    • 评论主题分类
    • 属性值识别
    • 属性值检测
    • 产品选择
    • 产品对齐
    • 标题属性匹配
    • 细粒度产品分类
    • 粗粒度产品分类
    • 标题生成

文件结构

. ├── [Dataset Name] │ └── tasks │ └── [task name] │ ├── meta-info.json │ └── test.json ...

性能表现

  • 评估结果: EcomGPT在12个电子商务保留数据集上的人工评估中,表现优于或与ChatGPT相当

相关模型

  • 模型名称: EcomGPT (7b1)
  • 模型来源: ModelScope (https://www.modelscope.cn/models/damo/nlp_ecomgpt_multilingual-7B-ecom/summary)
  • 基础模型: BLOOMZ

引用

bigquery @article{li2023ecomgpt, title={EcomGPT: Instruction-tuning Large Language Models with Chain-of-Task Tasks for E-commerce}, author={Li, Yangning and Ma, Shirong and Wang, Xiaobin and Huang, Shen and Jiang, Chengyue and Zheng, Hai-Tao and Xie, Pengjun and Huang, Fei and Jiang, Yong}, journal={arXiv preprint arXiv:2308.06966}, year={2023} }

搜集汇总
数据集介绍
main_image_url
构建方式
EcomGPT eval数据集的构建基于EcomInstruct指令数据集,该数据集包含250万条指令数据,旨在通过构建原子任务来扩展数据规模和任务多样性。原子任务涉及电子商务基础数据类型,如产品信息和用户评论,这些任务被定义为解决最终任务过程中隐含的中间任务,即链式任务。通过这种方式,数据集不仅丰富了任务类型,还增强了模型对基础语义的理解能力。
使用方法
使用EcomGPT eval数据集时,用户可以通过命令行工具进行模型性能评估。具体操作包括指定测试任务文件、模型名称或路径、结果文件名以及基础数据集目录。数据集文件结构清晰,每个任务目录下包含元信息文件和测试文件,便于用户快速定位和使用。此外,数据集还提供了详细的依赖安装指南,确保用户能够顺利运行评估脚本。
背景与挑战
背景概述
EcomGPT eval数据集由Yangning Li等研究人员于2023年提出,旨在通过指令微调大型语言模型(LLMs)以解决电子商务领域的复杂任务。该数据集的核心研究问题在于如何通过链式任务(Chain-of-Task)的方式,提升模型在电子商务场景中的语义理解和零样本泛化能力。EcomInstruct作为其基础数据集,包含了250万条指令数据,涵盖了产品信息、用户评论等多种电子商务基础数据类型。这一数据集的发布为电子商务领域的自然语言处理研究提供了重要的资源,推动了相关技术的发展。
当前挑战
EcomGPT eval数据集在构建和应用中面临多重挑战。首先,电子商务领域的任务多样性极高,涵盖从命名实体识别到产品分类等多种复杂任务,如何设计统一的指令格式以覆盖这些任务是一个关键问题。其次,数据集的构建需要处理海量的非结构化数据,如用户评论和产品描述,这对数据的清洗和标注提出了极高的要求。此外,尽管EcomGPT在零样本泛化能力上表现出色,但在实际应用中,如何进一步提升模型在跨语言和跨领域的适应性仍是一个亟待解决的问题。
常用场景
经典使用场景
EcomGPT eval数据集在电子商务领域的自然语言处理研究中扮演着关键角色。该数据集通过构建包含250万条指令数据的EcomInstruct,支持了从产品信息提取到用户评论分析等多种任务的训练和评估。特别是在零样本学习场景下,EcomGPT展现了卓越的泛化能力,使其成为电子商务领域语言模型研究的基石。
解决学术问题
EcomGPT eval数据集解决了电子商务领域中语言模型在复杂任务上的泛化能力问题。通过引入Chain-of-Task任务,模型能够从基础语义理解逐步过渡到复杂任务解决,显著提升了模型在命名实体识别、情感分析、产品分类等任务上的表现。这一创新为电子商务领域的自然语言处理研究提供了新的方法论支持。
实际应用
在实际应用中,EcomGPT eval数据集被广泛用于电子商务平台的智能客服、产品推荐系统和用户评论分析等场景。通过该数据集训练的模型能够高效处理多语言、多任务的需求,显著提升了用户体验和平台运营效率。例如,在跨语言产品匹配和细粒度产品分类任务中,EcomGPT展现了极高的准确性和鲁棒性。
数据集最近研究
最新研究方向
在电子商务领域,EcomGPT数据集的推出标志着大规模语言模型在电商应用中的新突破。该数据集通过构建包含250万条指令数据的EcomInstruct,显著提升了数据规模和任务多样性。这些数据涵盖了产品信息、用户评论等电商基础数据类型,并通过链式任务(Chain-of-Task)的设计,增强了模型在解决复杂任务时的语义理解能力。EcomGPT基于BLOOMZ模型进行训练,展现了卓越的零样本泛化能力,尤其在12个电商评估数据集上表现优异,甚至超越了ChatGPT。这一进展不仅推动了电商领域自然语言处理技术的发展,也为未来的智能客服、产品推荐等应用提供了强有力的技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作