five

EmbeddingStudio/synthetic-search-filters-raw

收藏
Hugging Face2024-02-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/EmbeddingStudio/synthetic-search-filters-raw
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Synthetic Search Filters Raw的原始版本,通过GPT-4 Turbo生成,包含了各种业务/服务类别的可能搜索过滤器及其表示。数据集的主要列包括category(业务/服务名称)和filters(JSON可解析的过滤器模式)。训练集和测试集的划分原则是为了测试模型在未见过的领域、过滤器和查询上的表现。

该数据集是Synthetic Search Filters Raw的原始版本,通过GPT-4 Turbo生成,包含了各种业务/服务类别的可能搜索过滤器及其表示。数据集的主要列包括category(业务/服务名称)和filters(JSON可解析的过滤器模式)。训练集和测试集的划分原则是为了测试模型在未见过的领域、过滤器和查询上的表现。
提供机构:
EmbeddingStudio
原始信息汇总

数据集概述

数据集信息

  • 许可证: Apache 2.0
  • 特征:
    • category: 业务/服务的名称 (字符串类型)
    • category_description: 业务/服务的描述 (字符串类型)
    • filter_name: 过滤器名称 (字符串类型)
    • representation_name: 表示名称 (字符串类型)
    • representation_type: 表示类型 (字符串类型)
    • representation_enum: 表示枚举 (字符串序列)
    • representation_examples: 表示示例 (字符串序列)
    • representation_pattern: 表示模式 (字符串类型)
  • 分割:
    • train_filters: 训练集 (411999 字节, 1725 样本)
    • test_filters: 测试集 (512983 字节, 2164 样本)
  • 下载大小: 128534 字节
  • 数据集大小: 924982 字节

配置

  • 默认配置:
    • train_filters: 数据路径为 data/train_filters-*
    • test_filters: 数据路径为 data/test_filters-*

任务类别

  • 令牌分类
  • 文本生成

语言

  • 英语

标签

  • 合成
  • 搜索查询
  • 电子商务
  • 在线商店
  • 旅行社
  • 教育机构AI
  • 招聘自动化
  • 银行数字服务
  • 投资AI分析
  • 保险科技创新
  • 财务咨询AI
  • 信用服务自动化
  • 支付处理技术
  • 抵押技术解决方案
  • 房地产数字解决方案
  • 税务技术服务
  • 风险管理AI
  • 合规自动化
  • 数字银行创新
  • 移动银行技术
  • 在线零售技术
  • 线下零售自动化
  • 汽车经销商技术
  • 餐厅自动化技术
  • 食品配送AI
  • 娱乐平台AI
  • 媒体平台技术
  • 政府服务自动化
  • 旅游科技创新
  • 消费者分析AI
  • 物流技术自动化
  • 供应链AI
  • 客户支持技术
  • 市场研究AI
  • 移动应用开发技术
  • 游戏开发AI
  • 云计算服务
  • 数据分析AI
  • 商业智能AI
  • 网络安全软件技术
  • UI/UX设计AI
  • 物联网开发技术
  • 项目管理工具AI
  • 版本控制系统技术
  • CI/CD自动化
  • 问题跟踪AI
  • 错误报告自动化
  • 协作开发环境
  • 团队沟通技术
  • 任务时间管理AI
  • 客户反馈AI
  • 云基础开发技术
  • 图像库存平台AI
  • 视频托管技术
  • 社交网络AI
  • 专业社交网络AI
  • 约会应用技术

数据集名称

  • Synthetic Search Filters Raw

数据集大小类别

  • 1K < n < 10K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作