EmbeddingStudio/synthetic-search-filters-raw
收藏Hugging Face2024-02-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/EmbeddingStudio/synthetic-search-filters-raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Synthetic Search Filters Raw的原始版本,通过GPT-4 Turbo生成,包含了各种业务/服务类别的可能搜索过滤器及其表示。数据集的主要列包括category(业务/服务名称)和filters(JSON可解析的过滤器模式)。训练集和测试集的划分原则是为了测试模型在未见过的领域、过滤器和查询上的表现。
该数据集是Synthetic Search Filters Raw的原始版本,通过GPT-4 Turbo生成,包含了各种业务/服务类别的可能搜索过滤器及其表示。数据集的主要列包括category(业务/服务名称)和filters(JSON可解析的过滤器模式)。训练集和测试集的划分原则是为了测试模型在未见过的领域、过滤器和查询上的表现。
提供机构:
EmbeddingStudio
原始信息汇总
数据集概述
数据集信息
- 许可证: Apache 2.0
- 特征:
category: 业务/服务的名称 (字符串类型)category_description: 业务/服务的描述 (字符串类型)filter_name: 过滤器名称 (字符串类型)representation_name: 表示名称 (字符串类型)representation_type: 表示类型 (字符串类型)representation_enum: 表示枚举 (字符串序列)representation_examples: 表示示例 (字符串序列)representation_pattern: 表示模式 (字符串类型)
- 分割:
train_filters: 训练集 (411999 字节, 1725 样本)test_filters: 测试集 (512983 字节, 2164 样本)
- 下载大小: 128534 字节
- 数据集大小: 924982 字节
配置
- 默认配置:
train_filters: 数据路径为data/train_filters-*test_filters: 数据路径为data/test_filters-*
任务类别
- 令牌分类
- 文本生成
语言
- 英语
标签
- 合成
- 搜索查询
- 电子商务
- 在线商店
- 旅行社
- 教育机构AI
- 招聘自动化
- 银行数字服务
- 投资AI分析
- 保险科技创新
- 财务咨询AI
- 信用服务自动化
- 支付处理技术
- 抵押技术解决方案
- 房地产数字解决方案
- 税务技术服务
- 风险管理AI
- 合规自动化
- 数字银行创新
- 移动银行技术
- 在线零售技术
- 线下零售自动化
- 汽车经销商技术
- 餐厅自动化技术
- 食品配送AI
- 娱乐平台AI
- 媒体平台技术
- 政府服务自动化
- 旅游科技创新
- 消费者分析AI
- 物流技术自动化
- 供应链AI
- 客户支持技术
- 市场研究AI
- 移动应用开发技术
- 游戏开发AI
- 云计算服务
- 数据分析AI
- 商业智能AI
- 网络安全软件技术
- UI/UX设计AI
- 物联网开发技术
- 项目管理工具AI
- 版本控制系统技术
- CI/CD自动化
- 问题跟踪AI
- 错误报告自动化
- 协作开发环境
- 团队沟通技术
- 任务时间管理AI
- 客户反馈AI
- 云基础开发技术
- 图像库存平台AI
- 视频托管技术
- 社交网络AI
- 专业社交网络AI
- 约会应用技术
数据集名称
- Synthetic Search Filters Raw
数据集大小类别
- 1K < n < 10K



