five

mmakipaa/shs_descriptions

收藏
Hugging Face2024-03-16 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/mmakipaa/shs_descriptions
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含赫尔辛基市提供的社会和健康护理服务的描述。数据来源于TPR Service Description Register REST API,通过API查询了361个英语描述的服务,并额外获取了64个相关的事务服务描述。数据集内容包括两个文件:一个是包含服务描述、文本描述和文本嵌入的JSON文件,另一个是使用文本嵌入索引服务描述的Chroma DB文件。

该数据集包含赫尔辛基市提供的社会和健康护理服务的描述。数据来源于TPR Service Description Register REST API,通过API查询了361个英语描述的服务,并额外获取了64个相关的事务服务描述。数据集内容包括两个文件:一个是包含服务描述、文本描述和文本嵌入的JSON文件,另一个是使用文本嵌入索引服务描述的Chroma DB文件。
提供机构:
mmakipaa
原始信息汇总

社会和健康护理服务描述数据集

数据集概述

该数据集包含赫尔辛基市提供的社会和健康护理服务的服务描述。数据来源于TPR服务描述注册REST API。

数据集构建

数据集通过从REST API获取服务描述构建而成。查询针对SOCIAL_AND_HEALTH_SERVICES主主题,返回了361项英语服务描述。此外,还获取了与这些服务相关的64项额外 errand 服务描述。

数据集内容

数据集包含两个文件:

  1. shs_descriptions.json.gz:该文件将API返回的JSON服务描述、文本描述和文本嵌入合并为一个JSON文件。
  2. chroma.sqlite3:这是一个使用文本嵌入索引服务文本描述的Chroma DB文件。

服务描述

服务描述以API返回的JSON格式提供。

文本描述

文本描述将JSON描述和链接的errand服务信息合并为每个服务的单一描述。描述经过细化,选择了相关字段并进行了额外处理,如目标群体和联系渠道。

文本嵌入

使用OpenAI的text-embedding-ada-002模型创建了文本描述的嵌入。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作