mmakipaa/shs_descriptions
收藏Hugging Face2024-03-16 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/mmakipaa/shs_descriptions
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含赫尔辛基市提供的社会和健康护理服务的描述。数据来源于TPR Service Description Register REST API,通过API查询了361个英语描述的服务,并额外获取了64个相关的事务服务描述。数据集内容包括两个文件:一个是包含服务描述、文本描述和文本嵌入的JSON文件,另一个是使用文本嵌入索引服务描述的Chroma DB文件。
该数据集包含赫尔辛基市提供的社会和健康护理服务的描述。数据来源于TPR Service Description Register REST API,通过API查询了361个英语描述的服务,并额外获取了64个相关的事务服务描述。数据集内容包括两个文件:一个是包含服务描述、文本描述和文本嵌入的JSON文件,另一个是使用文本嵌入索引服务描述的Chroma DB文件。
提供机构:
mmakipaa
原始信息汇总
社会和健康护理服务描述数据集
数据集概述
该数据集包含赫尔辛基市提供的社会和健康护理服务的服务描述。数据来源于TPR服务描述注册REST API。
数据集构建
数据集通过从REST API获取服务描述构建而成。查询针对SOCIAL_AND_HEALTH_SERVICES主主题,返回了361项英语服务描述。此外,还获取了与这些服务相关的64项额外 errand 服务描述。
数据集内容
数据集包含两个文件:
shs_descriptions.json.gz:该文件将API返回的JSON服务描述、文本描述和文本嵌入合并为一个JSON文件。chroma.sqlite3:这是一个使用文本嵌入索引服务文本描述的Chroma DB文件。
服务描述
服务描述以API返回的JSON格式提供。
文本描述
文本描述将JSON描述和链接的errand服务信息合并为每个服务的单一描述。描述经过细化,选择了相关字段并进行了额外处理,如目标群体和联系渠道。
文本嵌入
使用OpenAI的text-embedding-ada-002模型创建了文本描述的嵌入。



