five

drmworld/uird_t5-small_v.0.1

收藏
Hugging Face2024-04-10 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/drmworld/uird_t5-small_v.0.1
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: character struct: - name: age dtype: int64 - name: bio dtype: string - name: code dtype: string - name: country_flag dtype: string - name: created_at dtype: string - name: deleted_at dtype: 'null' - name: description dtype: string - name: display_name dtype: string - name: eleven_voice_id dtype: string - name: eleven_voice_settings struct: - name: similarity_boost dtype: float64 - name: stability dtype: float64 - name: style dtype: int64 - name: use_speaker_boost dtype: bool - name: height dtype: string - name: hobbies sequence: string - name: id dtype: string - name: image_cost dtype: int64 - name: is_ready_chat_content dtype: bool - name: is_ready_llm dtype: bool - name: is_ready_profile_content dtype: bool - name: is_ready_profile_data dtype: bool - name: level1_name dtype: string - name: level1_value dtype: int64 - name: level2_name dtype: string - name: level2_value dtype: int64 - name: level3_name dtype: string - name: level3_value dtype: int64 - name: llm_mw_url dtype: 'null' - name: location dtype: string - name: metadata struct: - name: age dtype: string - name: birthday dtype: string - name: body type dtype: string - name: description dtype: string - name: education dtype: string - name: example 2 / notes dtype: string - name: eye color dtype: string - name: family dtype: string - name: favorite destinations dtype: string - name: favorite food dtype: string - name: favorite movies / tv dtype: string - name: favorite music / artist dtype: string - name: favorite sports / team dtype: string - name: first_name dtype: string - name: gender dtype: string - name: hair color dtype: string - name: height dtype: string - name: hobbies dtype: string - name: ig / twitter bio dtype: string - name: location dtype: string - name: name dtype: string - name: nationality dtype: string - name: occupation dtype: string - name: personality dtype: string - name: pets dtype: string - name: pronoun dtype: string - name: pronoun_heshe dtype: string - name: turn ons dtype: string - name: website bio dtype: string - name: website headline dtype: string - name: zodiac sign dtype: string - name: nature dtype: string - name: ordering dtype: int64 - name: preferences sequence: string - name: updated_at dtype: string - name: welcome_message dtype: string - name: welcome_message_reply_suggestion dtype: string - name: user struct: - name: gender dtype: string - name: hobbies sequence: string - name: turn_ons sequence: string - name: history list: - name: id dtype: int64 - name: llm_id dtype: int64 - name: normal_request sequence: string - name: normal_tag dtype: string - name: picture_camera dtype: 'null' - name: picture_category dtype: string - name: picture_clothes dtype: string - name: picture_location dtype: string - name: picture_request sequence: string - name: role dtype: string splits: - name: train num_bytes: 26654 num_examples: 1 download_size: 68244 dataset_size: 26654 configs: - config_name: default data_files: - split: train path: data/train-* ---
提供机构:
drmworld
原始信息汇总

数据集概述

数据集特征

主要特征 - character

  • 年龄 (age):整数类型 (int64)
  • 简介 (bio):字符串类型 (string)
  • 代码 (code):字符串类型 (string)
  • 国家标志 (country_flag):字符串类型 (string)
  • 创建时间 (created_at):字符串类型 (string)
  • 删除时间 (deleted_at):空值 (null)
  • 描述 (description):字符串类型 (string)
  • 显示名称 (display_name):字符串类型 (string)
  • eleven_voice_id:字符串类型 (string)
  • eleven_voice_settings:结构体类型,包含:
    • 相似度提升 (similarity_boost):浮点数类型 (float64)
    • 稳定性 (stability):浮点数类型 (float64)
    • 风格 (style):整数类型 (int64)
    • 使用扬声器提升 (use_speaker_boost):布尔类型 (bool)
  • 身高 (height):字符串类型 (string)
  • 爱好 (hobbies):序列类型,字符串 (sequence: string)
  • ID (id):字符串类型 (string)
  • 图像成本 (image_cost):整数类型 (int64)
  • 是否准备好聊天内容 (is_ready_chat_content):布尔类型 (bool)
  • 是否准备好LLM (is_ready_llm):布尔类型 (bool)
  • 是否准备好个人资料内容 (is_ready_profile_content):布尔类型 (bool)
  • 是否准备好个人资料数据 (is_ready_profile_data):布尔类型 (bool)
  • level1_name:字符串类型 (string)
  • level1_value:整数类型 (int64)
  • level2_name:字符串类型 (string)
  • level2_value:整数类型 (int64)
  • level3_name:字符串类型 (string)
  • level3_value:整数类型 (int64)
  • llm_mw_url:空值 (null)
  • 位置 (location):字符串类型 (string)
  • 元数据 (metadata):结构体类型,包含多个字符串类型的字段
  • 自然 (nature):字符串类型 (string)
  • 排序 (ordering):整数类型 (int64)
  • 偏好 (preferences):序列类型,字符串 (sequence: string)
  • 更新时间 (updated_at):字符串类型 (string)
  • 欢迎消息 (welcome_message):字符串类型 (string)
  • 欢迎消息回复建议 (welcome_message_reply_suggestion):字符串类型 (string)

其他特征

  • 用户 (user):包含性别、爱好和兴奋点,均为序列类型,字符串
  • 历史 (history):列表类型,包含多个字段,如ID、LLM ID、请求、标签等,类型包括整数、字符串和序列

数据集分割

  • 训练集 (train):大小为26654字节,包含1个示例

数据集大小

  • 下载大小:68244字节
  • 数据集大小:26654字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作