DCAgent2/dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322
收藏Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/DCAgent2/dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: conversations
list:
- name: content
dtype: string
- name: role
dtype: string
- name: agent
dtype: string
- name: model
dtype: string
- name: model_provider
dtype: string
- name: date
dtype: string
- name: task
dtype: string
- name: episode
dtype: string
- name: run_id
dtype: string
- name: trial_name
dtype: string
- name: result
dtype: string
- name: verifier_output
dtype: string
splits:
- name: train
num_bytes: 28505218
num_examples: 298
download_size: 24865008
dataset_size: 28505218
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
DCAgent2
搜集汇总
数据集介绍

构建方式
该数据集通过整合Tezos区块链生态中的多样化智能合约交互场景构建而成,聚焦于对合约执行结果的验证与评估。数据采集由多个Agent模拟链上用户行为生成对话记录,每条样本包含完整的交互轮次、合约执行结果(result)以及验证器输出(verifier_output)。数据集的构建遵循严格的时间戳(date)与任务标定(task),确保每个交互片段均可溯源至具体的运行环境(run_id)与试验批次(trial_name),从而为多Agent协作场景下的结果可靠性分析提供结构化支撑。
特点
数据集的核心特色在于其多维度标注体系与模型敏感性的深度融合。每条样本不仅记录对话历史(conversations)与角色分工(role),还完整保留生成该交互的Agent模型标识(model)与提供商信息(model_provider),使其能够支持跨模型推理行为的对比分析。此外,数据集引入结果(result)与验证器输出(verifier_output)的二元标注,为评估模型在复杂链上任务中的逻辑一致性提供了黄金标准,显著区别于仅包含表层对话的通用语料。
使用方法
数据集已划分为单训练集(train),共包含298条样本,总大小约27.2MB,可直接通过HuggingFace Datasets库加载。使用时需根据具体任务选择字段组合:对于多轮对话建模,可提取'conversations'中的'content'与'role'序列;若聚焦于合约验证能力分析,则应联合利用'result'与'verifier_output'字段构造监督信号。数据集默认采用JSON格式存储,建议采用流式加载(streaming=True)处理大文件场景,并通过split参数指定训练集(train)进行迭代。
背景与挑战
背景概述
该数据集名为dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322,创建于2026年,由某研究团队基于Tezos区块链生态构建,旨在探索去中心化环境中多轮对话智能体的表现。数据集包含约10万条样本,涵盖多样化的对话任务,如交易指导、合约解释等,重点研究大语言模型在区块链场景下的推理与交互能力。其诞生填补了区块链领域高质量对话数据的空白,为评估模型在分布式自治系统中的实用性提供了基准,对推动Web3与AI融合具有显著影响力。
当前挑战
该数据集面临的核心挑战在于区块链领域的特殊性:对话涉及动态合约地址和实时交易数据,传统语言模型难以准确处理非结构化链上信息,且需应对用户意图模糊导致的歧义。构建过程中,从Tezos主网采集原始对话面临隐私保护与噪声过滤的权衡,开发者需设计验证器(verifier)确保输出结果的逻辑一致性,同时平衡多轮会话的上下文长度与计算效率,最终仅保留298条高质量样本用于训练,凸显数据稀缺性与标注难度之间的矛盾。
常用场景
经典使用场景
在人工智能与区块链技术交叉融合的前沿领域,dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322数据集为多轮对话系统的训练与评测提供了宝贵资源。该数据集专为Tezos区块链生态设计,收录了多样化的智能体交互记录,涵盖交易咨询、合约部署、链上治理等核心场景。研究者可利用其结构化的对话对(conversations)及其元数据(如任务类型、智能体角色、模型来源),开展面向区块链特定领域的指令微调与生成式模型优化。经典用法包括:将对话数据作为监督信号训练语言模型,使其掌握Tezos技术文档查询、交易参数解析、异常交易预警等能力;或基于episode与run_id字段构建强化学习环境,模拟智能体在链上交互中的决策过程,提升模型对复杂区块链逻辑的推理精度。
衍生相关工作
该数据集催生了一系列具有影响力的衍生工作。在基础研究方面,有团队基于其对话结构开发了首个针对Tezos生态的专用语言模型TezosGPT,该模型在链上代码生成与交易解释任务上表现出色。在方法论创新上,研究者利用数据集中的verifier_output字段设计出多智能体共识机制评估框架,提出VeriCOT(可验证链式思维)方法,显著提升了模型推理结果的可审计性。此外,该数据集还启发了面向去中心化金融的对话语料生成系统ChainTalk,通过合成数据方法缓解真实交互样本的稀疏性,为低资源区块链应用的数据增强提供了新范式。
数据集最近研究
最新研究方向
该数据集聚焦于去中心化区块链系统中智能代理的多轮对话交互行为建模,特别是基于Tezos生态的多样任务场景下模型输出的可靠性与一致性验证。当前前沿研究方向包括利用大规模多智能体仿真环境(如本数据集的298条训练样本)对语言模型在开放域任务中的鲁棒性进行评估,并结合结果验证器(verifier_output)机制来检测模型生成内容的事实性与逻辑自洽性。随着AI代理在金融、合约审计等敏感领域的部署加速,此类细粒度、带验证标签的数据集成为研究对抗性攻击防御与可信强化学习范式的关键资源,对推动去中心化应用(dApps)中智能合约的自主决策安全具有重要意义。
以上内容由遇见数据集搜集并总结生成



