DCAgent2/dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322

Name: DCAgent2/dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322
Creator: DCAgent2
Published: 2026-04-24 22:29:27
License: 暂无描述

Hugging Face2026-04-24 更新2026-04-26 收录

下载链接：

https://hf-mirror.com/datasets/DCAgent2/dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: conversations list: - name: content dtype: string - name: role dtype: string - name: agent dtype: string - name: model dtype: string - name: model_provider dtype: string - name: date dtype: string - name: task dtype: string - name: episode dtype: string - name: run_id dtype: string - name: trial_name dtype: string - name: result dtype: string - name: verifier_output dtype: string splits: - name: train num_bytes: 28505218 num_examples: 298 download_size: 24865008 dataset_size: 28505218 configs: - config_name: default data_files: - split: train path: data/train-* ---

提供机构：

DCAgent2

搜集汇总

数据集介绍

构建方式

该数据集通过整合Tezos区块链生态中的多样化智能合约交互场景构建而成，聚焦于对合约执行结果的验证与评估。数据采集由多个Agent模拟链上用户行为生成对话记录，每条样本包含完整的交互轮次、合约执行结果（result）以及验证器输出（verifier_output）。数据集的构建遵循严格的时间戳（date）与任务标定（task），确保每个交互片段均可溯源至具体的运行环境（run_id）与试验批次（trial_name），从而为多Agent协作场景下的结果可靠性分析提供结构化支撑。

特点

数据集的核心特色在于其多维度标注体系与模型敏感性的深度融合。每条样本不仅记录对话历史（conversations）与角色分工（role），还完整保留生成该交互的Agent模型标识（model）与提供商信息（model_provider），使其能够支持跨模型推理行为的对比分析。此外，数据集引入结果（result）与验证器输出（verifier_output）的二元标注，为评估模型在复杂链上任务中的逻辑一致性提供了黄金标准，显著区别于仅包含表层对话的通用语料。

使用方法

数据集已划分为单训练集（train），共包含298条样本，总大小约27.2MB，可直接通过HuggingFace Datasets库加载。使用时需根据具体任务选择字段组合：对于多轮对话建模，可提取'conversations'中的'content'与'role'序列；若聚焦于合约验证能力分析，则应联合利用'result'与'verifier_output'字段构造监督信号。数据集默认采用JSON格式存储，建议采用流式加载（streaming=True）处理大文件场景，并通过split参数指定训练集（train）进行迭代。

背景与挑战

背景概述

该数据集名为dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322，创建于2026年，由某研究团队基于Tezos区块链生态构建，旨在探索去中心化环境中多轮对话智能体的表现。数据集包含约10万条样本，涵盖多样化的对话任务，如交易指导、合约解释等，重点研究大语言模型在区块链场景下的推理与交互能力。其诞生填补了区块链领域高质量对话数据的空白，为评估模型在分布式自治系统中的实用性提供了基准，对推动Web3与AI融合具有显著影响力。

当前挑战

该数据集面临的核心挑战在于区块链领域的特殊性：对话涉及动态合约地址和实时交易数据，传统语言模型难以准确处理非结构化链上信息，且需应对用户意图模糊导致的歧义。构建过程中，从Tezos主网采集原始对话面临隐私保护与噪声过滤的权衡，开发者需设计验证器（verifier）确保输出结果的逻辑一致性，同时平衡多轮会话的上下文长度与计算效率，最终仅保留298条高质量样本用于训练，凸显数据稀缺性与标注难度之间的矛盾。

常用场景

经典使用场景

在人工智能与区块链技术交叉融合的前沿领域，dev_set_v2_g1_diverse_tezos_100k_8b_20260424_173322数据集为多轮对话系统的训练与评测提供了宝贵资源。该数据集专为Tezos区块链生态设计，收录了多样化的智能体交互记录，涵盖交易咨询、合约部署、链上治理等核心场景。研究者可利用其结构化的对话对（conversations）及其元数据（如任务类型、智能体角色、模型来源），开展面向区块链特定领域的指令微调与生成式模型优化。经典用法包括：将对话数据作为监督信号训练语言模型，使其掌握Tezos技术文档查询、交易参数解析、异常交易预警等能力；或基于episode与run_id字段构建强化学习环境，模拟智能体在链上交互中的决策过程，提升模型对复杂区块链逻辑的推理精度。

衍生相关工作

该数据集催生了一系列具有影响力的衍生工作。在基础研究方面，有团队基于其对话结构开发了首个针对Tezos生态的专用语言模型TezosGPT，该模型在链上代码生成与交易解释任务上表现出色。在方法论创新上，研究者利用数据集中的verifier_output字段设计出多智能体共识机制评估框架，提出VeriCOT（可验证链式思维）方法，显著提升了模型推理结果的可审计性。此外，该数据集还启发了面向去中心化金融的对话语料生成系统ChainTalk，通过合成数据方法缓解真实交互样本的稀疏性，为低资源区块链应用的数据增强提供了新范式。

数据集最近研究