Coldog2333/super_dialseg
收藏数据集卡片 for SuperDialseg
数据集描述
数据集摘要
[更多信息需要]
支持的任务和排行榜
[更多信息需要]
语言:英语
数据集结构
数据实例
json { "dial_data": { "super_dialseg": [ { "dial_id": "8df07b7a98990db27c395cb1f68a962e", "turns": [ { "da": "query_condition", "role": "user", "turn_id": 0, "utterance": "Hello, I forgot o update my address, can you help me with that?", "topic_id": 0, "segmentation_label": 0 }, ... { "da": "respond_solution", "role": "agent", "turn_id": 11, "utterance": "DO NOT contact the New York State DMV to dispute whether you violated a toll regulation or failed to pay the toll , fees or other charges", "topic_id": 4, "segmentation_label": 0 } ] } ] } }
数据字段
对话级
dial_id: 对话的ID;turns: 对话的所有话语。
话语级
da: 从原始DGDS数据集派生的对话行为注释;role: 从原始DGDS数据集派生的角色注释;turn_id: 话语的ID;utterance: 话语的文本;topic_id: 当前话题的ID(顺序);segmentation_label: 1: 是话题的结束;0: 其他。
数据分割
SuperDialseg遵循原始DGDS数据集的数据分割。
数据集创建
策划理由
[更多信息需要]
源数据
初始数据收集和规范化
SuperDialseg建立在doc2dial和MultiDoc2dial数据集之上。请参考原始论文获取更多细节。
源语言生产者是谁?
[更多信息需要]
注释
注释过程
[更多信息需要]
注释者是谁?
对话分割点的注释是通过一套精心设计的策略构建的。请参考论文获取更多细节。
其他注释,如对话行为和角色信息,来自doc2dial和MultiDoc2dial数据集。
个人和敏感信息
[更多信息需要]
使用数据的注意事项
数据集的社会影响
[更多信息需要]
偏见的讨论
[更多信息需要]
其他已知限制
[更多信息需要]
附加信息
数据集策展人
[更多信息需要]
许可信息
遵循doc2dial和MultiDoc2dial的许可,Apache License Version 2.0。
引用信息
即将到来
贡献
感谢@Coldog2333添加此数据集。




