five

SUMIE

收藏
arXiv2024-06-08 更新2024-06-21 收录
下载链接:
https://github.com/google-research-datasets/sumie
下载链接
链接失效反馈
官方服务:
资源简介:
SUMIE是由不列颠哥伦比亚大学和Google Deepmind联合创建的合成数据集,专注于增量实体摘要任务。该数据集包含200个实体,覆盖多个领域,旨在模拟实体信息的动态更新过程。数据集通过高级语言模型生成,确保了数据的高质量和多样性,适用于评估和改进增量实体摘要方法。SUMIE的应用领域广泛,包括搜索引擎、新闻聚合和知识库,旨在解决实体信息更新的自动化问题,提高信息处理的效率和准确性。

SUMIE is a synthetic dataset jointly created by the University of British Columbia and Google DeepMind, focusing on the incremental entity summarization task. This dataset contains 200 entities covering multiple domains, aiming to simulate the dynamic update process of entity information. The dataset is generated via advanced language models, ensuring high data quality and diversity, and is suitable for evaluating and improving incremental entity summarization methods. SUMIE has a wide range of application areas including search engines, news aggregation and knowledge bases, and is designed to address the automation issue of entity information updates, enhancing the efficiency and accuracy of information processing.
提供机构:
不列颠哥伦比亚大学
创建时间:
2024-06-08
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作