电子商务中的常识知识显著性评估基准数据集 (BSEE)
收藏OpenBG-CSK 数据集概述
数据集使用
实验复现
运行以下命令以复现实验: shell python run.py
实验结果包括 F1 分数、准确率和详细结果。
模型训练
运行以下 shell 文件进行模型训练: shell bash run.sh
具体内容如下: shell DATA_DIR="data" MODEL_DIR="bert-base-chinese" OUTPUT_DIR="output/save_dict/" PREDICT_DIR="data/" MAX_LENGTH=128 MODEL_TYPE="PMI"
python run.py --data_dir=${DATA_DIR} --model_dir=${MODEL_DIR} --model=${MODEL_TYPE} --output_dir=${MODEL_TYPE} --do_train=True --max_length=${MAX_LENGTH} --batch_size=16 --learning_rate=1e-5 --epochs=10 --seed=2021
推理与结果生成
运行以下 shell 文件进行推理和结果生成: shell bash run.sh predict
具体内容如下: shell DATA_DIR="data" MODEL_DIR="bert-base-chinese" OUTPUT_DIR="output/save_dict/" PREDICT_DIR="data/" MAX_LENGTH=128 MODEL_TYPE="PMI"
python run.py --data_dir=${DATA_DIR} --model_dir=${MODEL_DIR} --output_dir=${OUTPUT_DIR} --model=${MODEL_TYPE} --max_length=${MAX_LENGTH} --batch_size=16 --learning_rate=1e-5 --epochs=10 --seed=2021
数据集详细信息
数据集样例存储在 data 目录中,包括 train_triple.jsonl 和 dev_triple.jsonl。
数据格式
-
train_triple.jsonl数据格式: json {"triple_id" : "0579","subject":"瓶装水","object":"跑步","predicate":"品类_适用_场景","salience": 0} -
dev_triple.jsonl数据格式: json {"triple_id":"0579","subject":"瓶装水","object":"跑步","predicate":"适用"}
基准测试
在实验数据集上评估了多个模型,使用 KG-BERT 作为基础模型,报告了任务的基线结果。
模型性能
| 模型 | F1 | 准确率 |
|---|---|---|
| BERT-base | 55.2 | 55.8 |
| RoBERTa-wwm-ext-base | 56.9 | 57.2 |
| PMI-tuning | 60.7 | 61.1 |
模型输入
KG-BERT 将 h, r, t 作为双向编码器的输入,计算三元组的评分函数。具体输入格式为:[CLS] h [SEP] r [SEP] t [SEP]。
超参数
| 参数 | 值 |
|---|---|
| weight_decay | 0.01 |
| learning_rate | 1e-5 |

- 1Commonsense Knowledge Salience Evaluation with a Benchmark Dataset in E-commerce阿里巴巴集团 & 浙江大学 & AZFT 联合实验室 · 2022年



