使用方法

评判参数有3类:

score/trigger_scorer.py: 对Trigger抽取以及多事件抽取进行评判
score/args_scorer.py: 对普通论元抽取结果进行评判
score/coref_scorer.py: 对交织论元抽取结果进行评判

各个命令的使用方法以及具体参数的含义可以通过'--help'进行查询，此处给出简单举例：

假设工程目录如下：

score
- trigger_scorer.py
- args_scorer.py
- args_scorer_v2.py
- coref_scorer.py
- event_ontology.json
example
- FNDEE_valid.json

在项目目录运行trigger评测脚本如下：

python .\score\trigger_scorer.py  --pred_file "./example/FNDEE_valid.json" --truth_file "./example/FNDEE_valid.json"

在项目目录运行普通论元评测脚本如下：

python .\score\args_scorer.py --ontology_file ./score/event_ontology.json --pred_file "./example/FNDEE_valid.json" --truth_file "./example/FNDEE_valid.json"

python .\score\args_scorer_v2.py --ontology_file ./score/event_ontology.json --pred_file "./example/FNDEE_valid.json" --truth_file "./example/FNDEE_valid.json"

注意:

此时会在运行脚本的目录生成一个文件match_sequence.json用于记录最优匹配结果。
args_scorer_v2.py的计算速度较args_scorer.py更快，但无法得到所有的匹配结果。
args_scorer_v2.py提供了普通论元但不考虑触发词和事件类型的准确性的F1，而args_scorer.py不提供

在项目目录运行交织论元脚本如下：

python .\score\coref_scorer.py --ontology_file ./score/event_ontology.json --pred_file "./example/FNDEE_valid.json" --truth_file "./example/FNDEE_valid.json"  --match_sequence_file "./match_sequence.json"

注意：

由于交织论元的计算需要计算出所有的最优匹配的可能性，因此无法避免要使用递归，请使用args_scorer.py生成的match_sequence.json会更加准确。

更新日志

trigger_scorer.py 提供
- 事件类型F1: 只考虑事件类型(event_type)的准确性
- 事件触发词F1: 只考虑事件类型(event_type)和触发词Text(trigger text)的准确性
- 事件触发词F1: 考虑事件类型(event_type)、触发词(trigger text、offset)的准确性
args_trigger.py 提供
- 普通论元但不考虑触发词和事件类型的准确性的F1
- 普通论元(考虑触发词、事件类型、论元本身)的F1
由于在不考虑事件类型和触发词的情况下，会出现如下问题：
- 交织论元的计算会简化为某一个论元计算准确，因此甚至会比普通论元F1还高（根据竞赛评分标准文档可得），这里不再提供该功能。

Math312 / TestScript

使用方法

更新日志

About

Languages