phueb/CategoryEval

representation-learning lexical-categories

Research code for evaluating category knowledge acquired by word embedding models.

Metrics

Balanced Accuracy

A measure how well pairs of learned representations can be correctly judged to belong to the same category

Divergence-from-Prototype

A measure of how abstract learned representations are.

Category-Spread

A measure of spread between learned representations that belong to the same category

Usage

from categoryeval.ba import BAScorer

probe2cat = {'door': 'FURNITURE', 'cat': 'ANIMAL'}
scorer = BAScorer(probe2cat)

pred_sims = model.predict()
balanced_accuracy = scorer.calc_score(pred_sims, scorer.gold_sims)  # predicted, and gold similarity matrices for probe words

Compatibility

Developed on Ubuntu 18.04 and Python 3.7

About

Evaluate word representations for knowledge of category structure

representation-learning lexical-categories

MIT License

Languages

Language:Python 100.0%