Pretrain-Albert

Fine-tunes albert-based-chinese model using MLM (masked language modeling) on custom dataset.

	Masked LM Fine-tuning	Regular Fine-tuning
Objective	Masked language modeling	Downstream task objective (classification, QA etc)
Input	Original text with random masked tokens	Original raw text as input
Optimization	Continue pretraining with MLM	Directly optimize for downstream task
Data	Unlabeled data can be used	Requires labeled data for downstream task
Pros	Utilize unlabeled data, improve language understanding	Faster convergence with supervised data
Cons	Require constructing auxiliary MLM task	Need annotated data for every downstream task

Usage

Fine-tunes Albert-based-chinese model using masked language modeling on custom dataset.

Language:Python 100.0%