ECOC

简述

全称纠错输出码（Error Correcting Output Code），用于多分类MvM。此处使用样本来自 uci数据集

导入数据集，进行基本处理

data_import.get_data(show=false) 如果show的值为true，则会print部分数据。

此处需要预留出validation set

plot.plot(data, label1=0, label2=1)

其中label1和label2为绘制横纵坐标对应的变量

把几个类联合起来进行标记，分为正反两类，正类为1，反类为-1。

此处采用生成二进制不重复随机数的方法

classifier.choice_matrix(label, k)
c = len(label)

返回: 分类后的新数据（包含k个dict的list，每个dict的key为0/1），和选择矩阵（作为之前分类的依据）。
将此处选择矩阵的每一列中的0替换为-1后就是相应原始类的纠错输出码。

此样本中所有feature均为连续量。均匀选取1/10样本作为可能划分点，所有feature在使用【两次】之后被禁止使用。

左开右闭
计算熵：
- trainer.compute_entropy(data: dict, m: int)
- 返回按照此分类方式产生的熵
计算节点：
- compute_node(info: dict, disabled_feature: list=[], nodes_num: int=2)->tuple
- info 为dict，key为所分的类（后来分的类）；disabled_feature 为 list，代表不激活的 feature；nodes_num 为可能可以供选择的节点数量。
- 返回节点信息 tuple(采用的feature，节点位置，熵)
预剪枝
- 每一枝数据集足够小（减小欠拟合风险），且在测试集