集成学习——装袋算法

来源:互联网 发布:淘宝手办店黑店 编辑:程序博客网 时间:2024/06/02 19:36
装袋算法可大致概括为:先以分类模型初步处理原数据,再对处理后的数据进行分类的迭代过程。

将原始训练数据D中,以平均抽样的方式,随机生成t个大小相同的数据集D1-Dt。对各个数据集以不同的分类器进行训练,得到初步分类器C1-Ct。

之后,装袋算法的集成方式为:针对原始集中的单个元素,寻找结果y,使该元素对于所得的每组分类器匹配的正确率最高,则该y即为该元素的集成模型预测值。

处理完毕后,再次以分类器进行分类,即为装袋算法。
原创粉丝点击