半监督分类点滴
?
如果仅使用有标记样本,问题规模将受到很大的限制。
如果仅使用少量的有标记样本,利用它们训练出的学习系统往往很难具有强泛化能力。
半监督学习的核心思想在于光滑性假设:
(1)距离越近的点越倾向于拥有相同的标记;
(2)数据的分布具有某种内在结构(簇或流形)。
传统的监督学习也是依赖光滑性假设的,但这些算法一般只考虑局部的光滑性假设。