顾名思义,分类器就是一类特殊的人工智能算法,主要用来做分类。也就是说,能用来做分类的人工智能算法,我们都可以称之为分类器。
分类器的学术定义是:在标记好类别的训练数据基础上判断一个新的观察样本所属的类别。其中,标记好类别也就是所谓的有所标注,当然这个条件并不是必须的,也可以不标注,这样就是无监督分类。其实,分类器的基本理念,就是在训练数据集上,找到代表事物本身的特征数据和它所属的类别之间的关系,从而形成一个特定的模型。当再有新的样本(应该在训练数据中从未出现过)到来时,模型通过带入,计算新样本所属的类别。
深度学习可以完成分类工作,但是对于很多简单的问题,深度学习显得过于庞大和臃肿,所以,我们在讨论分类器时,一般指的不是深度学习。传统的分类器主要有:线性回归、逻辑回归、SVM、决策树、随机森林、聚类、神经网络等。
要说明的是,不同的数据集和现实应用问题,可能在各种分类器下都不相同,所以很多情况下,需要使用多种方法进行实验、优化,以达到最好的效果。
这些分类器,我们将在后续的文章中进行分别介绍。