1. 什么是k-近邻算法(kNN)?

工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有变迁的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征相似数据(相近邻)的分类标签。

如如何判断一部电影是爱情片还是动作片,找一些样本数据集合(已经确定了样本集合中每一部电影是动作片还是爱情片,根据接吻镜头、打斗镜头的次数),然后一个未知电影根据接吻镜头、打斗镜头的次数来判断是爱情片还是动作片!
如何判断这个西瓜是好瓜还是赖瓜等等 都可以用kNN算法来解决。