我从理论基础、手写识别算法、手写识别模型等角度介绍了K-近邻算法。
最近K算法的本质是根据已知的特征插入某些对象。
例如,如果你看到一个父亲和一个儿子,你通常会通过判断他们的年龄来判断谁是父亲,谁是儿子。
除以年龄属性的特征值。
此示例是一个非常简单的分类,由单个维度组成。
例如,参考一个电影节目并确定该视频是乒乓球比赛还是足球比赛。
必须定义特征才能定义分类。 这里定义了两个特征,一是运动员的“驱动”动作,二是运动员的“踢”动作。 当然,我们不能在看到“激动人心”的动作时立即插入“pingPUTEOmatch”这样的视频,因为我们知道有些足球运动员正在运动场上投掷与队友分享。 同样,我们不能在看到“踢”动作的同时插入“足球比赛”这样的视频,因为有些乒乓球运动员通过“踢”来表达自己的情绪。
我们统计了一段时间内视频中“搅拌”和“腿”动作的次数,发现了以下规律:
●在一场足球比赛的视频中,次数“踢”的次数远多于“开车”的次数
这次测试视频,统计显示有2000个“搅拌”。 动作和100个“踢”动作。 如果记下它在图20-1中的位置,就可以找到视频的下一个位置。 测试该视频表是一场网球比赛,因此可以断定该视频表是一场视频网球比赛。
上面的例子是相对的,要么是黑的,要么是白的。 因此,为了提高算法的可靠性,在实现时选择距离最近的k个点来判断这k个点中大部分属于哪一类,并将当前点划分到哪一类中。 为了使决策更容易,k的值通常为奇数,这也是董事会成员通常排列为奇数的原因,以便明确投票的结果。
例如,众所周知,A和B正在寻找最相似的双胞胎艺术家。 如果要判断图像T中的某个角色是艺术家A还是艺术家B,可以使用K近邻算法的具体步骤。 这是:
这就是K近邻算法的基本思想。
上一篇:k近邻算法k值大小
下一篇:k近邻算法求最优的k