当前位置:首页 > 算法 > 正文

k近邻算法选k值

  • 算法
  • 2024-04-26 10:47:15
  • 7218

≥▽≤K近邻算法的理论基础

 我从理论基础、手写识别算法、手写识别模型等角度介绍了K-近邻算法。

 最近K算法的本质是根据已知的特征插入某些对象。
例如,如果你看到一个父亲和一个儿子,你通常会通过判断他们的年龄来判断谁是父亲,谁是儿子。 除以年龄属性的特征值。

此示例是一个非常简单的分类,由单个维度组成。
例如,参考一个电影节目并确定该视频是乒乓球比赛还是足球比赛。

 必须定义特征才能定义分类。 这里定义了两个特征,一是运动员的“驱动”动作,二是运动员的“踢”动作。 当然,我们不能在看到“激动人心”的动作时立即插入“pingPUTEOmatch”这样的视频,因为我们知道有些足球运动员正在运动场上投掷与队友分享。 同样,我们不能在看到“踢”动作的同时插入“足球比赛”这样的视频,因为有些乒乓球运动员通过“踢”来表达自己的情绪。

我们统计了一段时间内视频中“搅拌”和“腿”动作的次数,发现了以下规律:
●在一场足球比赛的视频中,次数“踢”的次数远多于“开车”的次数

●视频匹配表中的数据点按x轴坐标[3000,5000]分组,y轴坐标为[3000,5000]。 轴坐标为[1,500],x轴坐标为[1,500]

 这次测试视频,统计显示有2000个“搅拌”。 动作和100个“踢”动作。 如果记下它在图20-1中的位置,就可以找到视频的下一个位置。 测试该视频表是一场网球比赛,因此可以断定该视频表是一场视频网球比赛。

 上面的例子是相对的,要么是黑的,要么是白的。 因此,为了提高算法的可靠性,在实现时选择距离最近的k个点来判断这k个点中大部分属于哪一类,并将当前点划分到哪一类中。 为了使决策更容易,k的值通常为奇数,这也是董事会成员通常排列为奇数的原因,以便明确投票的结果。

例如,众所周知,A和B正在寻找最相似的双胞胎艺术家。 如果要判断图像T中的某个角色是艺术家A还是艺术家B,可以使用K近邻算法的具体步骤。 这是:

这就是K近邻算法的基本思想。