在这里插入图片描述
接受前面几节课的教训吧,从这一课开始,我们会有意的把理论介绍和上机实习分开。这节课介绍,鸢尾花的分类,主要是让学员们的初步了解,怎么样利用机器学习来构建数据分类的算法。
在这里插入图片描述
授课方式呢,首先还是我们先抛出问题,那么我给出AB两种花的花瓣长度和宽度的测量数据,然后呢,我也用可视化的方法把它们这个测量数据的分布在坐标系里边标出来了,一共A、B两类,现在有一个新的测量数据P(X,Y)出来了,那么如何来判定P是属于A还是属于B呢?这个问题啊,我们首先让学员们展开这个思考讨论,看大家能够想出哪些不同的方法。然后呢,我们再逐一加以点评。
在这里插入图片描述
首先呢,大家可能想到的是K均值的方法,利用三类测量数据的平均坐标也就是重心的位置,利用点到他们三个重心的距离的远近来判定要测预测的点属于哪一类?

先肯定这种方法它的合理性,然后呢,组织学员来讨论它的局限性。在哪些情况下这个方法呢,它不好用,然后呢,我们引入了下一个方法,K近邻算法。

在这里插入图片描述

最后呢,我们结合K近邻算法自身运算效率讨论一下如何提高这个算法的计算速度。基于各种方案,最后呢,我们引入了支持向量机的算法。

在这里插入图片描述

总体来讲呢,这节课从理论讨论上比上周呢,有所进步,为下一步继续改进和提升呢,做了一个很好的尝试。

Logo

一站式 AI 云服务平台

更多推荐