在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称(OpenSource Name):AlanTur1ng/Machine-Learning-in-Action-Python3开源软件地址(OpenSource Url):https://github.com/AlanTur1ng/Machine-Learning-in-Action-Python3开源编程语言(OpenSource Language):Python 100.0%开源软件介绍(OpenSource Introduction):Machine-Learning-in-Action-Python3这个月开始练习《机器学习实战》,原书比较久远了,且代码和练习都是基于Python2,我个人是升级到了Python3,因此使用最新的版本来写这些习题。具体2和3其实在基础语法上并没有太多差别,一些高级特性比如装饰器工厂,协程,IO等Python3的新用法,一般机器学习也用不上,因为追求性能的话都会用C/C++等语言去实现,Python只是小规模的测试用。 目前刚开始做,有不对的欢迎指正,也欢迎大家star。除了 版本差异,代码里的部分函数以及代码范式也和原书不一样(因为作者的代码实在让人看的别扭,我改过后看起来舒服多了)。在这个系列之后,我还会写一个scikit-learn机器学习系列,因为在实现了源码之后,带大家看看SKT框架如何使用也是非常重要的。 什么是K-近邻算法?简单地说,k-近邻算法采用测量不同特征值之间距离的方法进行分类。不恰当但是形象地可以表述为近朱者赤,近墨者黑。它有如下特点:
优点:精度高、对异常值不敏感、无数据输入假定
缺点:计算复杂度高、空间复杂度高
适用数据范围:数值型和标称型
K-近邻算法的工作原理
K-近邻算法的一般流程搜集数据:可以使用任何方法。 准备数据:距离计算所需要的值,最好是结构化的数据。 分析数据:可以使用任何方法。 训练算法:此步骤不适用于-近邻算法。 测试算法:计算错误率。 使用算法:首先需要输入样本数据和待分类数据,然后运行-近邻算法判定待分类数据分别属于哪个分类,最后应用计算出的分类执行后续的处理。 |
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论