2021年1月28日晚9时,山东大学土建与水利学院“科研我当先”实践团队线上进行第三次内容分享。会议由龚陈博同学主持,全体成员参加。
本次交流由龚陈博同学主讲,他关于机器学习中的KNN算法进行了深入浅出的分享。
K近邻法(k-nearest neighbor,KNN)是一种基本的机器学习方法,在我们平常的生活中也会不自主的应用,就是“物以类聚,人以群分”。比如,我们判断一个人的人品,只需要观察他来往最密切的几个人的人品好坏就可以得出了。这里就是运用了KNN的思想。KNN方法既可以做分类,也可以做回归,这和决策树算法相同。
KNN做回归和分类的主要区别在于最后做预测时候的决策方式不同。KNN做分类预测时,一般是选择多数表决法,即训练集里和预测的样本特征最近的K个样本,预测为里面有最多类别数的类别。而KNN做回归时,一般是选择平均法,即最近的K个样本的样本输出的平均值作为回归预测值。
此外龚陈博同学说明了KNN算法的三个要素:
1. K值的选取
2. 距离的度量
3. 分类决策规则
并且用C++提供了一个样例的相关代码进行测试:
最后,龚陈博同学讲了KNN算法的一些缺陷:
1、效率低,因为每一次分类或者回归,都要把训练数据和测试数据都算一遍,如果数据量很大的话,需要的算力会很惊人,但是在机器学习中,大数据处理又是很常见的一件事。
2、对训练数据依赖度特别大,虽然所有机器学习的算法对数据的依赖度很高,但是KNN尤其严重,因为如果训练数据集中,有一两个数据是错误的,刚刚好又在需要分类的数值的旁边,这样就会直接导致预测的数据的不准确,对训练数据的容错性太差
3、维数灾难,KNN对于多维度的数据处理也不是很好。
通过此次龚陈博同学的分享,团队成员了解了机器学习中KNN算法的相关知识,拓展了知识。本次会议分享持续了三十分种,对于非本专业的学生是一次很好的学习机会。
http://www.dxswb.com/shijian/337541.html
点此复制本页地址
为了激发同学们对科技创新的热情,提升他们的创新精神和实践能力,教育科学学院于4月20日在4#A219举办了一场科创故事分享交流会。此次活动邀请了2020级7班的殷廷薇同学,她以自身丰富的科创经……
王海馨 聊城大学教育科学学院查看全文 >>
4月20日,教育科学学院在东校区樱花园举办了一场别开生面的“春回万物生融入春光里”团体辅导活动,旨在帮助同学们释放心理压力,缓解焦虑情绪,共享美好春天。当日,同学们热情洋溢地徒……
王海馨 聊城大学教育科学学院查看全文 >>
为进一步加强大学生心理健康教育,培养同学们的合作精神,3月23日,教育科学学院在4#A224举办“众人拾柴火焰更高”朋辈辅导活动。本次活动由名字接龙、成语游戏、你画我猜、击鼓传花四部分……
刘姝含 李佳莹 聊城大学教育科学学院查看全文 >>
为丰富同学们的校园文化生活,进一步培养同学们团结协作、顽强拼搏、不断进取的精神,4月20日至4月21日,教育科学学院在西校区北排球场参加2024年聊城大学“校园杯”学生女子排球赛初赛。激……
邬秉澄 王佳怡 聊城大学教育科学学院查看全文 >>
为进一步传承和弘扬五四精神,厚植青年学子爱党、爱国、爱社会主义的情感,4月21日,教育科学学院在11#C601举办“燃五四薪火谱时代新章”主题朗诵比赛。比赛现场,选手们或饱含深情,或慷慨……
李旖旎 聊城大学教育科学学院查看全文 >>
为帮助同学们以良好的心态面对大学生活,在交流中发现温暖、收获友谊,3月30日,教育科学学院在4#C124举办“记忆中的光常伴你我左右”故事分享会。本次活动中,同学们分享自己印象深刻的温……
王佳怡 汤子怡 聊城大学教育科学学院查看全文 >>
为营造乐学向上的良好氛围,调动同学们学习的积极性,帮助同学们明确前进方向,3月28日,教育科学学院在4#A124举办“真人图书馆”活动。本次活动邀请了2020级1班张月丽、王格作为主讲人,她们……
孙嘉晨 王佳怡 聊城大学教育科学学院查看全文 >>
为了弘扬中华优秀传统文化,激发社区儿童对国粹艺术的兴趣,让社区儿童更好地体验非遗文化的魅力,4月20日,我院“星火燎‘园’”服务队到黄山路社区开展“童绘脸谱乐享京剧”主题小课堂……
王思曼 张熙若 聊城大学教育科学学院查看全文 >>