登录遇到问题
Q:长时间接收不到验证码怎么办?
A:您可以拨打我们的客服热线400-183-1832进行语音辅助
没找到相关问题?点此联系客服
选择国家地区
指南者留学logo
指南者留学
选校/定位/规划 必备工具
打开App
记一次Kaggle建模项目实战
指南者留学 Journey 2022年05月25日
阅读量:1220

学员背景
H同学
本科背景
中北大学 人工智能专业
背提项目
指南者Kaggle项目实战“梅赛德斯-奔驰绿色制造”

 

在寒假的时候,我参加了指南者留学的背提项目-Kaggle项目实战,可以说收获满满。现在回头想想,项目经历中的很多地方都对现在的我影响很大,当然我也受益其中。

 

01 背景与契机

 

一开始选择参加背提项目,是因为自己虽然自学了不少课外的知识,如编程、机器学习、建模等知识都有接触,但自己却比较少的有具体的实战经验,故基于此我想着参加背提项目或许是对于自己之后不断实际应用的一个好的开始。

 

考虑到后期我想申请数据科学或者是人工智能的方向,拥有相关的背景经历也是很有必要的。因为在申请的时候有几段与专业相关的经历会更占优势,可以让招生官知道自己本科期间一直有在学习并实践与专业相关的知识,显现出很强烈的专业兴趣。同时,也会让自己比其他人具有更高的申请专业的匹配度。我也希望通过这段经历进一步提升自身能力。

 

现在回头看这个项目带给我的却不只有这些,通过项目锻炼我也明确了未来的学习和工作方向,项目结束后自己也有目的地去学习了不少相关知识。

 

02 项目介绍

 

我参加的项目是Kaggle项目实战,当时做的是“梅赛德斯-奔驰绿色制造”这个在Kaggle上比较出名的项目。

 

这个项目的目的是使用各种机器学习知识对数据进行分析,提取有用的特征,再将其转换为训练集,根据一定的数学模型进行训练,以预测每一辆汽车通过每个变量测试所需的时间。其中所使用的工具主要是jupyter notebook、python和python机器学习相关的第三方库如sklearn、lightbgm、mlxtend等。

 

很多机器学习方法,如线性回归、逻辑回归、决策树、随机森林、模型融合等基础知识,指南者的老师梅老师都会非常细致地进行讲解,在理论讲通后,又会对其进行一个代码的实现,深入浅出地将每一步都讲得非常透彻。

 

让我印象深刻的是每次我们在腾讯会议上进行作业反馈时,梅老师总会向我提出许多问题,不断地引发我对机器学习各种细节的思考,这不仅锻炼了我思考的能力,更是提醒了我之前的学习是存在一些漏洞的,自己以前总会忽略非常多看似简单实则却可以引出非常多复杂知识的细枝末节。这也是我在此次项目实战中收获到最有意义的东西——对于问题要多多去问Why而不是总关注How。

 

(梅老师答疑指导)

在这个项目前期的基础课程中,我学会了如何使用python常用的第三方库如Pandas、Numpy、Seaborn和Matplotlib等对数据进行整理;在面对庞大的数据集如何快速去除没有用的数据,格式化数据;用一些统计学的方法对数据进行分析,如判断异常值或对各变量进行相关性分析。

 

在处理掉一些无用或异常的数据后,便到了项目中期,对数据集进行特征工程进一步地提取更有用的数据,而这部分也是我最喜欢的部分,所谓特征工程是将原始数据转化成更好的表达问题本质的特征的过程,将这些特征运用到预测模型中能提高对不可见数据的模型预测精度。梅老师教会我非常多的方法,利用feature_selection库采取过滤法、包装法、嵌入法,这些都是非常好的特征选择的方法。

 

紧接着便是最后的核心内容-定义函数与建立模型,这部分主要是使用sklearn这个强大的python第三方库,我们要根据具体的项目要求与提取到的数据集的特性,进行模型的选择。在这部分则更需要我们进一步深入了解模型,去读懂各变量间的关系。而在做这一部分时,由于数据量的庞大,我们需要非常专注地编写代码,细致地完成每一步,保证自己逻辑的清晰。所以在完成后期的作业时,也锻炼了自己的耐性。

 

(代码实操)

数据分析时常需要对数据进行可视化,这部分我主要使用Matplotlib和seaborn来完成。梅老师也经常说到如何有选择性地绘制出有针对性的视图,而不是盲目作图、增量不增质。这部分我学会了绘制不少在实际工作应用中常用的视图,如热力图、箱线图、环形图等。

虽然课程讲解得非常透彻,但这并不意味着过程很顺利。这其中我也遇到不少的麻烦,如特征工程中面对特征维度较少的数据集该如何处理以增加特征维度。过程中梅老师教了我非常多可采取的措施,也不断提醒我不要只停留在思考,而是要多去动手尝试,以结果说话。

而在项目最后的一部分撰写报告中,在我看来撰写技术报告并不比项目实战简单,如何把复杂的代码逻辑与其中自己对问题的逻辑思考展现出来才是关键,对于报告的撰写我并不擅长,在写完后,梅老师也是第一时间给我作出了反馈,以视频讲解的形式指出了我报告中许多做得不好的地方,并对修改作出了建议,而我也是通过梅老师的帮助完成了一篇基于项目产出的技术报告。

(报告节选展示)

总的来说,对于项目的整个流程,我认为直到现在,我在参加其他比赛中仍然会使用这套流程。当然我所收获的也远远超出我的预期,毕竟自己有相当的基础,一开始,只是想着收获一些实战经历,但在与梅老师的交流沟通中,我也意识到自己过去的学习是存在漏洞的,很多忽略的地方也得到了补缺。我相信这对我将来的学习、工作都是意义很大的一件事。因为这不仅锻炼了自身的能力,同时更是让自己以后对待相关的问题有更好的思路去思考,切入点会更加准确。

 

而对于接下来的想要参加项目实战的同学,无论你是否是零基础,都会在这个项目中有所收获。当然学无止境,在结束项目后自己也要继续保持学习的热情,这样项目经历对你的帮助才会最大化。这个项目可以很好地把你带入门,随着你不断深入,这些所学的知识也会在很多地方帮助到你。

 

最后我也想感谢指南者留学的老师们,在我的申请之路上不断为我提供帮助,也祝愿所有同学最终能够收获梦校的offer。


指南者留学老师
您正在预约联系老师
简单填写基本信息,完成导师预约
以下信息仅供导师提供定制服务,我们承诺保护您的隐私安全
*手机号码
*目前学历
本科大四
本科大三
本科大二
本科大一
硕士在读
博士在读
其他
*留学意向地区
提交
预约成功
顾问老师将尽快联系您,请保持手机畅通
返回首页
下载指南者留学App
预约咨询
电话咨询
您的会员等级不足
前往指南者留学App查看等级详情
取消
立即前往