01 学生需求
L同学本科就读于国内985大学电子商务专业,想要在硕士申请中,以数据科学(DS)专业为主申方向,最终能从事数据挖掘相关的工作。
由于是有一定跨度的申请,为此我们在初期申请准备时,就与L同学做了深入的沟通。我们发现他的本科修课与数据科学有一定关联,修过如智能商务与数据挖掘、电子商务分析、应用统计学等,只是内容深度不够,对于一些数据挖掘算法的理解度有限,工具也大多使用SPSS或Weka来进行。而L同学的首选目标是爱丁堡大学数学科学专业,虽对本科专业背景没有太多限制,但对数理和编程都有较高要求。
(爱丁堡大学数据科学专业录取要求)
为了弥补自身基础和申请目标间的gap,L同学参加了指南者的机器学习训练营,选择“京东智能优惠券发放系统”这个项目,主要目标是通过这个项目快速学习Python和机器学习算法,并完成含金量较高的项目,以此来说明自己的专业能力和潜力。
02 项目的申请应用
电子商务本身就是数据科学应用的重要领域,机器学习、时间序列预测、推荐系统、自然语言处理等,电商领域对数据的挖掘利用非常丰富。
所以在申请材料准备中,我们很自然地从L同学的本科专业出发,通过他之前做的一个课程设计引出思考,以此作为申请的兴趣起源。在他智能商务数据挖掘这门课中,曾使用SPSS对淘宝用户数据进行处理操作之后,使用RFM模型对用户进行分层借以达到智能营销的目的。这是一个数据辅助决策的过程,顺利完成课设要求之后,他仍对这个话题兴趣盎然,开始了解这一领域的智能算法。但同时,他也发现SPSS对数据处理的效率并不令人满意,同时对新兴算法的支持度也不高,很难对自己的想法进行快速尝试,于是开始在算法和编程两方面着力。
在朝着数据科学专业努力的道路上,机器学习项目实战起到了非常重要的作用:
- 编程
在Python编程熟练度方面,可以灵活应用numpy,pandas,matplotlib,seaborn,plotly,sklearn等,不小的代码量也是对编程能力非常直白的说明;
- 算法
算法方面,着重强调了他对于各种算法的优劣理解,如:线性模型对于异常数据的敏感性、树模型容易产生过拟合的原因以及解决方案的思考,也借此来说明他扎实的数理功底;
- 流程
整体项目内容涵盖了对商品特征、消费者特征、优惠券特征的预处理与特征工程,使用决策树、随机森林等模型实现对优惠券是否被使用进行预测的功能等,充分展示了对数据挖掘流程的掌握;
- 经历
项目主题上,也与他的本科专业相关,这样从课设,到完整项目,再到后续实习,非常完美地串联起来,可以很合逻辑地引出他的申请动机和未来在电商领域发展的规划。
03 学习成果展示
(项目过程截图)
(独立完成项目报告-节选)