ChaseDream
搜索
返回列表 发新帖
查看: 818|回复: 0
打印 上一主题 下一主题

[RPI BSAN/QFRA] 课程介绍之Intro to Machine Learning

[复制链接]
跳转到指定楼层
楼主
发表于 2022-10-28 04:32:40 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
2022 Fall Semester - Introduction to Machine Learning Overview

相信很多同学在选择项目与申请初期都会想要了解课程难度与设置,特别是对于一些想在研究生学习期间转专业的同学。那么前期对课程的了解是至关重要的,一方面了解转换专业所需的必须技能,一方面了解课程难度以便于提前做相关的准备。为了帮助同学们更好的了解课程,我们采访了今年秋季入学的学生大使,来对Rensselaer polytechnic institute 的 Business Analytics and Quantitive Finance and Risk Analytics的必修课 - Intro to machine learning 做一下详细讲解。

【课程简介】
机器学习是 RPI Lally BSAN/QFRA program的必修课程之一。这门课程技术性很强,大部分时间我们都在学习python。在前几节课中,我们学习了不同的数据类型以及如何在 Python 中使用基本函数。之后,介绍了不同的分析模型和算法,并练习如何使用 Python 实际执行这些模型。课程每周都有coding作业,帮助同学们更好地巩固本周学习的内容。尽管有时作业很有挑战性,但我觉得在这过程中对于使用python来操作database更熟悉了,也对于可视化以及机器学习模型更加了解了。

【学生视角】
根据 Manikonda 教授的调查,班上一半的人有编码/python 方面的经验,而另一半几乎没有经验。
我强烈建议没有编码经验的人在学期开始前参加在线课程。教授和同学都很愿意帮忙,不过,如果你事先有所了解,学期的压力就会小一些。
总的来说,我会说这门课程对初学者来说可能具有挑战性,课程节奏较快,需要学生积极向老师同学寻求帮助,利用好老师和TA 的office hour。对于有经验的学生来说,前几周将是复习所有基础知识的好机会,后半学期将更专注于应用,需要你选择database并且从头处理数据再到使用模型。

【课程内容细分】
本月我们将学习数据类型、for 循环、if 语句之间的区别、如何组织和操作数据、处理 N/A 值以及构建模型。
课上我们所使用的数据集是Titanic dataset。我们的任务是建立一个模型并预测谁将在泰坦尼克号上幸存下来。我们练习如何处理 N/A 值,将标称数据转换为定量数据,将数据拆分为训练和测试数据集,建立模型,并查看预测的准确性。
首先,您使用 pandas.read_csv 加载数据。加载数据后,我们可以看到在某些列中有 NaN 值,因此我们使用 df.isnull().sum() 函数来查看 NaN 值出现在哪里。然后删除掉这些大部分都是null value的数据,因为加入这些数据会影响我们的最后预测的准确度。
删除空值后,我们开始将一些nominal data 转换为quantitative data以便于预测。 之后将数据分为80% train dataset和20%test dataset,并且选取相应的模型进行预测,例如:linear regression model。
再使用RMSE 或者 MSE 公式来测量我们模型预测的准确度,越接近于0表明我们的预测结果越好。

【总结】
我喜欢上这门课,因为我正在取得进步和学习technical的技能,而machine learning以及python skills是作为数据分析师的必备技能之一。虽然对于转专业学生来说,课程进度较快,内容多将会是很大的挑战。 但是在学期开始之前,同学们可以多看相关视频以帮助自己能顺利开始课程。

由 Lally 学生大使 Zona Chiang 撰写

接下来的一个月我们将为国际学生举行答疑session,请大家持续关注我们账号获取更多相关信息!

收藏收藏 收藏收藏
您需要登录后才可以回帖 登录 | 立即注册

近期活动

正在浏览此版块的会员 ()

手机版|ChaseDream|GMT+8, 2025-2-4 06:48
京公网安备11010202008513号 京ICP证101109号 京ICP备12012021号

ChaseDream 论坛

© 2003-2023 ChaseDream.com. All Rights Reserved.

返回顶部