编者按:在新年制定具有挑战性的计划并实施,是给自己最好的新年礼物。那么我们来自学数据科学吧。数据科学与你能想到的每一个行业息息相关,而且在就业和未来发展趋势方面,有着其它专业领域无法比拟的优势。数据科学是完全可以自学掌握的,那么如何充分利用线上、线下的各种资源,免费掌握数据科学,提升自己的竞争力呢?Madison Hunter的这篇文章The Step-by-Step Curriculum I’m Using to Teach Myself Data Science in 2021,手把手教你自学数据科学。
划重点:免费自学数据科学,为你的就业和未来发展提供更多可能、更好的选择!
插图
年底是为即将到来的新年制定计划的最佳时机。对一些人来说,新年计划包括去健身房健身、学一门新的语言或阅读50本书。
对于我来说,我的新年计划是学习数据科学。我喜欢挑战,所以我准备不花一分钱来学会数据科学。
得益于当今许多数据科学家的慷慨和聪明才智,互联网上才有了很多免费的学习资源,涵盖了数据科学每一个微小的细节。从学习如何使用Python编码,到学习多变量微积分,再到学习如何开发机器学习算法,这些使得大家都有可能成为一个有技能且有竞争力的数据科学家,而无需花费数千美元或多年的时间去获取大专学位、文凭或证书。
没有什么时机比新的一年更合适挑战自己、培养新技能了。如果说这场疫情教会了我们什么,那就是,提高技能绝不是浪费时间,而且可以帮助你获得更好的就业选择。
数据科学正成为最吸引人的技术领域之一,因为它的失业率很低,而且工作的安全性是基本可以保证的。此外,数据科学与你能想到的每一个行业息息相关,包括医学、军事、商业、科学、教育、政府和技术行业。换句话说,你可以学习数据科学技术,并将它们应用到任何你认为有较大潜力或已熟知并有一定经验的领域。所以,有什么理由不喜欢数据科学呢?
为什么我想学习数据科学
两年前我毕业时获得了软件工程的技术专科文凭,由于全省范围内的经济衰退,且那是一个对经济现代化较为抗拒且反应迟钝的地方,我很不容易才找到了一份专业对口工作,但是工作内容较为初级。
现在我回到学校,攻读地球科学学位。我非常喜欢这个学位,最近也一直在思考如何使自己毕业后变得更有价值、更有竞争力。
于是我想到了数据科学。我相信,在软件工程专业的经验基础上,在自己的知识库中加入数据科学,会使我成为任何环境或地质技术企业青睐的员工。此外,拥有数据科学知识为我毕业后创办自己的环境咨询公司打开了大门(如果我找不到工作,我基本上会自己创业)。同时,数据是一个很酷的事物,可以告诉我们很多关于过去、现在和未来的信息,这些信息在我们观察和理解环境或地质事件时特别有用。
所以我有什么理由不学习数据科学呢?
在开始介绍细节之前先给出一些参数
首先,在设置课程之前,我需要先设置一些参数。
- 这个“新年决心”并不一定要在一年的期限内完成。认为每个人都可以在一年内学习并掌握数据科学的想法,其实是很荒谬的,尤其是针对那些有其他全职工作的人。要确保这个计划落实到位,我会根据自己的实际需要来设置完成时间。我没有有任何仓促或者速成的想法,不想只对这一领域有肤浅的表面了解。相反,我要在这一领域打下坚强稳固的基础。
- 首先要学习编程。因为我已经有编程专业背景(C#,SQL,JavaScript,Java,PHP),我想先学习新的编程语言。我认为这是进入数据科学的一个很好的方式,因为这为我们更好地理解数据运作原理奠定了基础。建议你在进行数据科学研究时,将Python视为自己平时使用的语言。如果你不懂这种语言,就不能很好地交流。因此,在设置我的课程之前,我首先会将学习编程语言放在第一位。
- 我使用的课程必须是免费的。我是一名学生,所以我不可能在网络课程上花费数千美元。幸运的是,网络上有很多免费的课程,大学里也有很多课程供你免费旁听。对我来说,有一个例外:作为理学学位的硬性要求,我需要在大学里修一些数学课程,这些是我唯一付钱的课程。此外,免费课程通常集中在较为“初级”的阶段,以入门级的内容为主,所以随着知识学习的深入,接下来我将不得不花费更多钱购买较为高级的课程。
- 计划可以随时间而改变。在学习数据科学的过程中,几乎可以肯定的是,我会随时根据实际情况改变计划。无论是增加还是减少课程,计划都需要灵活。很有可能,在自学数据科学的过程中,我对如何运用最好的方法学习这门课程会有更深入的理解,那同时我所选择的课程也会发生变化。
我计划用来创建自己的数据科学课程所使用的资源
多亏了Medium上快速发展的数据科学社区,我才能够在这个平台上搜索到最好的信息资源,这将帮助我开发自己的学习课程。从这些文章中,我模拟了自己的学习路径,以确保能够夯实自己的基础,学到最全面的知识。
总课程
总课程将分为四个学习主题,我将按照以下顺序学习:编程,数学和统计,数据分析和可视化,机器学习。
编程
Python(一种计算机高级编程语言)
学习Python–完整的入门课程
每个人都能学会的Python–全套大学Python语言课程
用于掌握数据科学的Python–入门课程(学习Python语言,Pandas数据分析,数组,Matplotlib绘图数据库)
具有Python认证的科学计算
用于掌握数据科学的Python
Python数据结构
SQL(结构化查询语言)
SQL教程–完整的数据库入门课程
SQL–计算机科学导论–哈佛大学的CS50 (2018)
用于数据分析的SQL
用于数据科学的SQL
JavaScript(一种程序语言)
JavaScript算法和数据结构认证|
数学和统计
有限数学(我正在攻读的理学学位的一门课程)
统计学概论(理学学位的一门课程)
微积分概论(理学学位的一门课程)
多变量微积分
线性代数
数据分析与可视化
学习数据科学教程–完整的入门课程| freeCodeCamp
Python数据分析–完整的入门课程(内容包括数组、Pandas数据分析、Matplotlib绘图数据库、Python数据可视化工具Seaborn)
高级课程所需的数据结构–一位谷歌工程师教授的完整教程
数据可视化认证
具有Python认证的数据分析
Python数据分析
Python数据可视化
数据科学:可视化
机器学习
TensorFlow 2.0(一个深度学习系统和工具)完整教程– Python神经网络入门教程
实用的编程员深度学习教程–来自fast.ai(一个深度学习平台)和杰里米·霍华德(Jeremy Howard,数据科学家,创立了fast.ai技术分享平台,免费提供关于深度学习技术的系列视频教程)
强化学习课程——完整的机器学习教程
具有Python认证的机器学习
具有Python认证的机器学习:较为实用的概述
深化学习的数据科学项目
我从自己的软件工程文凭中学到的一件事是,最好通过应用和实践来学习编代码。所以,当我完成这一专业领域的学习后,还将通过顶石项目(课程结束后,学院或者教师团队对学生项目成果进行收集)、Kaggle比赛(为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台)和黑客马拉松(鼓励参赛选手在固定时间开发程序或软件产品的比赛)来深化学习效果。
就像用笔写字一样,学习编程和处理数据就像是在锻炼某块肌肉。你实践得越多,做起来就越容易。在一个较为理想的状态下,经验法则是在周末花几个小时做个人项目。因此,如果我能养成习惯,每个周末花几个小时做数据科学项目,那么我就能在完成课程的同时,更好地掌握这个专业领域的一些重要概念。
最后的感想
这个学习课程无论怎样都无法十全十美,而且随着我学习的深入、不断取得进步,还可能发生变化。但是,比较确定的是,这门课程会使我对数据科学有一个基本的了解,在未来我能够以此为基础,更高效、更好地学习。
就像我之前说的,新年是开启新征程的最佳时机。但是,我喜欢用相对艰难、复杂的方式完成一件事情(我喜欢有挑战性的任务),所以,我并不满足于多去健身房或者阅读较多本书这种任务。我倾向于选择一些操作起来较为困难的事情,比如自学数据科学。值得庆幸的是,我的耐力很好,擅长考验耐力的编程学习体验,而且我也能相对轻松地自学某些较难的领域(多亏了那些在线大学)。幸运的是,我正进入一个社区,在这里每个人都受到欢迎和鼓励,这个社区会在我走向数据科学的旅程中,发挥重要的作用。
现在唯一要做的,就是一头扎进去。
译者:Vivi
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。