作者:Andrey Nikishaev
编译:ronghuaiyang
导读
AI这么热,大家都想做AI,如何成为一个AI工程师,给大家一条学习路径参考一下,特别是CV方向的,里面包括了各种课程,资源,代码等,快来看看吧!
我们将带你了解机器学习的所有方面,从简单的线性回归到最新的神经网络,你不仅将学习如何使用它们,而且还将学习如何从头开始构建它们。
这条道路的很大一部分是面向计算机视觉(CV)的,因为这是获得一般知识的最快方法,CV的经验可以简单地转移到任何ML区域。
我们使用TensorFlow作为ML框架,因为它是最有前途的,并且已经为生产做好了准备。
如果你在学习理论和实践的同时获得实践经验,学习将会更好。
此外,如果你想与解决现实生活中的问题,并且和其他人比一比,我建议你注册Kaggle,因为这可能是你简历上的一个不错的补充。
要求:
Python,你不必非常厉害,基本的知识就可以了,其他的都有手册。
1. 课程:
1.1 Practical Machine Learning by Johns Hopkins University
1.2 Machine Learning by Stanford University
这两门课程将教你数据科学和机器学习的基本知识,并让你准备好面对真正困难的东西。
1.3 Deep Learning course from Andrew Ng来自吴恩达的非常出名的非常好的课程。
1.3 CS231n: Convolutional Neural Networks for Visual Recognition 2017(2016)
这就是Party的开始,这是你能在网上找到的关于ML&CV最好的课程之一。它不仅会告诉你兔子洞有多深,而且会给你进一步研究提供良好的基础。
1.4* Deep Learning by Google
可选课程,你可以只看其中的实践部分。
1.5* CS224d: Deep Learning for Natural Language Processing
可选课程,那些自然语言处理方向的同学可以看看,是的,非常的不错。
1.6* Deep Learning book
一本好的手册,覆盖了ML的非常多的方面。
2. 实践部分:
这个列表包含许多教程和项目,你应该尝试了解它们是如何工作的,并考虑如何改进它们。创建这个列表是为了增加你对ML的专业知识和兴趣,所以不要害怕,如果有些任务对你来说很困难,你可以在准备好之后再来处理它们。
2.1. Simple practical course on Tensorflow from Kadenze
2.1. Tensorflow cookbook
2.2. Tensorflow-101 tutorial set
2.3. IBM Code Patterns
来自IBM的编程模式,还包括数据科学和分析。
2.4. Fast Style Transfer Network
这个将展示如何使用神经网络将任何照片转换成名画的风格。
2.5. Image segmentation
2.6. Object detection with SSD
用于对象检测的最快(也是最简单)的模型之一。
2.7. Fast Mask RCNN for object detection and segmentation
2.8. Reinforcement learning
非常有用的东西,特别是如果你想造一个机器人或下一个Dota AI:)
2.9. Magenta project from Google Brain team
该项目旨在利用神经网络创造引人注目的艺术和音乐,结果是非常厉害的。
2.10. Deep Bilateral Learning for Real-Time Image Enhancement
来自Google的新的了不起的照片增强算法。
2.11. Self driving-car project
想让你的车全自动吗?—这是个很好的起点。
3. FAQ
如果卡住了怎么办?
首先,你必须了解ML并不是100%精确的—大多数情况只是一个很好的猜测和大量的调优迭代。因此,在大多数情况下,想出一些独特的想法是非常困难的,因为你将花费在培训模型上的时间和资源。因此,不要试图自己找出解决方案—寻找可以帮助你的论文、项目和人。你获得经验越快越好。
一些网站可以帮助你:http://www.gitxiv.com/, http://www.arxiv-sanity.com/, https://arxiv.org/, https://stackoverflow.com。
为什么论文没有完全覆盖这个问题,或者在某些地方是错误的?
遗憾的是,并不是所有的技术人员都想公开他们的工作,但他们都需要出版来获得资助和名声。所以他们中的一些人只发表了部分材料,或者在公式中出错。这就是为什么搜索代码总是比搜索论文更好的原因。你应该把这些论文看作是某个问题已经解决的证据或事实。
我在哪里可以找到最新的资料?
我使用这两个网站http://www.gitxiv.com/, http://www.arxiv-sanity.com/, https://arxiv.org/。首先,人们不仅找到了一篇论文,而且找到了它的代码,所以它更实用。
我应该使用云计算还是PC/笔记本电脑?
云最适合生产模型的密集计算。对于学习和测试来说,使用带有CUDA显卡的PC/笔记本电脑要便宜得多。例如,我在笔记本电脑上使用GTX GeForce 960M和690 CUDA核对所有型号进行了训练。
当然,如果你有云计算的授权或免费资金,你可以使用它。
如何改善模型超参数的调优?
训练的主要问题是时间,你不能只是坐着看训练数据。因此,我建议你使用智能网格搜索。基本上,只需要创建超参数集和模型体系结构,你认为它们可以更好地工作,然后在流程中一个接一个地运行它们,保存结果。因此,你可以在晚上进行训练,并在第二天比较结果,找出最有希望的一个。
你可以在sklearn库中看到这是如何实现的:
http://scikit-learn.org/stable/modules/grid_search.html
英文原文:https://medium.com/machine-learning-world/learning-path-for-machine-learning-engineer-a7d5dc9de4a4
本文为专栏文章,来自:AI公园,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/76114.html 。