正因为多个学科的交叉和融合,给数据领域的从业者和学习者在使用和学习上带来的巨大的困难。
为了从互联网获取更多相关经验,收集整理了相关领域有一定价值的博客和站点。
1、王路情–数据科学家
涵盖的内容有,R语言,数据挖掘,机器学习等,大量的翻译和原创文章。
网址:http://www.wangluqing.com/
2、码农场
大量关于NLP(自然语言处理)和机器学习的文章,作者开源了中文分词器HanNLP。
网址:http://www.hankcs.com/
3、Licstar的博客
如果要了解在中文上的数据挖掘的相关问题,可以阅读此博客。
网址:http://licstar.net/
4、我爱自然语言处理
我爱自然语言处理的中文站点。同英文站点一样,文章优质,并且大多都是基于实践的内容。
5、我爱机器学习
该站点同”52nlp”一样,不同的只是更加专注机器学习。
6、Spark MLlib 机器学习
来自CSDN的一位博主,多是关于Spark Milb的文章。博主著有《Spark MLlib机器学习》一书,博客的文章同样质量很高。
网址:http://blog.csdn.net/sunbow0/article/category/2779609
7、alexminnaar
来自国外的一个博客,丰富的机器学习实践经验,包括:神经网络,深度学习,线性回归等。
网址:http://alexminnaar.com/
大数据
1、dongxicheng.org
作者董西成,著有《Hadoop技 术内幕:深入解析MapReduce架构设计与实现原理》和《Hadoop技术内幕:深入解析YARN架构设计与实现原理》。
网址:http://dongxicheng.org/
2、过往记忆
国内比较出名的大数据个人博客,围绕Hadoop生态圈和Spark的大量文章可供阅读。
网址:http://www.iteblog.com/
3、LXW的大数据田地
比较偏重于Hadoop生态圈,文章的质量很高,能够解决一些实际生产中遇到的问题。
网址:http://lxw1234.com/
4、极豆技术博客
个人博客,很多大数据和分布式的优质文章。
网址:http://www.geedoo.info/
5、datalab
比较综合的一个站点,很多大数据领域相关的文章,但偏重于资讯。
6、虾皮工作室
来自博客园虾皮工作室,文章围绕Hadoop,适合入门学习。
网址:http://www.xiapistudio.com/
7、粉丝日志
早期学习Hadoop时,阅读了许多粉丝日志的文章,文章的质量很高,大都是解决一些实际问题。
网址:http://www.hankcs.com/
8、数据分析网
数据分析网,国内领先的大数据门户,旨在帮助大数据从业人士、爱好者提供大数据新闻资讯、前沿技术、业界观点的信息平台。
网址:https://www.afenxi.com/
结语
数据科学领域的相关技术,近两年发展迅猛。有时仅凭个人的经验很难解决一些问题。互联网上遍布各类文章和资源,在学习时应该集万家之长,注重实践,并善于总结。同上面各博客的博主一样为知识的开源做一份贡献,让知识广为传播。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。