Python数据分析
-
Github 上 Pandas, Numpy 和 Scipy 三个库中 20 个最常用的函数
几个月前,我看到一篇博客中列出了 Github 网站上 Python 常用库中使用频率最高的一些函数/模块。我在这个基础上做了可视化理,并撰写了每个库中使用频率前十的函数示例。其中本文中只包含了部分示例,完整的示例可以参见我的 Github。
-
使用Python训练KNN模型并进行分类
K临近分类算法是数据挖掘中较为简单的一种分类方法,通过计算不同数据点间的距离对数据进行分类,并对新的数据进行分类预测。
-
Python 中的可视化工具介绍
几周前,R语言社区经历了一场关于画图工具的讨论。对于我们这种外人来说,具体的细节并不重要,但是我们可以将一些有用的观点运用到 Python 中。
-
Python下开始数据科学研究的全面指南
这篇文章的目的就是给那些用python进行数据分析的新人提供一种深度学习路径。
-
一个自动化解决数据科学问题的python工具
机器学习中最乏味的部分就是调整超参数(简称调参)。
-
用Python做自然语言处理必知的八个工具
Python以其清晰简洁的语法、易用和可扩展性以及丰富庞大的库深受广大开发者喜爱。其内置的非常强大的机器学习代码库和数学库,使Python理所当然成为自然语言处理的开发利器。
-
将Python和R整合进一个数据分析流程
在Python中调用R或在R中调用Python,为什么是“和”而不是“或”?
-
Python深度学习库Theano的介绍
Theano是一个Python库,可以在CPU或GPU上运行快速数值计算。这是Python深度学习中的一个关键基础库,你可以直接用它来创建深度学习模型或包装库,大大简化了程序。
-
Python中用K-均值聚类来探索顾客细分
基于 Python 的顾客细分 在这篇文章中,我要谈的东西是相对简单,但却是对任何业务都很重要的:客户细分。客户细分的核心是能够识别不同类型的客户,然后知道如何找到更多这样的人,这样你就可以…你猜对了,获得更多的客户!在这篇文章中,我将详细介绍您如何可以使用K-均值聚类来完成一些客户细分方面的探索。 我们的数据 我们使用的数据来自 John Foreman …
-
使用Python和Perl绘制北京跑步地图
摘要:当你在一个城市,穿越大街小巷,跑步跑了几千公里之后,一个显而易见的想法是,如果能把在这个城市的所有路线全部画出来,会是怎样的景象呢? 文章代码比较多,为了不吊人胃口,先看看最终效果,上到北七家,下到南三环,西到大望路,东到首都机场。二环32公里,三环50公里,这是极限,四环先暂时不考虑了。。。。 1.数据来源:益动GPS 首先需要原始位置信息,手机上有…
-
史上最全Python数据分析学习路径图
Python是一种面向对象、直译式计算机程序设计语言,由Guido van Rossum于1989年底发明。由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python又被称之为胶水语言。下图为主要程序语言近年来的流行趋势,Python受欢迎程度扶摇直上。 Python工作环境及基础语法知识了解对于Python基础语法学习部分,学习周期大概为4周,需要…
-
R语言 vs Python:数据分析哪家强?
摘要:这篇文章旨在更客观地看待这两门语言。我们会平行使用Python和R分析一个数据集,展示两种语言在实现相同结果时需要使用什么样的代码。这让我们了解每种语言的优缺点,而不是猜想。在Dataquest,我们教授两种语言,并认为两者在数据科学工具箱中都占据各自的地位。 我们将会分析一个NBA数据集,包含运动员和他们在2013-2014赛季的表现,可以在这里下载…
-
学神之路 —— Python数据科学全攻略
Python菜鸟到Python Kaggler 如果你梦想成为一名数据科学家,或者已然是数据科学家的你想扩展自己的工具库,那么,你找对地方啦。本文旨在为做数据分析的Python人提供一条全方位的学习之路,完整讲述运用Python进行数据分析的所有步骤。当然,如果你已经有了一些知识储备,或者无需掌握全部的内容,可以按照自己的需求做出调整,也欢迎与我们分享你是如…
-
LIGO用Python分析引力波数据
美国科学家11日宣布,他们去年9月首次探测到引力波。这一发现印证了物理学大师爱因斯坦100年前的预言。宣布这一发现的,是激光干涉引力波天文台(LIGO)的负责人。 这个机构诞生于上世纪90年代,进行引力波观测已经有近30年。那么观测到的引力波数据的量应该很大,科学家如何对这些数据进行分析?有没有用到Python编程语言? 答案是肯定的。笔者在Github上发…