在最近的Google Cloud Platform Next巴黎体验活动中,谷歌宣布了一个数据可视化服务的测试版本,名为Cloud Dtalab。Cloud Datalab允许开发人员通过一种交互式Web浏览器体验研究和分析数据。
Greg DeMichellie是谷歌的产品管理总监。他将这项服务描述为“一种工具,该工具允许用户分析原始数据,并以一种快速、简单、高效的方式研究、分享和发布报告。”
DeMichellie列举了Cloud Datalab的核心功能:
- 在谷歌云平台上研究、转换、可视化和处理数据。它可以管理兆字节和千兆字节的数据。
- 可以与多种语言代码完美结合:Python、SQL及JavaScript(BigQuery UDF)。
- 构建和测试Google BigQuery部署的数据管道。
- 创建、优化及部署机器学习模型。
由于Cloud Datalab是一项托管服务,所以开发人员和数据科学家可以预期,Cloud Datalab会通过配置和基于向导的设置过程提供一个很低的使用门槛。要使用Cloud Datalab,开发人员必须将该服务部署为Google App Engine应用程序。这样一来,Datalab将同时使用Google Big Query和Cloud Storage作为后台服务。
Cloud Datalab还使用了Jupyter,开发人员可以将脚本、文档、可视化表示和结果存储在notebook中。开发人员可以使用现有的Jupyter包,包括统计和机器学习库。Datalab服务的用户还可以同类似GitHub和Bitbucket这样的非谷歌源码控制库共享notebook。
下图展示了一个可供新用户使用的预置notebook和服务中已有的GitHub集成:
在价格方面,谷歌表示,用户只需要支付包括BigQuery和Cloud Storage在内的App Engine所消耗的云资源的费用。谷歌还在GitHub上开源了Cloud Datalab项目,允许开发人员派生或提交pull request。
在云数据研究和可视化领域,谷歌面临着亚马逊、微软这些熟悉的竞争对手的竞争。亚马逊的QuickSight就是一个低门槛的、基于配置的商业智能工具,客户通过浏览器只需要很短的时间就可以开始可视化他们的数据。亚马逊还采用了一种同谷歌类似的模型,将其可视化平台置于其他自有服务之上,如亚马逊RDS和亚马逊DynamoDB。微软的PowerBi也是一款有名的BI工具,允许终端用户和开发人员使用来自各种本地和云服务的数据,并在Web浏览器或移动设备上将其可视化。微软还使用了许多类似Excel的、用户熟悉的特性,非常有利于该工具的推广。
作者 Kent Weare ,译者 谢丽
链接:http://www.infoq.com/cn/news/2015/11/Google-Cloud-Datalab
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。