Pivotal:以转变世界构建的力量加速数字化转型

2019数博会

      在2019年5月25日,“云计算和大数据发展前沿高峰论坛”在贵阳国际生态会议中心举行,Pivotal中国公司常务董事(Managing Director)兼研发体系总经理冯雷受邀到会,与国内外著名院士、学者以及英特尔、华为、谷歌、微软、百度、腾讯、阿里等知名企业专家共同探讨云计算和大数据领域发展现状、面临的关键性挑战问题和研究方向。而作为最后一位压轴出场的特约演讲嘉宾,冯雷以“转变世界构建和运行软件的方式”的主题报告,为论坛划上完美的句号。让我们一起分享下冯总精彩的演讲内容。

在如今这个云时代,存在一个类似于PC时代微软Windows的崛起般的机会,这就是企业数字化,它与云数据库、云操作系统一同并称为云时代的三大最关键产物。但有一点和微软不一样的是,诸如云上数据库等内容太新,数据化转型也需要像Google、Facebook开发软件那样掌握方式方法所以,Pivotal为用户提供了可实践方法论的实验室,在开发过程中,来自甲方的技术人才会来到实验室与我们的专家一起,在我们的平台上实现数字化。而我们今天将重点讨论的是云数据库。

携开源之势,Pivotal云数据库为数字化转型提供强劲动力

云数据库的概念就是如何在云时代中看待数据库,云计算时代给我们一个重新审视数据库的机会。那么,Pivotal的数据库有哪些优点?

  • 第一是云原生和跨云。用户可以将我们的数据库安装在任何平台上,包括阿里云、腾讯云、亚马逊云;云数据库的扩展规模很大,我们的数据库可以充分利用云上带来的弹性计算资源。

 

  • 第二是成为一个业内公认的数据平台,结构化数据、半结构化数据都可以支持。前面专家提到了Hadoop系统做了很多硬件优化,Greenplum可以以更好的性能访问Hadoop系统的数据,当然我们的系统的不少数据也可以通过其他系统访问;我们的目的就是希望用户能用最简单的方法产生人工智能、机器学习的效果。关于这一段我们会在后面的讨论中解读。
    Greenplum适用于所有环境,包括混合部署 通过Kubernetes
    • 第三,开源是大势所趋,所以Pivotal在创立的第一天就把所有源代码全部放在了互联网上。直到今天,Pivotal发展成为一个拥有两千余位员工的独角兽企业,我们拥有七八百位开发人员,我们依旧将所有的源代码都放在互联网上,这一点大家可以从Github上看到。

那么,我们为什么要这么做?为什么要突出开源?我们现在无论是强调数字化,甚至是举办数博会,都是为了迎接数字世界的未来。如果未来世界数字化是企业的核心竞争力,企业必然希望自己的创新能力建立在自主可控的可持续创新技术上,开源是技术平台选型的必要条件。我来自Oracle,所以我能感受到闭源数据库和开源数据库的明显区别,所以我们认为开源数据库的发展会异常迅猛。

并行计算,开源数据库以“速”赋能

接下来和大家分享下数据库的运行速度我们的数据库运行速度是非常快的,这个大家可以百度一下,它为什么很快?道理很简单,假设我们要从一副扑克牌中找到红桃5这张牌,一个人找的话很慢,但是四个人每人拿13张牌同时找,需要的平均时间就是四分之一,也就是说通过更多计算资源同时计算,提高计算速度,当然随着计算越来越复杂,并行计算也会有损耗。我们利用了开源数据库,并在上面用并行化的计算使其能够达到最好的计算速度需要强调的是,Pivotal数据库是一个利用若干个并行的Postgresql数据库实现的并行虚拟数据库。

让云计算和大数据赋予机器学习的力量

有人可能会提出疑问?你们是一个数据库,那该怎么做机器学习模型?在这里我想和大家分享两个案例。一个是Pivotal和美国伯克利大学联合在我们的数据库上做了一个MADLib机器学习库,通过简单的SQL语句就能实现机器学习,一些常规的机器学习算法都在里面。MADLib是Apache顶级开源项目,在我们的产品用MADLib的几个简单语句就可以实现聚类和分类,操作简单且速度快。

结合MPP和GPU进行并行深度学习

此外,例如我们提供了文本分析、地理位置信息这些相关的智能计算模块,我们在日本就进行了这样一个项目,通过Pivotal系统计算,算出每个位置雨水量和车祸之间的关系,所以每到下雨时,日本都会在一些相对危险的路口做出预警。刚才有嘉宾谈到人工智能人才很贵,两百万一年,用我们这个系统可以降低人才的准入门槛。

Open source –   

https://github.com/apache/madlib

Downloads and docs – 

http://madlib.apache.org/

Wiki- 

https://cwiki.apache.org/confluence/display/MADLIB/

目前,我们已经完成了很多实质性的工作。比如说,刚刚的分享嘉宾谈到说数据很难管理,我们发明了工具把这些数据导入和管理起来,数据库本身就是标签化的。因为我们是开源的,社区伙伴会提供各种工具,所以我们欢迎每位同仁来与我们交流分享,共同迎接开源未来。

发表评论

电子邮件地址不会被公开。 必填项已用*标注