数字原生就是数字世界优先于物理世界的逻辑思考方式。数字计算机发明之前,我们几乎没有什么数字资产和技术。数字计算机发明到今天,我们对于数字资产的积累呈指数系数增长。中国社会更是有后发优势跳跃式发展。举个例子而言,我们出门不带手机就感觉有点寸步难行,本质上是因为手机你可以看作我们进入数字世界的一个窗口。通过手机,你可以向数字世界发出各种请求调度我们物理世界的资源为我们所用。Pivotal喜欢以”ask+综合部门@pivotal.io”的邮件方式来获得综合部门的支持。我们早期行政部门的同事刚加入Pivotal的时候问我:“为什么不面对面请求,或者打个电话,或者开个单子。”我说这个事情看似差别不大,但是事实上一个思考问题方式的差别。Pivotal作为数字化的领导者, 我们把软件和数据平台看作一个数字世界的入口。我们获取资源的方式是向这个数字世界发出请求。数字世界可能通过它的计算找到最优执行路径。有些执行可能还是需要转发到人进行人工处理,例如去安装一台打印机。但是有些请求大数据和数字化应用可以直接通过软件方式解决,例如申请一台云服务器。有些请求我们虽然今天做不到没有人干预,但是我们的框架先奠定起来,为以后的对接做好准备和持续改进。在作者看来,数字原生的持续改进过程分为如下图所示的三个阶段:
- 通过数字应用实现数字世界和物理世界的无障碍交互
- 通过大数据平台实现数据积累和数学模型运行支撑
- 通过数学模型的持续改进来最优化数字世界和物理世界为人服务
《Cloud Foundry:从数字化战略到实现》著作的主要目标是阐述企业如何实现数字原生第一阶段:现数字化应用。我们讨论了云计算作为第三代技术平台带来的商业模式变更。在云计算机的技术栈中,P层云带动了企业数字化浪潮。传统企业通过P层云可以迅速获得顶级互联网公司的迭代和软件发布速度,把与客户的交互通过消费级的应用数字化。书中举例福特通过FordPass建立以汽车实体产品为核心的一系列用户数字化体验:汽车金融、远程监控车辆、停车位预留,旅途产品和服务推荐等。这个阶段也是一个持续改进的过程,拿共享行程而言。今天用户通过手机平台进入数字世界,在滴滴应用中发送订单。滴滴平台通过选择最优执行路径,把订单发送到滴滴司机那里。然后司机在物理世界中把驱车到用户起点。随着有辅助的无人驾驶技术的成熟,这个数字世界的运行链条会继续延长,数字平台可以直接把无人车派送到用户起点。在其他的行业,数字应用的链条同样也在持续延长。
《Greenplum:从大数据战略到实现》(即将面试著作)的主要目的是阐述企业如何实现数字原生第二阶段:大数据平台。随着数字应用的链条不断延长,企业需要一个大数据平台来积累应用生成的数据。这个听上去很容易,我们早年就有磁带来存储数据,为何需要Greenplum这样一个大数据和机器学习的平台?原因是两个:1)量大;2)快速计算。说到大而快,我们脑海中直接产生了恐龙和袋鼠的视觉冲突,这也是企业在这个阶段步履维艰的原因。说到大,当数据量达到PB级别(相当于16000个64G的iPhone的数据),我们可以想像企业利用廉价但是可靠的存储来备份和管理是非常困难的。说到快,假设用户从16000个iPhone的数据寻找5年前的一张照片就可以感受到大海捞针的困难。更何况企业的数据平台要支撑的在机器学习和人工智能的数学模型复杂度要比寻找一张照片的复杂度高几十到几万倍。Greenplum团队笼络了一批学霸积累了15年的知识和创新来解决这些难题:如何利用低价的存储来实现高可靠的数据保存?数据的存储如何为今天模型的计算作准备?如何提供最简单但又最标准的接口给模型?数据管理如何平衡便于存储和便于日后查找?如何利用现在的I层云计算资源?如何访问文本等各种数据源?如何访问和计算存储在其它系统(例如Hadoop)的数据?如何支撑今天的主流的人工智能和机器学习模型?我们在创新过程中撞到了很多计算机科学本身的极限。希望我们这本著作呈现给读者一个解决了上述问题的并可以操作的大数据平台和战略。
我们还在酝酿的《数学公司》著作希望如何实现数字原生的第三阶段:机器学习和人工智能。企业通过第一和第二阶段的努力捕获了大量的数据。为了更好的理解用户的需求,不少企业进入了更高阶的数字化战略:大数据驱动的机器学习和人工智能。在这个阶段的竞争,企业会引来一个新的工种:数据科学家。大数据科学家们会在大数据平台创造和优化数学模型,以期待改进数字世界和物理世界的运作来更好的为人服务。还是拿共享行程举例,当用户下单的时候在数字世界里面寻找一条最佳执行路径可能已经错失了最佳优化时间。一个数学公司的数学科学家可以创建一个汽车需求的热力分布图模型,这个模型尝试预测用户的下单起点位置,系统在用户下单之前就在时时刻刻的调度车队以实现最快响应速度和最短总体派遣路径。
虽然数字原生第三阶段的探讨还在创新者和早期用户者群体,但是第二阶段大数据平台的建设已经在中国已经在如火如荼的开展。大数据平台在数字原生三步曲中扮演了承上启下的关键,中大型的公司有已经将大数据纳入信息平台的建设方案中。Greenplum因为开源生态和杰出的创新能力都被列为方案的候选技术选项,这也是我们Pivotal中国办公室的同事们倍感欣慰。