大数据三种典型云服务模式

2019-04-14 21:18发布

 

2016-02-20 朱洁 hadoop技术学习 大数据能力以云服务的形式提供出来非常普遍,国际大厂aws,azure,国内阿里,华为都有类似服务。今天讨论下大数据云服务的几种模式。   第一种,最典型的叫集群托管模式   最典型的服务就是aws的emr服务,可以访问:https://aws.amazon.com/cn/elasticmapreduce/。这种模式下云服务主要解决的是大数据组件集群的安装,监控,运维管理等,降低技术人员对大数据集群底层的技术知识门槛。云服务资源按需申请,加快了业务部署的时间,同时将一次性的采购成本转为按需使用的费用,降低了企业运营的风险。

  这种模式下面,核心是减少了运维的负担。但是业务人员还需要根据不同的业务要求,去选用不同的组件,以及组合各种组件之间的使用。各个组件类似电脑城里面的配件,能不能有一种更彻底点方法,提供一个品牌机给客户呢。   第二种,server-less模式   server-less这个词来源于aws的lambda服务(https://aws.amazon.com/cn/lambda/),通过 AWS Lambda,无需配置或管理服务器即可运行代码。您只需按消耗的计算时间付费 – 代码未运行时不产生费用。借助 Lambda,您几乎可以为任何类型的应用程序或后端服务运行代码,而且全部无需管理。只需上传您的代码,Lambda 会处理运行和扩展高可用性代码所需的一切工作。您可以将您的代码设置为自动从其他 AWS 服务触发,或者直接从任何 Web 或移动应用程序调用。 这个核心是客户不用关心服务器,只需要管自己的代码即可。大数据领域也能提供类似理念的服务。 

  这种模式最典型的是azure的data-lake。可以访问https://azure.microsoft.com/zh-cn/solutions/data-lake/。客户不用再关心各个独立的组件。Azure Data Lake 包括了所有所需的功能,使开发人员、数据专家和分析师可以更轻松地存储任何大小、形状和速度的数据以及跨平台和语言进行各种类型的处理和分析。它消除了插入和存储所有数据的复杂性,同时启动更快,可与批量、流式、交互式分析一起运行。 这种服务底层是构建在基础的托管集群上,把各种服务组合在一起,提供统一的访问。服务本身提供自动弹性伸缩的能力,数据自动搬迁,自动保障客户的SLA。   第三种,大数据saas服务   品牌机相对电脑散件肯定更易用,但是对完全没有电脑知识的人也很难用,而去很多用电脑的人核心是要使用word之类的office软件,更不关心电脑本身其他更多的功能。所以大数据最重要能根据行业提供saas类的服务或者应用。阿里云最近推出了一个郡县图治,有点意思: https://help.aliyun.com/document_detail/shujia/JX/introduction.html?spm=5176.docshujia/JX/howto.3.2.vyl0ml 

    总结一下
讲到最后,客户的层次,和处于业务的情况是不一样的,所以需求也是多种的,因此这三种服务模式都有广阔的空间。第一种模式想对而已,已经陷入同质化竞争,创新的空间有限,未来更看好第二种,第三种模式的发展。                     微信扫一扫
关注该公众号