什么是云计算

很多人问过我这个问题,而据不完全统计,关于云计算的定义至少有上百种,这个基本的问题很难回答,所以在这里想将我关于云计算的思考整理下,一方面和大家分享,另外也和大家一起探讨。

关于云计算有一个广泛流传的定义,就是通过互联网来提供服务,让IT资源像使用自来水一样即开即用等等。仔细思考,这个更像是对某些云计算形态的描述,而不是定义。一方面,如果按照这个定义,很多不属于云计算的东西会划归云计算,例如像传统的互联网网站;另外一方面,如果是运行在内网的云计算实例又会被排除在外。

给云计算下一个完整的定义很难,我不是资深人士,所以这个问题还是留给专家去解决吧。我在这里只是根据我的一些理解和大家分享下如何区分云计算,云计算有哪些特征。

就我的理解,云计算的核心特征或者说是核心技术应该是基于大量的硬件构建资源池,还要能够实现对资源池的自动化调度和管理,另外这个资源池内部的硬件对外是不可见的(资源池内部的硬件的地位是一致的),可以弹性扩展。

从技术上讲,目前构建资源池的方式一类是基于虚拟化技术的,典型的就是弹性云计算(例如亚马逊的EC2);一类是不基于虚拟化技术的,例如hadoop。我对基于虚拟化这方面的了解比较多,而不基于虚拟化的了解很少。有人认为云计算就是虚拟化,这个有一定道理但是不完全正确,弹性云虽然基于虚拟化技术,但是增加了资源池化,以及资源自动调度和管理的功能。典型的几个云管理软件,例如 OnApp CloudStack OpenStack都是基于虚拟化构建的资源池管理和调度系统。

如果承认云计算的这个特征,就可以很方便的把一些伪云计算区分出来了。例如盛大的云主机,通过公开公布的信息看,云主机的磁盘在宿主机上,但是基于现在的技术这样是无法将资源池化的,因此最多只是传统的VPS而不是云;很多所谓的SaaS,其实就是把基于互联网提供的服务改了了名称而已,是不是云,我觉得要看他的底层架构,有没有资源池。例如我在服务器上安装一个Discuz的 x-Space,我就可以给别人提供BSP服务了,是云吗,不是。

在和别人交流的时候,很多人都强调云计算的大数据量,认为云计算一定是大规模的,大数据量的,甚至还说必须要是多少TB多少PB之类的。这个其实是被某些大数据量的云计算实例给误导了,云计算和数据多大容量并无必然关系。最简单的,对于弹性云计算,数据量并不是一个最重要的概念,强调的是计算能力。例如我建一个网址导航站,数据可能只是简单的几百个页面,但是访问量可能有每天几亿IP,那么我的架构可以采用云计算,难道因为数据量太小就不算云计算了吗。

如果认为云计算一定要是大数据量的,那么很可能就走上了发展云计算就主张建设超级数据中心的道路。

在大数据领域,数据量确实是很重要的,但是就我的理解,这个数据量应该是数量,条目量,而不是数据的容量。同样是1TB的数据,可能是几亿条记录,也可能只是100部1080P的高清电影。对于视频网站,估计没有多少其他数据容量大小可以与他们比拟了,但是他的条目数和可分析的价值并不大。因此以数据容量来衡量是极不科学。当然如果从云储存角度考虑,数据容量又是很重要的,所以数据容量只是一个侧面,对于某些云计算类型是要点,但不是整体云计算共有的特征。

大数据强调的是分析数据的全体集合,是相对于之前的采样分析来讲的,从这个方面讲,就大数据本身也不是强调的数据量,当然通常很多情形下所要处理的数据量都不小,但是我们不能因为这个而忘记了大数据的本质。

大漠孤狼 ( www.83blog.com )原创, 转载请注明原文地址 http://www.83blog.com/cloud.html

您可以选择一种方式赞助本站

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: