你可能会有一个问题:淘宝和微信上有这么多数据,为什么人们会使用云模式?也就是说,服务器端的数据集中模式本质上类似于SaaS 我记得几年前,很多人把double 11比作12306。他们认为12306比双11弱。业内大多数外行或非资深人士都会这么认为原因是这种比较只考虑数据量,而不考虑数据的相关性。简单地比较数据量是不科学的为了说明相关性,让我举一个行政部门的例子。如果我们都做同样的事情,提高我们处理能力的方法很简单。如果我们投入10倍的员工,我们可以提高10倍的速度,因为这些事情是独立的,不相关的。但是当我们需要处理很多事情的时候,事情之间是一个序列,处理事情的时间是不确定的,我们是否可以简单地增加更多的处理人员来提高效率
。由于高度相关,问题变得复杂,瓶颈可能无处不在。简单的添加会带来混乱,导致相反的效果。
在淘宝微信场景中,大量的数据没有关联,生成后很少改变,所以非常适合使用CDN(非常成熟的互联网缓存技术)。因为数据是独立的,我们可以通过增加机器容量来直接扩大加工能力。专业名称是线性扩展。更重要的是,当你欣赏别人强大的数据处理能力时,你必须看看这些巨头投入的机器数量、带宽资源和劳动力成本。此外,不同的盈利模式也让巨头承担了这些高成本,通过垄断获得了非常高的利润。因此,很多SaaS企业喜欢把淘宝和微信作为门类,觉得随着未来自身规模的扩大,数据处理能力不是问题。这种思维往往忽略了很多SaaS行业数据都是关联性很强的数据,“别人的钻石可能做不到你的瓷器作品”。
影响数据量的各种原因
影响数据量的因素是多方面的,商店的数量,SKU的数量,显然这两个数字越多,总数据量就越多。你往往忽视的另一个因素是用户使用的模式习惯。例如,在服装店的应用中,如果出纳员只完成出纳的工作,检查个人付款的清单,那么提交和返回的数据量非常小,因此问题发生的可能性就会降低。因此,简单地比较一个系统支持多少家商店是没有意义的。如果它是一个高价值的商品收银员,频率较低,SKU较少,那么就很容易支持许多商店的并发性。毕竟,单个商店的数据量并不大,服务器和带宽面临的压力也不是很大。因此,为了增加并发存储的数量,许多系统限制对单个存储的数据访问量,例如通过分页技术减少一次返回的数据量,这在SaaS产品中非常常见,而且几乎是标准的。我有一次让我的朋友在一家国际知名品牌的时装店工作两个月,以便调查他们使用的软件系统。该系统采用与SaaS相同的直接服务器访问方式,软件系统只能查找当前季节的商品情况,这可以减少SKU的数量,商店人员一般只查询简单的报表,返回的数据较少,库存查询一般也是查询一定数量的数据,因此返回的数据量相对较小。事实上,这些都是可以接受的,但会员部分有点差,只能在出纳、对话框中看到单个成员的简单信息,如点数。由于SaaS直接连接模型限制了存储数据访问的数量,因此存储无法进行高质量的数据分析。例如,与历史销售数据进行比较,并进行深入的成员描述分析。由于这些分析需要读取大量数据,很容易引发性能问题,因此数据分析通常由总部进行。最了解数据场景和业务背景的商店人员无法分析和解释数据,总部人员只能了解数据表面的数据,但他们可能不知道商店的具体情况,对数据的理解和解释可能有问题。因此,最可靠的方法是对仓库和总部进行数据分析,以便双方进行交叉核实,避免决策失误。
以上所说的数据分析,是指企业的业务模式也会影响到数据量,即用户模型的习惯。如果企业想要商店经理能够掌握市场斗士,不适当地适应,就必须提高店长的数据分析能力。如果你只想让经理听订单,你就不需要提高经理的IT能力。随着消费市场的日益多样化和快速发展,能够灵活地适应和分析市场的门店经理将有更多的优势,也会更好地向总部反馈市场信息,从而实现商店与总部之间的双向互动。这是一个更有价值的方向。
广域网分布式计算,解决多存储系统稳定性的利器
通过上述分析,我们可以看到SaaS本身对网络的强烈依赖,这使得某些行业无法满足需求,广域网分布式计算可以很好地解决这个问题,如下图所示:广域网分布式计算,可以保证每个商店都有各种各样的数据库,商店的运作只能依靠自己的数据库。即使Internet网络不稳定或断开,也不会影响存储本身的运行,保证存储系统的稳定性。因为商店有自己的数据库,所以可以存储大量自己的历史数据,可以支持存储本身的各种数据分析要求。数据交换通过数据传输平台完成。总部是数据交换中心的枢纽,存储的增量数据将实时传输到总部,然后传输到其他相关存储。增量传输大大减少了网络的传输量,大大提高了带宽利用率。由于SaaS是一种完全重复的传输,每个查询数据都需要重新传输到存储中,造成了网络资源的浪费。分布式计算充分利用了本地计算资源,大大减轻了总部服务器的负载压力,使总部服务器的应对能力提高了数十倍以上。资源少,效率高,使分布式计算可以节省大量的企业成本。事实上,互联网大数据计算,云计算是基于分布式计算,但局域网分布式计算和这里提到的广域网模型是非常不同的。局域网通过大量廉价的服务器进行分布式计算,比以前昂贵的大型计算机计算能力更强大,使互联网企业能够大大节省成本,是互联网行业爆发的基本条件。否则,IBM和Oracle等传统巨头就会夺走利润。类似地,广域网中的分布式计算可以为企业节省大量的计算能力和网络成本,但也保证了更高的稳定性,并提供了更强大的存储数据分析能力。这里是一个真实的成本对比,我们的服装连锁客户之一,有200家商店,使用广域网分布式计算。几年前,一台PC服务器驱动了所有的商店,并支持数十名总部人员的使用。两名分析师远程访问工厂的总部服务器,经常提取超过1千兆字节的数据。总部服务器连接到2亿商业光纤带宽,每年的网络成本为3000元。因为我们不是知名品牌,所以客户老板在个人骗局中,试图改变知名品牌体系,老板不了解系统,干脆认为品牌越大,系统越好。
总结
因此,与传统软件产品相比,SaaS模式是先进的,但它不是万能的,可以解决所有企业信息化问题。企业必须对症下药,进行数字化转型和软件部署,使用最适合自己的产品,而不是最新颖、最前卫的概念。SaaS是好是坏,是否适合某个行业或企业,需要根据实际业务需求和使用场景进行分析。从最基本的判断点来说,企业必须知道自己的数据量和数据相关性,以及用户对稳定性的接受程度。