· [专题] 泛海27.55亿元入股联想控股 苹果新品发布
· [专题] 2009通信展 高端访谈 "图说" 博友游展会
· [专题] 优酷遇反盗版 遭一亿索赔 李开复真离职了
· [热点] 泛微协同办公(OA)软件打造企业和谐管理
· [热点] "魔兽"烧钱5000万不见回报 否认18日开服
· [热点] 李开复造创新工场 马云炮轰银行嫌贫爱富

赛贝斯卢东明:BI数据库新视点

发布时间:2007.01.24 17:53     来源:赛迪网    作者:

各位来宾,各位领导,大家下午好!非常高兴今天能够有这个机会代表赛贝斯公司在BI这个领域里面分享一下数据库的视点,主要跟大家分享一下创新的理念,用一个例子给大家讲一下一些产品的特点怎么样能够把创新融合在产品里面。

那么刚才我来之前看了一下时间,大概留下我的时间已经是很少了,所以我想了一个很大的问题,就是怎么能够尽快地把我这个讲完,让大家不会今天整个一下午的会议那么累。我想了很多,我要自己做一个BI我做一个什么决策来支持我今天下午怎么讲?我想了一些想法,我是不是能够唱个歌让大家不至于那么困,后来我想了一下,今天这个场合不太合适,那么我做了另外一个我自己的决策,是什么呢?我会把我的片子压缩一下,能够跟大家尽快地分享。那么实际上BI在各个领域和行业是无所不在的,我想在座的每个人都可能来自各个行业,有电信、有金融、有零售和制造业,你们每天会面临着大大小小BI的决策,我今天举的例子只是一个非常小的,在我个人的一个活动中做的决策。那么谈到BI,那我们先把这个Business这个词拿出来,我想每个人当你的企业和商业在发展的过程中,你会遇到你要的是什么东西,你到底要的是Busi—ness还是Business?你要很有创意地制作你的产业吗?其实我们想了一下Busi—ness这个词通常翻译成商业,但是更多的时候我们会翻译成生意,那么生意是什么东西呢?英文里面没有什么太多的意思,但是中文生意这个词,生、意,你一定要在你的企业里面产生创意,有创新你才能够带动你的企业往前发展。不管你是要从小企业变成大企业,还是要把大企业发展到全球上,你从小发展成大,成为今天跨国公司不管是Google还是雅虎这些公司都有。从数据仓库的发展规律来看,通常大家会做一些数据库提供一些静态的信息,再往上他会提出第二段的需求,就是对信息进行管理,比如说要累计历史的数据,在这些数据上进行一些分析,分析出来一些指标来支持企业的发展。再往上可能要以客户为中心,建立整个企业级的仓库,那么在上面进行数据挖掘和业务评估等等。来支持企业更深一层的发展,这是BI的一些发展过程。那么我们很多的企业目前来处于第一和第二阶段,想通过一些应用能够发挥出他的创意来,才能够走向更高的层次挖掘企业内部的效率。那么在数据这一层,其实我们可以这样去想,没有一个数据库它能够在企业这一级能够两边都能够非常有效地完成连接事务处理的应用,同时又能够完成企业的决策支持或者是BI系统的应用。那么怎么样能够正确地理解这两类的应用呢?实际上就是创新的根本点,今天我非常赞同高院士提到的观念,就是根源性的创新,那么根源性的创新是基于对整个企业或者是整个行业,或者是你所在领域一个非常深的理解。像对我们数据库的领域里面,我想大家熟悉赛贝斯的可能比较清楚,在十几年来赛贝斯第一次进中国的时候,给中国带来了很多创新性的概念。比如说最早的存储过程的特性,还有一些优化器等等等等。那个时候推动了一波IT或者是数据库的变化,那么现在我们也是,应用现在数据库的发展,提出了一些新的概念,革命性的创新。那么首先我们看一下在连接事务处理,数据库的特点是短小精悍,要求快进快出,比如说像这两部车一样,如果你今天开车要到北京一个繁华地带停车买东西,你一定希望你开的是一辆很小的车,只要有一个空档你马上就可以把车开进去,不需要花很多的时间到停车位,但是反过来我们今天做的不是这样的一个事情,我们是做一个很复杂的数据,在海量的数据上要求进行大吞吐量的分析,好像我把全场的嘉宾请到会场开会,我是不是开这样的小车我拉200趟把这些人拉过去,不会的,我会用大的公共汽车。那么这就是这两类应用截然不同的特点。那么这么多年来,大家在IT搞了很多年,那么IT发展的瓶颈在什么地方?瑞士的联邦技术学员,信息和通讯研究所他们发现,过去的几年,CPU的速度增长,是以每年50%的速度来发展的。那么在IT里面的人都很熟悉一个摩尔定律,它的讲CPU的继承组,芯片的集成度每18个月翻一倍。这个图上面的线是摩尔定律的预期值,那么下面的线实际上是英特尔公司从70年代到现在CPU发展的一个实际的情况。大概没有做到18个月翻一倍,但是2年翻一倍。另外一点这个学员他们发现内存的容量和速度每3年增长4倍。反过来影响硬盘的吞吐量却没有得到高速的发展,过去的10年历年只增长了两倍,大家可能说不对,其实我现在的硬盘都很大,以前我硬盘只有十几兆,但是已经到了几十G了,但是容量和吞吐量是两个概念,硬盘只大了,但是并没有快。所以他们是瓶颈在逐年恶化。这对于我们整个数据库或者是BI这个领域里面提出了很高的要求,怎去年避开这个瓶颈,或者是化解这个瓶颈,能够得到数据库界的突破。我们提到根源的创新,那么赛贝斯有一个产品,针对数据仓库设计的产品,叫做赛贝斯IQ,就是一个革命性的创新。所有的数据库到目前为止存储数据都是按行存储的。唯一只有赛贝斯IQ提出了一个革命新的进步,不再是按行存储,而是按列存,如果我想很快地让今天的人进入会场的时候,之前我不会进行筛选和引导,我让他们都进来,自己找一个位置坐。但是我今天说嘉宾有多少,我会把嘉宾放在前面,放一个牌,当有嘉宾进来的时候我让他们坐在前面,但是我再嘉宾有多少的时候,我不会乱找,我只要数一下前面的来宾就可以算出来。所以列式存储就是这样的原因,当你做统计分析型的应用的时候,是我们BI的特点,效率非常之高。降低了我们刚才说的IT的瓶颈,就是降低了IO,这是在最关键的地方有了革命性的创新。在这之外,这个产品IQ,在数据的压缩有着显著的一个特点,刚才我讲到了,我把这个片子压缩到几张,大家会很高兴,如果我每张读一遍,大家可能现在已经困了。在数据库同样,在不丢失数据的真实的情况下,我们的存储是用压缩存储。所以从IQ的存储和传统产品的存储,我们会比一般的数据库少6倍的存储膨胀,在我们IQ的存储下,因为我们进行了各种各样的压缩,就会只占0.6或者是0.9个T,而传统的存储要占6个T。第三个创新是目前没有一家数据库多大9种索引,而且不是基于你应用的查询现设定的索引,而是根据数据类型设定的,当我不知道要查什么的情况下,就因为我各个字段上都有索引,就可以应付各种各样的位置了查询,而不像其他的数据库或者是目前业界的数据库,可能要针对应用,你要知道你查什么,针对这应用设计索引。那么这是一个实例,美国有一家公司,他每两年统计全球的十大数据仓库,我们中国的电信也在2005年入选了数据仓库,在这一点我们可以看到雅虎公司的点击流数据分析的仓库,有100个DBT这么大,有一家公司只有16个T,但是第二行的比较,他们比雅虎的数据仓库还要多将近一个T,这里面数据压缩的特性可以很快地表现出来,大家知道多6倍的存储意味着6倍的开销。这个公司是5000亿条,雅虎是3850亿条,所以我说在这个例子里面,可以用1/6的资源解决更大规模的数据的应用。那么另外一个创新就是IQ可以在扩展性上有非常好的体现,不管是什么样的硬件、软件平台,当你们在一台机器不够的情况下,通过我们这个技术就可以很自如地伸缩开,放大加多个机器很自如地有这种方式还扩展性能。

这些优势我不讲了,在速度和可扩展性、TCU以及灵活性方面,都是基于底层根源性的创新,来导致了我们现在产品的特点。那么赛贝斯在全球应用方面有1800家客户。中国也有很多赛贝斯IQ的用户,像上海期货交易所,像广东电信还有我们新跟国家电网公司做的ST186的项目。那么IH实际上大家做BI系统时候的一个存储的核心,就是围绕一个有创新的软件平台,可以是一个开放的,面对着前端的数据和后端各种各样的数据,可以运用自如地架构一个系统,这就是赛贝斯IQ可以在创新的情况下,为中国的企业做很好的帮助。


[ 发表评论 ] 字体[  ] [ 打印 ] [ 进入博客 ] [ 进入论坛 ]  [ 推荐给朋友 ]
  相关文章
  客户需求反馈表
* 姓  名:
更多资料  了解方案  认识厂商
* 单位名称:
* 联系电话:
* 电子邮件:
资讯 通信 IT产品 IT技术 信息化
专题:扭亏为盈 联想09年Q2翻番
·专题:Tech·Ed 2009微..
·直播:2009互联网大会..
·迅雷搜狐"互搏" 谁动了..
专题:诺基亚危局已现 或重蹈摩托覆辙
·六股势力角逐4G标准 中..
·专题:联通iPhone并不贵..
·专题:排排坐开商店 三..
商务演示需求分析 多媒体会议室必备投影
·VMware在京隆重举行2009..
·专题:笔记本频道10月热..
·专题:学生机市场 惠普 ..
专题:Tech.Ed 2009微软技术大会
·让物品开口说话 ——物..
·专题:2009 SYBASE 亚太..
·专题:微软新一代桌面操..