互联网技术 / 互联网资讯 · 2024年4月5日 0

BI工具选择攻略

工欲善其事,必先利其器。BI工具是BI项目的核心,选对工具,BI项目就成功了一半。面对市场上鱼龙混杂的BI工具,不少企业眼花缭乱,无从下手。其实,BI工具选型说简单也简单,根本的原则就是两个字:合适。

不同的企业在所属行业、具体业务、发展和管理水平、信息化水平、人员技术背景等方面都存在非常大的差异,照搬照抄别人的答案并不能解决问题。企业必须“量体裁衣”,找到最适合自己的BI工具。采用技术太过前沿的BI工具,如果没有落地场景,这些工具最终将变成IT部门的成本,而技术落后的BI工具很快就会过时,对企业发展也有很大的制约。因此,在BI工具选型时须慎重,走中庸之道,不保守、不激进,不盲目追求新技术。所选的工具不仅当下能发挥作用,而且在一段时间内其技术不至于过时。既关注工具本身,也要考虑企业自身实力。从场景出发选择BI工具,必将带来不错的回报。

BI工具选型要素

具体而言,关于BI工具选型要素,企业需要考虑的不外乎易用性、稳定性、功能、采购成本、BI厂商的能力等几点。图1所示为帆软数据应用研究院的调研数据,可以看到企业在选择BI工具时,最关注的是BI工具是否高效、易用和便捷(69.10%的受访企业看重这一点)。而Gartner在SuRvey analysis: Key Selection CRITeRia foR BUSineSS Intelligence and Analytics platforms报告中指出,工具的易用性对企业获取商业价值也是排在第一位的影响要素。

从图1来看,企业对于BI工具的功能与稳定性的关注,比例相近,是选型时考虑的第二大要素。而采购成本并不是企业选择BI工具时的主要考虑因素。另外,近三分之一的企业(占比为31.2%)看重厂商所提供的服务支持和学习资源,说明企业认识到BI工具附带的服务和学习资源在项目的运维与开发中有着至关重要的影响。

1、易用性

易用性决定BI平台的整体使用体验,是影响用户持续使用的首要因素。具体来说,BI工具的易用性主要体现在上手难度、交互体验、学习资源丰富度等方面。

很多BI工具都有“零编码设计”的理念,目的是最大限度地降低用户的上手难度,能用可视化界面实现的操作,坚决不写代码,能用鼠标拖、拉、拽操作实现的分析,坚决不用函数,大大降低了学习门槛和成本。

由于使用BI平台的人员职能各有不同,各方面素质也有不小差别,因此对于不同的使用对象,BI平台的交互体验是否足够好,是否能满足他们的需求就非常重要。例如,开发者是否能快速建立数据模型,做好数据预处理;业务人员是否能在无技术基础的情况下快速进行自助分析,洞察业务问题;平台管理员是否能够迅速建立完善的权限体系,方便地管理整个平台,如对角色的管理,对组织架构的管理,对权限的管理,对分析模板的管理等。

最后是学习资源的丰富程度。与手机等不需要说明书即可操作的工具来说,BI工具还达不到这种易用境界,毕竟它更多时候被用于开发。如同Excel一样,要想成为BI工具高手,实现更深入的数据分析,还是需要学习的。所以,易用性还要求BI工具为用户的学习提供方便,也就是提供多种多样的学习资源,例如帮助文档、教学视频、技术方案、问答等。这些附加内容帮助用户在快速入门后进一步提升对BI工具的应用能力,也为企业创造更多的数据应用价值。

2、性能

BI工具的性能决定BI平台的运行速度与运行质量,不仅要快,还要稳定。大数据时代,企业数据的量级不可同日而语,能支撑大数据也是对BI平台的关键要求。大部分公司会通过Hadoop、SpaRk等大数据架构,配以BI工具做数据层面的分析,搭建一整套大数据分析平台。大数据分析很关键的一点便在于性能:取数快,分析响应快,能实时处理数据。这些性能特征除了与平台的底层技术架构相关,与BI工具的性能也有很大关系。

很多人可能认为BI工具就是一个数据展现工具,从前端看起来没有什么技术含量,但其实BI工具的前端展示功能只是冰山一角,其背后的逻辑十分复杂,实现难度也很大。好的BI工具都有与之搭配的数据引擎,其作用一方面是提升数据响应的性能,例如大数据量下的快速计算;另一方面是根据不同的数据量级和类型,灵活地调整计算模式和方案,比如对小数据快速读取,对大数据进行分布式并行运算,对节点数据实时展现等。例如FineBI的SpideR引擎之所以能做到亿级数据秒级展现,是因为其配备的不同策略和高性能算法能够灵活高效地支撑前端的高性能分析。

BI工具还要保证稳定性,频繁宕机和故障对企业来说是难以承受的。曾有企业采购某厂商的BI工具后,因为频繁宕机而使得企业的整个IT环境都受到影响,最终不得不撤出采用了该产品的系统,不敢再部署到生产环境中。最后的解决方案也只能是更换BI工具,所以稳定性也是BI工具选型时必须考虑的性能特征。

3、功能

BI工具的功能众多,不同企业的需求也不同,但是有几个核心功能是必须具备的,包括数据准备、数据处理、数据分析与可视化、平台管控、场景需求转换等。总体来看,考虑BI工具的功能时,一定要符合强大、灵活、易用、安全、可视化程度高的特点。

(1)数据准备。数据准备是指将原始数据读取到BI平台并进行基础的管理和建模,为后续的分析奠定基础,具体包括数据存取/连接、数据管理等环节。

BI工具要允许用户连接到本地和云上各种类型存储平台中的结构化和非结构化数据。主流BI工具都支持将数据存储到本地服务器,以提高BI平台访问性能和数据安全性,减小对业务系统实时直连抽取数据的压力,避免因数据提取而导致业务系统宕机。同时,BI工具也提供直连数据库和数据仓库的功能备用。表1给出了BI工具需要支持的主流数据类型。

除了存储和连接数据外,某些企业还有补录数据的需求,因此部分BI工具也提供了数据填报功能,允许企业录入业务系统之外的数据。

BI工具也常以业务包的形式对数据进行管理,使用户可以根据不同的业务包主题对数据分类,提供数据相关的各种信息。用户可以通过血缘分析、更新信息等内容和关联建模等操作,更好地了解和管理自己所拥有的数据。

(2)数据处理。在企业中,分析人员对于数据处理的需求灵活多变,并且经常需要对不同业务系统的数据根据相同的维度或者属性进行关联分析,IT部门提供的对数据的基本处理功能和基本的关联关系并不能完全满足需求。

例如,分析人员要根据公司产品销售明细数据分析用户的特征,并调整相应的销售策略。这个时候就需要基于销售清单数据,计算相应的分析指标,比如每个用户的消费频次、单笔消费最大金额、最近两次消费的时间间隔。这就要求BI工具提供数据处理功能(例如新增列、分组统计、过滤、排序、上下合并、左右合并等),使用户能以极低的学习成本将数据处理成自己需要的结果,也让IT部门更专注于准备基础数据的工作,将数据分析与处理的任务交给更熟悉业务的分析人员。帆软自助式BI工具FineBI创新地提出了“自助数据集”的概念(即用户用于自行处理数据的数据集),业务分析人员只需要点击“选取数据表和字段”菜单项,执行对应的操作,就能处理基础数据表,得到后续进行可视化分析所需的数据集。

(3)数据分析与可视化。BI中的数据分析与可视化有多种需求类别,例如可视化探索分析、制作仪表板、制作固定报表等。

其中,可视化探索分析需要面向分析人员,让他们能够以最直观快速的方式,了解自己的数据,发现其中的问题。用户只需要进行简单的拖曳操作,选择需要分析的字段,几秒内就可以看到想要的数据,通过层级的收起和展开,下钻上卷,可以迅速了解数据的汇总情况。这对BI工具的多维分析和可视化图表等功能有非常高的要求。

仪表板的目的在于让用户将多个分析内容组合成一个展示面板或者报告,并基于面板监测关键指标,定期汇报工作,将用户从手工处理Excel文件、制作PPT文稿中解放出来。因此,用户利用仪表板应该可以随时通过筛选器过滤数据,可以通过组件联动功能实现关联分析,还可以通过跳转功能将多个仪表板组合成一个更大的分析主题等。此外,作为展现数据主题的容器,仪表板还应提供自适应布局、主题颜色与样式配置、丰富的组件样式等,让用户可更好地展示和表达数据分析的思路和结果。

对于固定报表,BI工具需要提供不同表格样式和复杂格式的设计能力。

(4)平台管控。在所有的功能之上,依靠BI工具的平台管控功能,企业可以建成数据分析体系,方便地管理仪表板与用户,以及对系统进行个性化设置,进而支持各种业务主题分析。具体来说,平台管控需要为用户提供统一访问、集中管理、分类维护三大功能。

·统一访问:提供统一的应用访问门户,通过对用户角色和权限的控制,使不同角色的用户能够通过一个门户系统看到符合自身需求的仪表板视图,使用仪表板功能。

·集中管理:对于数据决策系统中的系统资源、系统配置、监控日志、用户、权限、仪表板模板、定时调度等内容提供统一的管理环境,方便用户日常管理。

·分类维护:在整合和规范仪表板数据的基础上,为不同类型仪表板提供对应的开发手段,采取统一的仪表板模板化定制和发布方案,简化其维护工作,降低此项工作对IT人员的依赖。

(5)场景需求转换。除了PC端应用以外,不少企业还会有数据大屏、移动端应用等场景需求。因此,BI工具要具备场景需求转换的能力,在不同的终端场景中有较好的自适应性和稳定性,以满足不同人群、环境和场景下的多样化需求。

4、采购成本

BI工具选型通常会受到财务预算的限制,因而采购成本也是不少企业在选型时重点考虑的因素。然而,对采购成本的控制不等于简单的报价和还价,价低者为最佳,还包含对很多隐性因素的考量。企业需要格外注意两点:一是综合考虑各项成本,二是学会用ROI(RetuRn On InvesTMEnt,投资回报率)模型量化价值。

每个企业都想花最少的钱买到最好的BI工具,然而很多企业忽略了总成本领先原则,并没有对成本进行综合考虑,而仅看到显性的采购成本。这样