一直以来,smartbi回馈用户的最好方式是提供更好的产品和更好的服务。v9作为smartbi最新发布的版本,众多实用功能就是从用户的实际情况出发,急用户之所急,想用户之所想。从今天开始,小麦会用系列文章和大家一起分享。本期介绍v9在【数据准备】方面的一些新功能亮点。
分批次和多线程并发,提高数据抽取效率
之前的smartbi版本,数据抽取存在以下两种情况:
1、一次性将所有数据从数据库写入到缓存库中,在数据量较大的情况下,会出现占用内存太大的问题。v9支持分批次将数据写入到缓存库中,既能保证查询速度又避免占用太大内存,达到最高效率;
2、当抽取亿级数据量时,如果为单线程抽取,容易出现抽取缓慢,抽取不成功甚至环境崩溃的情况。v9增加多线程并发抽取,在用户抽取较大数据量时,可设置多线程并发抽取。以smartbi从mpp抽取1亿条数据为例,单线程抽取需要耗时2.5小时,设置10个线程进行抽取时,仅需48分钟,速度提升了3倍。
支持各种数据集的增量抽取,避免资源浪费
之前的版本,只有自助数据集支持增量抽取。v9除了自助数据集,对可视化数据集、原生sql数据集、sql数据集、存储过程数据集、java数据集等也支持增量抽取。在“抽取设置界面”中的“增量抽取按时间戳”选项可进行设置。
支持mpp集群抽取,适用性进一步增强
当高速缓存库连接的驱动程序类型是“smartbimpp”时,v9支持集群抽取。在“抽取设置”界面增加“高级设置”,对“分区字段”和“分区类型”进行设置。其中,分区字段要求为日期类型。
支持自定义表名,查找更加直观
之前的版本,数据集和即席查询抽取保存在高速缓存库的表,默认以“数据集id”作为表名称,“数据集名称”作为表别名,在数据库查看表时,以数据集id作为表名称,不利于用户直观查找需要的表。v9支持数据集和即席查询抽取保存在高速缓存库的表自定义表名。
时间管理增加维度,满足各种统计周期
业务人员经常需要做统计分析报表,如月汇报、周汇报等。为了满足更多维度的统计分析,v9维度管理增加支持“半年”“旬”“周”。 其中,“半年”的显示格式为:上半年、下半年;“旬”为:上、中、下;“周”为:www(w不变,就是一个字母,ww标识第几周,如2019年第一周为:2019-w01。
提供标准函数检验,减少数据抽取报错
之前的版本自助数据集计算字段支持的函数是根据其所属数据库类型决定的,这种方式会存在函数不兼容的问题,导致在抽取时报sql错误。针对这一弊端,也结合产品的使用,v9基于sql92为标准,封装一套smartbi自身的函数语法,用于适配smartbi所支持的数据库,校验输入的函数是否在提供的函数列表中。如果函数不在函数列表中,则会提示该函数不是标准函数库语法,在其他数据库可能无法使用。
除了以上介绍的新功能点,smartbi v9在【数据准备】方面还有很多小优化。如自助数据集的数据来源为“hana数据源”时,自助数据集支持其所带参数;增加“多维数据集”作为自助数据集的数据来源;数据集的抽取日志采取分页加载等等,大家有兴趣可以登录v9体验中心进行试用,亲自感受v9的全新ui、全新功能。
v9体验中心:pc登录官网->体验中心
概括如下:
1、 分批次读数据和多线程并发抽取
2、 支持各种数据集的增量抽取
3、 支持mpp集群抽取
4、 抽取支持自定义表名
5、 时间维度管理增加“半年”“旬”“周”
6、 提供标准函数检验