工业大数据:探寻可视化之路

发表时间:2023-10-11 10:15

进入大数据时代,数据可视化日渐流行,究其原因,一是因为大数据的展示与之前的数据展示有所不同,最大的难点就是面对如此庞大的数据,如何较好地展示给用户,成为前台程序员面临的难题;二是随着近几年技术的发展,可以通过更多的形式,例如三维模型、动画、视频、动态交互式页面、手机APP等将数据以展示、推送、提醒、互动等模式提供给用户,其复杂度上升了一个数量级,因此,数据可视化就成为一个专门的领域,成为了大数据时代的一个研究分支。

具体到工业大数据领域,其可视化又有自身的特点,呈现出与互联网大数据可视化不同的难点和方向。

对于数据可视化,很多人会理解成页面设计,认为没有什么难度。如果在单纯的技术层面解读也许没有问题,但更多的价值是数据维度的设计,这些并不是技术难度,而是业务难度。这其中核心的价值是数据分析的结果是否有用,图表分析目的是让更多的人看得懂,分析维度的准确更加重要。所以,单纯的数据呈现已经不能满足当前的需求,数据可视化,要从业务角度、技术角度、交互角度、美术设计角度、算法角度综合考虑。

工业不只有“大”数据,还有“快”数据

快数据如何进行可视化

工业数据来自于业务系统和自动化数采。5G时代,我们具备了超低延时数据传输的能力,不管是物联数据,还是自动化采集数据都可以忽略延时时间,同步到管理平台进行分析和展示。在硬件数据更新频率极高的场景下,监控者如何在平台端对数据进行可视化就是第一个问题:当全部数据,如图1所示,左边全部展示时,监控者根本无法看清楚,也来不及思考,这种可视化就毫无意义。利用机器算法高效处理这些数据,同时满足快数据分析,再结合对应的业务规则,将问题数据快速地提炼出来,再做可视化,如图1右边所示,监控者就不会遗漏关键数据。

图1 数据快速分析

如果这些快数据需要逐一分析,我们会将数据持久化处理,并对区间段内的数据进行分析,提供变化趋势。分析异常点所处的位置,并提供向下钻取的能力。这样在快数据存储的后期,提供快速定位和查看方法。

更快的检索和更精准的推荐

很多时候,工厂在生产过程中产生的关键指标数据庞大,一台自动化设备可能就有几十个甚至更多的关键指标,再加上工厂部署的大量物联设备就会形成几百、几千个指标,如果我们平铺这些指标,那么对于观察者来说毫无意义。面对如此庞大的指标体系如何进行可视化,显得尤为重要。

更快的查询方法。首先,将海量的指标数据平铺在一个页面上,轮巡显示,只能得到一种具有冲击力的效果,实际价值无法显现。

数据监控者需要在如此庞大的指标中发现问题,找到自己关心的内容,所以具备快速的信息精准定位能力是关键。在后台建立ES索引,实现更快速信息查询,需要在前台可视化的设计中有意识地设计更便捷的数据查询引导。

个性化的推荐方法,让数据找人,如图2所示。快速的索引仍然是由监控者主动寻找信息,利用算法构建不同角色的兴趣模型,由机器将信息推荐给监控者,利用神经网络等新的技术手段,让机器不断地学习每个角色的兴趣习惯,实现更精准的推荐,这样在可视化设计上就能优先展示这些信息,为监控者提供更个性的可视化服务。

图2 数据可视化

宏观和细节如何兼顾

基于“物”构建数据模型

工厂数据进行可视化设计的时候,在整体上感知运营情况,需要对细节数据进行抽象,进而构建基于“物”的数据模型可视化方案。将一个生产线想象成一个“物”,对它进行整体分析,并在各个细节上提供进一步的服务,逐层分解主体数据。让观察者在宏观上有总体认知,又可以根据业务需求快速定位到细节数据。

可视化的不仅是数据,更是价值

“你今天7:35分起床,8:00出门,走了1公里路,换乘3趟地铁。”这既是日常,也是数据。通过数据可以了解一个人的行为情况,洞悉这背后可能发生的事,“你今天可能会迟到”。这就是数据带来的价值。

由此可见,通过数据可视化,单纯展示数据并不能给监控者带来实际的业务需求,只有在可视化的基础上进一步分析、提炼,才能生发出数据的价值。需要特别指出的是,一些敏感数据(工艺配方、个人信息)的可视化可能会造成一定程度上的秘密泄露,这种数据可视化,不仅要符合客户的真实需求,还要符合规定。

大数据可视化已经不单纯是技术层面的问题,而是综合性的,是我们对业务的深刻理解,是结合可视化技术、UI设计和算法能力进行的综合设计。只有这样,才能帮助客户看懂数据,感知到数据带来的价值。