《2024工业大数据应用实践.docx》由会员分享,可在线阅读,更多相关《2024工业大数据应用实践.docx(14页珍藏版)》请在优知文库上搜索。
1、工业大数据应用实践1引言1.1 工业大数据的兴起随着工业进入信息化时代,工业大数据已成为新一轮产业革命的重要动力。工业大数据以工业系统的数据收集、特征分析为基础,对设备、装备的质量、生产效率、用户体验以及产业链进行更有效的优化,并为未来的制造系统搭建无忧的环境L无论是德国提出的“工业40”,还是美国定义的“工业互联网”,大数据在其中都发挥着重要作用。美国IBM公司认为,“工业4.0”是大数据驱动的智能制造I无数据不智能;美国通用电气(GeneralElectric,GE)公司表示,_E业互联网最重要的就是数据分析,未来每一家工业企业也必须是一家软件企业,有了软件必然会有数据。大数据在工业领域的
2、兴起主要由以下因素决定. 设备自动化过程中,控制器产生了大量的数据,然而这些数据蕴藏的信息和价值并没有被充分挖掘。 传感器技术和通信技术的发展使实时数据的获取成本不再高昂。 嵌入式系统、低能耗芯片、处理器、云计算等技术的兴起使设备的运算能力大幅提升,具备了实时处理大数据的能力。 制造流程和商业活动变得越来越复杂,依靠人的经验和分析已经无法满足复杂的管理和协同优化的需求。工业领域中,如果设备数据、运维数据、事件数据、舆论数据、服务数据、公司数据、市场数据和上下游产业链数据等能够在统一的平台管理,大量的数据将会使原本孤立的系统相互连接,使设备之间可以通信和交流,也使生产和服务过程变得更加透明。12
3、工业大数据与互联网大数据的区别大数据正在改变着人们的生活,过去几年,无论是健康、交通、公共安全,还是生活、购物、旅游、娱乐,都已经逐步建立起了大数据分析系统。无论是国家还是企业,对大数据的投入都数以亿计。大数据的应用也从开始的互联网领域走向了金融、医疗、环境以及工业领域,这其中应用最成功的是互联网。互联网以其开放、自治与共享的理念,与社会各个领域的结合,带动了生产和社会的巨大发展和进步5,工业大数据是大数据与智能制造的交叉点,工业大数据是指在工业产品全生命周期的信息化应用中产生的数据,是工业互联网的核心,是工业智能化发展的关键但大教指某干两络曳联和大做拗技木.山穿于工业的设计、工艺、生产.竹理
4、、麒芬等芥个环万.便北砒hi述.卷嘛.ftw.决策.rwMWw)i.与互联网大数据相比,工业大数据具有更强的专业性、关联性、流程性、时序性和解析性等特点,仅仅依靠传统的互联网大数据分析技术已无法满足工业大数据的分析要求印阿桢区别以江因此工业大数据分析并不仅仅依靠算法工具,而是更加注重逻辑清晰的分析流程和与分析流程匹配的专业技术体系。互联网大数据可以从数据端出发看问题,但是工业大数据则应该从价值和功能端思考。也就是说,传统装备企业在进行物联网建设时,如果只是强调数据获取的途径、量级,没有考虑到数据的具体分析和利用以及相应的功能与目标,很可能就会造成许多数据采集回来之后没有用,而一些关键数据反而没
5、有采集的情况。分类工业大数据表1工业大数据与互联网大数据区别互联网大数据依靠统计学工具挖掘属性之间的关系,不注 重属性的具体含义具备成熟的数据挖掘算法;轻属性含义、重价值挖掘,从看似无关的属性 中找出内在价值图像识别、语音识别、语义分析、偏好推荐等数据要求全面样本数据,以圈盖工业过程中各类变化条件,时效性要求高大量样本数据,时效性要求低特征提取注重特征背后的物理意义以及特征之间关联性的机理逻辑分析手段数据建模、分析更加安杂:需要专业领域的算法,不同行业、不同领域的算法差异很大;强调跨学科技术的融合应用领域健康诊断、故障预警、工况识别、市场预测等2需求驱动变革以上海华兴数字科技有限公司(以下简称
6、华兴公司)为例,它是三一集团有限公司(以下简称三一集团)的全资子公司,为三一集团旗下工程机械装备(如挖掘机、旋挖钻机、装载机、履带起重机等)提供控制系统和信息系统。华兴公司从2007年开始机器物联的实践,由于设备控制器终端、硬件、语言学模型(linguisticsmodel,LM)软件平台、组态软件、控制算法以及通信、传输、采集都是自主研发,因此可以将任意所需数据实时上传至大数据平台。目前平台上有20多万台三一集团设备的5OoO多种参数,低频数据上传周期为5min,高频数据上传周期为20ms,另外还有故障数据、维保数据以及相关事件数据等。同时开发出易维讯(E-Vision,EVD系统的网页版与
7、应用(APP)版用于管理这些数据,并通过数据进行故障报警、故障预测、智能服务、辅助研发和信用管理等,很好地支掾了公司的核心竞争力,帮助公司实现了快速增长。华兴公司工业大数据之路发展至今(如图1所示),每一项功能的开发都面向用户的实际需要。2011年2013年2016年至今债务债权2010年:大型装备都是按揭购买,:为保证公司资产安全,1开发债务债权功能,管:理所行债务机、法务机::(1)密码解锁机;:(2)跨区域报警债权服务需要监控机器运行状态,做在数据的积累可对各户提供增值服务:(I)远程标定;(2)故障记录;(3)提供机器运行报告场内试舱具有局果性,对各机型的历史数据进行分析,可了解设备金
8、生命周期的运行情况,提升三集团产品的可靠性由数据库升级成公平台;上传数据由分钟级升级为秒级C通过时数据的深入比掘,实现故障预警和健康诊断产品定义通过三一集团各装备的I:时、开工率、油髭等数据定义“三一”指数;2014年开始每月定期向政府机构汇报性能验证竺!匕艺”笠ra易维讯系统大,ftII(习实配用值品计作制四健康诊断O手机APP图1华兴公司工业大数据发展历程从满足用户的需求到通过数据为公司、用户创造价值,华兴公司的工业大数据经历了如下3个阶段。1)集中显示阶段工程机械的销售特点与其他商品不同,大部分都是贷款购买,按月还款。如果某台车不能按时还款,公司需要及时对其进行法务处理,因此需要知道每台
9、贷款车的地理位置。基于这样的原因,华兴公司2007年开始为三一集团每台在外运行的设备安装全球定位系统(globalpositioningsystem,GPS)模块,并通过控制器将数据实时上传,记录位置信息的同时,也将机器运行的信息上传到服务器。随着数据慢慢积累得越来越多,为了展示数据的统计结果,华兴公司2011年开始筹备开发易维讯系统。从开始面向公司内部提供机型分布、开工率、解锁机统计等定期的报表,到后期面向客户提供工时、油耗、周报、月报等功能,功能越来越全面,不仅为领导决策提供了支持,还提升了用户的设备使用体验。统计分析阶段易维讯系统的成功应用使公司重视了数据带来的潜在价值。三一集团的设备遍
10、布全国,设备的运行状态某种程度即可反映国家基础设施建设以及宏观经济的情况。因此将易维讯系统中的数据进行整理,提出了“三一”指数的概念,2014年开始每月定期向政府机构提供该数据。数据积累之前,公司对产品的定义和验证都基于有限样本进行,有了大量的数据以后,所有已售出的三一集团机器都可作为试验机,验证实际运行过程中其性能是否达到了设计要求。对于新产品的开发,也可以第一时间通过分析前期产品的使用情况,从数据中提炼出下一代产品定义的相关指标。3)智能服务阶段随着云计算、大数据技术的逐步发展,华兴公司从2016年开始升级了服务器,将原本的物理服务器全部转移至云上,通过数据中心操作系统(datacente
11、roperatingsystem,DCOS)统一管理,并将原来数据存储的最快间隔时间由分钟级提升至亳秒级,根据不同的需求,对数据进行分级存储。通过这些技术以及一些成熟数据挖掘算法的使用,使数据产生了更大的价值,华兴公司开发出工况识别、操作手识别、故障预测、故障诊断、市场预测、配件预测等功能,为公司的决策和用户操作体验的提升提供了重要支持。3工业大数据平台华兴公司的工业大数据平台建立在公司核心产品控制系统和信息系统的基础上,将运行设备(如挖掘机、风机、起重机、旋挖钻机等)互联,同时使企业数据(如生产数据、客户相关数据、产品生命周期数据等)与运行数据互通,通过3个平台(计算平台、业务平台与可视化平
12、台)对数据进行存储、分析与展示,最终面向主机厂、用户、二手机市场、配件市场等提供全方位的增值服务。平台整体架构如I物f示。与市场上通用的平台即服务(platfobnasaservice,PaaS)平台相比,华兴公司工业大数据平台是面向工业装备的专业化平台,数据从设备端采集上来,经过网关、存储、计算到客户端的应用展示,全程都是可定制化的,满足了不同种类设备的需求。3.1 数据采集数据采集部分采用LM自主组态软件与不同频次数据的分级处理。计算平台数据采集Sparl?计算引擎数据网关消息队列流水线处理MvSQLDCOS管理0业务服四业务平台可视化平台图2工业大数据平台架构远程控制终端由控制器和显示屏
13、组成,是数据采集的核心部分,分布在每个工程机械设备上,负责接收来自GPS的卫星定位信息,并计算出工程机械装备的位置、速度、方向等信息。数据通过Wi-Fi/通用分组无线服务(generalpacketradioservice,GPRS)通信网络传送至数据网关,通过消息队列进行流水化处理后,进入计算平台。设备的核心控制程序由华兴公司自主开发的组态软件LM编写,因此除了GPS数据外,其他机器运行的数据(如通过控制器局域网络(controllerareanetwork,CAN)总线采集的发动机相关数据、控制器采集的设备传感器数据以及机器运行中的一些过程数据)都可以实时上传。针对振动等高频数据,在程序中
14、提取高频信息的特征值,转为低频后再上传;针对故障数据,底层软件记录故障前后1min的高频数据,打包后在非工作时段上传;针对设备运行数据(如主压、转速、排量等),采用秒级上传:针对设备的定位等低频数据(如位置、工时),则每15min上传一次,节省云平台的存储量。3.2 计算平台计算平台负责数据的快速存取和业务计算,由通信网关、消息队列、数据库、计算引擎等构成,软件栈如I能所示。为了满足10万级台量每秒钟数据的实时接入需求,系统根据通信流量对通信网关进行水平伸缩,数据通过Kafka消息队列进行缓冲,再写入NoSQL数据库Cassandrao数据库包括工程机械装备详细的装备属性、工况信息、报警信息、
15、故障信息、保养信息、维修信息、位置信息、处理后的音频/视频信息等。计算平台使用高性能的APaCheSpark作为计算引擎。原始数据通过SPark进行数据清洗,统计报表、故障预测、节能提示等业务需求则通过SParkSQL与SPark机器学习库(MLlib)进行计算,并将计算结果写入MongoDB,供可视化平台呈现。平台运维采用MeSoSPhere公司的数据中心操作系统(datacentreoperation业务应用LTableauDashboard业务管理大数据基础架构平R通用应用I进程管理II资源饯理II数据处理服务IMLIibIIPySParklStreSiingI用户/理I日忐省理I数据层1ICaSSandraMongODBIMySQL基做架构部件NATIKafka-Elk-AngUlarSPringBOOl底层和容器管理ApacheMesos1.inux、JVM、Dockcr图3计算平台软件栈system,DC/0S)进行管理。传统数据中心采用服务器和虚拟机的模型,