《智能石油工程.docx》由会员分享,可在线阅读,更多相关《智能石油工程.docx(10页珍藏版)》请在优知文库上搜索。
1、一、引言人工智能(AI)试图模仿人类的决策。被称为机器学习(ML)的Al技术子集使计算机能够通过使用外部数据,学习如何在其编程行为的限制之外采取行动。ML已彻底改变无数行业和研究领域,从股票市场分析到自动驾驶汽车行业,其应用范围极其广泛。随着物联网(IoT)设备和大数据(高速生成大量、不同种类的数据)的出现,ML是确保从大数据中获取可执行信息的最重要技术之一。在石油和天然气行业,模型类型分为三大类:物理模型、数学模型和经验模型。物理模型是对象的按比例缩小或放大版本,开发物理模型是为了简化对物理对象或场景的外观或操作方式的认识。这些模型具有开发成本高、耗时长的缺点,并且在某些情况下可能不够准确。
2、根据实验建立了经验模型,经验模型会出现各种误差,如人为误差和测量误差,并且无法归纳。数学模型对物理定律进行编码,以模拟基础物理学;然而,它们需要许多假设和简化。为了应对这三种模型所面临的挑战、获取信息、,并及时做出明智的决策,需要一种更有前景的技术。这就是ML可以应用之处,一是因为该技术能够从庞大数据集中获取信息并对该信息采取行动,而这些信息永远无法通过纯编程程序进行处理;二是因为数据与从数据中获取的信息之间的关系非常复杂。石油和天然气行业正在迅速向油田数字化转型,人们越来越倾向于将数据驱动建模和ML算法应用于应对各种石油工程挑战。数据驱动建模使用从数据分析中导出的数学方程,而不是知识驱动建模
3、。在知识驱动建模中,逻辑是用于表示理论的主要工具。虽然可能有不从数据中学习的数据驱动算法(因此不能称为MD,但ML是数据驱动方法的一个子集,该方法展示了Al的一种形式。图1总结了不同类型的ML算法。图1不同类型的ML算法。DBSCAN:基于密度的噪声应用空间聚类;HDBSCAN:基于层次密度的噪声应用空间聚类。ML已广泛应用于石油工业的不同领域,包括地球科学、油藏工程、生产工程和钻井工程。接下来的4节将对ML在这些领域的应用进行批判性的回顾和展望。(一)智能地球科学早在20世纪60年代,地球科学己经开始利用决策树、马尔可夫链和K均值聚类等算法。马尔可夫链已用于沉积学、水文学和测井分析。使用K均
4、值聚类来解释泥沙沉积的周期性。决策树的早期应用可以在经济地质学和透视映射中查到。由于多种因素,包括缺乏计算能力和该领域的不成熟,采用ML未能完全满足最初的期望;因此,Al在20世纪70年代几乎没有得到发展。在20世纪80年代采用递归神经网络(NN)进行地震反褶积,至此,人们对Al的兴趣又重新兴起。ML从知识驱动转变为数据驱动发生在20世纪90年代,当时发表了地球物理中关于NN的首篇综述。综述探索了模式识别,并总结了过去30年来NN的应用,以及地震道编辑和自动测井分析的应用样本。深度学习(DL)和卷积神经网络(CNN)在21世纪10年代得到复兴,当时将小型CNN应用于地震数据以进行盐识别。断层解
5、释、层位选取和岩相分类是CNN在地球科学中的其他应用。应用了生成式对抗网络(GAN),即ML模型,其中两个NN竞争性地协同工作,以在地球科学早期进行更准确的预测,从而对三维(3D)多孔介质进行孔隙尺度建模。GAN还用于地震记录生成和地质统计反演。地震活动是地球科学中的另一个重要领域,ML在其中得到了广泛应用。使用ML算法,根据地面接收器上记录的波形特征,区分深部微地震事件和浅部微地震事件。He等使用ML算法来改进诱发地震事件的风险管理。他们提出的模型是一组简单的闭式表达式,具有透明度高、执行速度快的优点,为操作员提供了最大的成功可能性。采矿、油气田枯竭、废水注入和地热作业等工业活动会诱发地震。
6、在加拿大西部,水力压裂(HF)引发的地震活动受到了公众和学术界的关注。由于强烈耦合的地质力学、地球物理和地质行为带来的复杂性,研究诱发地震活动与HF之间的相关性一直是一项极具挑战性的工作。因此,ML在地震活动中的应用仍存在很大的探索空间。(二)智能油藏工程ML算法常用于油藏工程的各个领域,特别是在油藏表征和压力、体积和温度(PVT)计算方面。开发了一个双层NN,用于估计油层的泡点压力和地层体积系数。在另一项研究中,采用径向基函数和多层感知器NN来估计地层体积系数、等温压缩性和盐水含盐量。Wang等在组成油藏模拟中使用人工神经网络(ANN)进行相平衡计算,包括相稳定性测试和相分裂计算。将两种方法
7、,即支持向量机(SVM)和模糊逻辑相结合,使用实际测井作为输入,预测渗透率和孔隙度。利用分类算法进行快速准确的岩石分类(即根据相似性将储油岩分为不同类别)。在随机噪声存在的情况下,探索了具有单个隐藏层的ANN的性能,以建立预测低速层厚度的模型。该方法还被用于加拿大阿尔伯塔省北部的一个油田,以构建孔隙度净产层厚度分布图。据该分布图,钻了四口井,油田产量增加了近20%o利用径向基函数NN,使用深度测量和岩心数据的孔隙度作为输入,估算伊拉克共和国南部整个油田的渗透率。Wang等开发了一个集成ML模型(即随机森林算法),以使用结构复杂且高度断裂的海上油田的实际生产和注入数据作为主要输入,预测井位的延时
8、饱和度剖面。通过引入极限学习机(ELM),开发了一个用于预测多个储层参数(即孔隙度、饱和度、岩相和页岩含量)的新框架,这是最先进的ML技术之一。与典型的单层前馈NN方法相比,该方法在不牺牲精度的情况下,需要的计算资源和训练时间更少。(三)智能生产工程生产预测/优化和HF是能源行业中ML日益流行的另外两个领域。生产预测和优化必须考虑许多参数,包括采油工艺、支撑剂类型、井距、处理速度和压裂阶段数。尽管操作参数优化可以节省数百万美元,并显著提高非常规油藏产量,但传统的油藏模拟计算成本高昂,在考虑油藏特征的不同变化的情况下,计算成本会增加。因此,产量预测和优化是Al应用的良好候选领域,如最近开发和分析
9、的用于各种开采工艺(如水和化学剂驱油以及蒸汽注入)的ML算法所示。Dang等利用NN对相对渗透率进行多维插值,以克服混合开采过程中不同参数(即聚合物、表面活性剂和盐度)的影响。使用地质、岩心和测井数据对不同储层中的井进行产量预测,是ML算法广泛用于该领域的应用。利用DeePAR和PrOPhet(时间序列ML算法)作为短期油气井预测递减曲线分析的替代方案。使用NN预测垂直井的井底压力(生产设施设计的关键参数)是ML在该领域的另一个应用。运用长短期记忆(LSTM)模型和特征选择方法预测加拿大DUVemay页岩气井的日产量。通过将模糊逻辑和NN相结合进行地层性能评估,研究了水平井位优化。在过去20年
10、中,HF工作的数量不断增加,产生了大量可用于构建ML预测模型的测量数据。进行了一项使用模糊逻辑聚类分析绘制Utica页岩天然裂缝网络的研究。He等利用Al和模糊逻辑分析,开发了一种优化页岩气储层HF设计的模型。使用SVM开发了一种用于确定粗糙岩石水力开度的新模型。建立了一种数据分析方法,该方法将由声波测井得出的设计参数与压裂后分析得出的设计参数相结合,用于优化压裂处理设计。通过使用生产测井仪数据和沿MarCelIUS页岩储层水平井的深剪切波成像,验证了所获得的压裂优化算法。提出了一种将ML、储层模拟和HF相结合的综合方法,用于优化二叠纪页岩中的井距,并考虑了该大区域每个代表性区域的典型井。应用
11、强化学习算法达到了沿裂隙的均匀支撑剂浓度,从而提高HF生产率;研究人员将降维与迁移学习相结合,以加快学习过程。提出了一种基于升压算法和岭回归组合的模型,用于预测多级压裂完井的累积产油量。对加拿大阿尔伯塔省MOntney地层的74口HF井进行了案例研究,以井间距、岩石力学特性和完井参数作为输入特征,预测5年内的累积产量剖面。利用基于产量、完井和HF数据的深度NN作为输入特征,开发了一个用于预测页岩储层累积天然气产量的代理模型;使用MOntney地层中1239口水平井的现场数据验证了该模型。(四)智能钻探工程考虑钻井作业期间每天都会产生大量的实时数据,钻井工程也从ML的应用中受益匪浅。由于近年来油
12、价不稳定,人们一直在寻求如何在各种价格方案中确保良好的经济性。为了实现这一目标,ML已经变得越来越普遍,以及时缓解钻井挑战。钻井作业优化和卡钻预测是钻井工程中最关键的两个领域,人们经常使用Al进行研究。利用ANN及时识别钻井异常及其相关非生产时间(NPT)。开发了ML模型,用来确定实时报警阈值,以便在钻井作业期间检测流速和泥浆体积数据的异常。该模型有助于早期检测井漏,并最大程度地减少错误报警。Pollock等应用强化学习算法,基于二叠纪和阿巴拉契亚盆地的14口水平井,改进预训练NN。改进后的模型将曲折度和计划轨迹偏差降至最低,误差小于3%。应用ML算法得出不同钻井参数的趋势,用于识别异常事件并
13、提出相应的补救措施。己尝试使用钻压、流速和每分钟转数等钻井特征,将ML算法应用于优化钻速(ROP)0通过对钻速、管道旋转、倾斜角度和流速等各种参数进行监测和研窕,开发了一种ML模型来预测未来的卡钻管柱。一年后,提出了钻井期间的实时风险预测。将ML算法与数据挖掘和自然语言处理(NLP)技术相结合,在极短的时间内调查中东地区两个陆上油田的每日钻井报告(DDR),以便对生产和NPT进行分类,并发现NPT的关键影响因素。二、挑战和机遇ML算法可以非常有效地用来解决三种主要类型的问题:为已了解的问题构建替代模型,以降低计算成本;为需要人为干预和知识分析的问题建立ML模型;为以前无法解决的复杂问题建立ML
14、模型。在环境简单、数据容易获取且决策成本不昂贵的领域,ML能够最快地取得成功。尽管石油工业中使用ML的大多数情况不符合这几类问题中的任何一个,但通过有效运用ML投资长期收益可以提供大量价值,不过需要周密的设计,并与领域专家高度合作。将ML算法应用于石油工程问题需要克服各种挑战。一项挑战是,数据量往往很大(即大量数据),数据种类(即许多不同的数据格式)和真实性(即数据不一致、不准确)繁多,且速度快(即数据流入率高)o石油工业操作设备上安装的井下和地面传感器每天都会产生大量的数据。该行业利用结构化和非结构化数据来跟踪生产、安全和维护。获取石油行业的准确数据通常很困难或不可能,而且可能很昂贵。因此,
15、获取足够数量的高质量数据用于培训和验证ML模型是石油行业面临的普遍挑战,这会导致训练数据出现不确定性和噪声。反过来,这些问题会损害ML模型的通用性和准确性。此外,原始数据通常不适合ML算法,需要进行预处理和清洗。地下不确定性和数据处理时间延误也是重要的考虑因素。此外,此类数据通常存在于各部门的小数据库中,由于保密问题和竞争优势,相应的模型要么没有,要么不向其他人开放。这一问题在学术环境中尤为普遍。此外,模型的可解释性对地球科学很重要,因为知道导致结果的原因与知道结果本身同样重要。或许由于上述挑战,ML在地球科学领域的应用并没有像在许多其他领域那样得到迅速发展。尽管ML是一种很有前途的技术,可以
16、利用大数据发现输入输出关系并得出信息,但ML的性能可能会因数据的高维性而受到影响。这可能导致误导性的相关性以及不切实际和不可靠的聚类。值得注意的是,数据在其初始状态下通常是模棱两可的,因此,需要不同的预处理技术来识别显著特征并使ML模型能够学习系统的行为。存在一个风险,即缺少数据和缺乏系统稳定性可能会将偏差引入ML模型中,使模型难以从数据中提取有益知识。此外,应考虑利用不同来源数据的问题和挑战。与数据相关的隐私、安全和道德也是需要考虑的非常重要的方面。混合建模集成了ML算法与基于物理的方法,可以被认为是缓解上述问题的一种方法。此外,迁移学习是一种相对较新的ML技术,在地球科学领域具有良好前景。其中使用预训练模型作为起点,然后通过考虑自己的训练数据在预训练模型上进行模型训练。三、展望ML的潜力在石油工业油藏模拟和文本挖掘这两个领域尚未得到充分利用。油藏模拟涉及可充分说明物理性质随时间和空间而变化的微分方程(DE),因此有助于描述自然界中的物理现象。科学和工程中有许多问题,