随着大数据时代的到来,数据挖掘算法被广泛使用,其优势可概括为:识别数据中的隐藏模式;捕获复杂的非线性关系;自动学习模型;无需定义完整的输入和输出变量之间基于物理的数学关系。在勘探地球物理学中,岩石物理响应多解性使地球物理数据与地质分类间存在复杂的非线性关系。例如,深层碳酸盐岩缝洞型储层由于岩性多变、易发生的成岩作用和随机裂缝,导致存在较强非均质性。此时,单一属性的地球物理数据难以准确识别储层,需通过结合地质-地球物理的手段进行研究,方法是处理复杂数据问题的工具,有利于解决该类问题。然而,岩性识别是一个多元分类问题,现在的算法大多针对二元分类问题而开发,且每种算法存在固有局限性,因此,将多元分类转化为二元分类并非易事。
针对上述问题,中国科学院地质与地球物理研究所硕士郑文浩及其导师、高级工程师田飞和研究员底青云等以塔河油田为例,利用深层碳酸盐岩缝洞型储层的常规测井信息,结合岩心和电成像测井(fmi)资料,应用主成分分析(pca)、k-means、线性判别分析(lda)3种算法进行测井相综合预测。
具体方法是:(1)数据预处理,采用箱形图去除异常数据及深度不匹配的数据,进行z-score标准化处理;(2)通过pca对测井参数降维,将7维数据转化成2个互相独立的变量,简化数据结构(图1a、图1b)。然而,一次pca处理后,各种测井相数据点之间仍存在较多重叠。为进一步简化数据结构,研究人员将洞穴数据点和非洞穴数据点做二次pca处理(图1c、图1d);(3)对得到的数据集进行k-means聚类(图2),根据测井相的种类及复杂程度选择合适的k值,并以岩心约束下的fmi图像,确定测井相的标签,实现结合地球物理数据的半定量解释与地质信息的定性解释,从而建立测井相-岩相数据库(图3),在测井相-岩相图版标定每个测井相的区域范围;(4)为实现测井相的自动化定量预测,使用lda算法获得6种测井相的判别函数,将某一深度点测量的测井信息代入上述判别函数,函数值最大者作为该点的测井相类型归属(图4)。该测井相预测模型的正确率达到92%,并且能够快速获得测井相预测结果,有利于提高勘探效率、节约勘探成本。
该研究的底层逻辑是运用地质信息约束多属性的地球物理响应,并通过算法对多参数的地球物理数据进行数据挖掘,以实现利用地球物理数据自动预测地质信息的效果。目前,研究人员正在探索一条结合地质-地球物理-数据分析的综合凯发天生赢家一触即发官网的解决方案。相关研究成果以electrofacies classification of deeply buried carbonate strata using machine learning methods: a case study on ordovician paleokarst reservoirs in tarim basin为题,发表在marine and petroleum geology(mpg)上。
图1.pc1-pc2交会图。(a)pc1-pc2交会图中的初始数据点;(b)在pc1-pc2相交图中,基于fmi图像的粗略识别,数据点可分为两类:非洞穴数据点和洞穴数据点。非洞穴数据点的线性相关线的系数为-0.697,洞穴数据点的线性相关线的系数为1.874;(c)在pc1(非洞穴)-pc2(非洞穴)交会图中,非洞穴数据点的线性相关线斜率为0;(d)在pc1(洞穴)-pc2(洞穴)交会图中,洞穴数据点的线性相关线斜率为0
图2.数据经过k-means处理,通过fmi图像进行标定每类数据点的测井相。(a)k-means将非洞穴数据划分为16类;(b)k-means将洞穴数据点划分为8类;(c)第14类非洞穴数据点标定为裂缝相;(d)第37类洞穴数据点标定为洞穴(未充填)相
图3.测井相-岩相图版。(a)非洞穴数据点的测井相-岩相图版;(b)洞穴数据点的测井相-岩相图版
图4.应用测井相预测模型预测s75井的测井相,通过fmi图像验证预测结果
上一篇:南海海洋所等揭示印度洋亚南极模态水体积减少的物理机制
下一篇: