什么是数学地球科学及其前沿领域
成秋明
中国地质大学地质过程与矿产资源国家重点实验室
中国地质大学(北京)地球科学与资源学院
导读:什么是数学地球科学?与数学地质学的关系?业界的理解还常有偏差!决不能理解为地质学的分支学科,它是一门自然科学与地球科学的交叉学科,与地球化学、地球物理学等概念平行,成秋明院士在文中给出了科学定义,并详细介绍了这门学科的主要贡献、科学进展、学科前缘等内容。在覆盖区找矿预测方面已取得了突破成果。目前数学地球科学发展十分迅猛,定量研究地球复杂性和大数据、深度机器学习与复杂人工智能等前沿领域十分火热。地学人已在不知不觉中学习和应用这门新型学科的知识,特推荐地学人阅读本文。
内容提纲
1 什么是数学地球科学?
2 数学地球科学对地球科学的发展的重要贡献
2.1 地球几何性质与数学模型
2.2 地质统计学和多元统计分析
2.3 板块构造理论和地球动力学数学模型
2.4 矿物结晶体系
2.5 沉积学-沉积物粒度分类数学指标
2.6 地理信息系统的基础:拓扑数据模型
2.7 地球化学元素分布基本定律
2.8 矿产资源与能源定量预测与评价
3 数学地球科学前缘
3.1 定量研究地球复杂性:新的学科增长点
3.2 大数据、深度机器学习与复杂人工智能
4 数学地球科学的科普与教育
5 结论
摘要:数学地质或者数学地球科学作为一门自然科学与地球科学的交叉学科,长期以来缺乏统一的学科定义,导致了学界对该门学科的理解常常出现偏差,甚至常常不把其作为一门独立学科,一定程度上影响了学科的发展。笔者曾任国际数学地球科学学会的执行主席、副主席、主席十余年,见证和领导了国际数学地球科学学会从数学地质向数学地球科学的转变,以及学会相关的杂志、会议等名称和内容的更新。期间于2014年在学会年度报告中提出了数学地球科学的新定义和学科内涵,2018年在庆祝学会50周年的数学地球科学手册中详细论述了数学地球科学学科的定义、内涵、贡献和前缘等。本文将在以上数学地球科学新的学科体系框架下探讨数学地球科学的主要贡献、科学进展、学科前缘和科普教育。在回顾学科发展历史的基础上分析了数学地球科学与数学地质学的差异,介绍了数学地球科学在大地测量和地球物理学、板块构造理论、地球化学、沉积学、地理信息系统、矿产资源和能源预测等领域的重要贡献。从国际地球科学前缘方向分析了数学地球科学的学科前缘,介绍了定量研究地球复杂性、大数据-深度机器学习与复杂人工智能等新的学科增长点。回答诸如什么是数学地球科学?数学地球科学家对地球科学的贡献?数学地球科学是否处在地学前缘等问题。关键词:数学地球科学;数学地质;交叉学科;学科增长点;基础科学问题;地球科学前缘
0 引言
1968年成立的国际数学地球科学学会(InternationalAssociation for Mathematical Geosciences,IAMG)是该领域国际上目前唯一的专业学会。在IAMG的推动下,学科经过半个多世纪的发展,已变得逐渐成熟。学会也经历了从数学地质向更广泛的数学地球科学的提升。IAMG是在第23届国际地质大会(IGC)召开期间成立的,并隶属于国际地质科学联合会(IUGS)和国际统计学联盟(ISI)。当时对学会名称的选定也有不同的意见,除数学地质(Mathematical Geology)以外,还有地球数学(Geomathematics),甚至有人建议就叫地质统计学(Geostatistics)。最后选择了数学地质作为学会的正式名称,这也是第一任学会主席苏联AndreiVistelms教授当时所推荐的名称。不过仍有数学地质著作和丛书名称用了其他名称,比如加拿大地调局FritsAgterberg教授于1974年出版和2014再版的著作所用的名称就为地球数学(Geomathematics)。狭义的数学地质是地质学的分支,有的基金会也把数学地质专业作为地质学的分支学科。学会成立初期的相当一段时间里,学会的主要研究方向主要集中在数学和统计学在地质中的应用,因此,有的学者就直接将“数学和统计学在地质中的应用”作为数学地质的学科定义。当然,这里的地质可以理解为泛指地质领域而非狭义的地质学,这样可以理解为数学在地质领域的应用。随着数学地质理论和方法与软件技术的不断发展,数学地质方法的应用不再局限于在地质领域,在其他领域诸如水文学、地球物理学和地球化学等领域也得到广泛应用。为了使学会的名称能更好地反映学科的完整内涵和应用领域,在2008年挪威首都Oslo召开的第33届IGC大会上,经IAMG全委会无记名投票,学会名称变更为'InternationalAssociation for Mathematical Geosciences”,其缩写还是IAMG。当年给出的备选名称是“International Association for MathematicalGeosciencesand Geoinformatics''。对备选名称持不同意见的会员认为Geoinormatics本身应该属于Geosciences,因此,不建议采用重复性名称。按照多数委员的意见学会将名称确定为前者。当时,笔者当选为IAMG执行副主席。由于当选主席西班牙Vera Pawlowsky-Glahn教授因病未能出席执委会换届活动并主持学会工作,按章程由执行副主席代理主席负责学会工作。因此,笔者担任代理主席几个月,负责组织了包括学会换届活动和章程修订、学会名称修改和之后学会主办的《数学地质》期刊改名为《数学地球科学》等事宜。此后,IAMG会议论文和MathematicalGeosciences(数学地球科学)Computers &.Geosciences(计算机与地球科学)、NaturalResources Research(自然资源研究)三大IAMG学术期刊开始组织发表更多的数学地球科学主题的成果。学会名称的变化为扩大和拓展学会的应用领域,特别是在地球物理和地球化学等领域中的应用发挥了重要作用。笔者2012—2016年期间担任IAMG主席,积极推动了IAMG的国际交流与合作,期间IAMG与国际大地测量和地球物理联盟(IUGG)建立了隶属关系,成了IUGG的隶属学会会员。这样,IAMG所隶属的国际联盟就扩展为国际地质科学联盟(IUGS)、国际统计学联盟(ISI)、国际大地测量与地球物理学联盟(IUGG)。这三个国际联盟均隶属于国际科学理事会(ISC),涵盖了地球科学和数学与统计学的大部分学科,一定程度扩大了IAMG的国际影响和可见度,IAMG真正成了地球科学而非仅仅是地质学的学科分支
。与此同时,笔者也积极推动中国科学家参与IAMG活动,包括学会名称的修改和章程修订等,也逐渐将学会的名称介绍到国内,比如2009年在广州中山大学召开了全国数学地球科学学术会议,这可能是第一次以数学地球科学为主题在国内召开会议。之后大约每两年由IAMG中国委员会主持召开一次全国性数学地球科学学术会议。当然,数学地球科学的名称被国内陆学领域接受的过程还是较慢的,人们还是习惯于称数学地质。不过这里“地质”含义应该是地球科学(geosciences或者geological sciences),就像中国地质大学的中文名称用了“地质”但英文名称为China Universityof Geosciences,这里的地质指的是地球科学或者地质科学,是复数。应该看到的是,数学地球科学(MathematicalGeosciences或者Geomathematics)作为一门相对年轻的学科,仍然没有被主流地学广泛接受和关注,甚至常常被忽视或称之为“装饰性”学科,一方面是由于参与的人员少、体量小、影响弱;另一方面可能是因为学科缺乏明确的定义和内涵边界,尤其是与其他相关学科(比如地球物理学)的学科界限不明确,导致许多数学地球科学家被归为大地测量学家、地球物理学家、地球化学家等。他们的科研成果和学术贡献也不被归属为数学地球科学。比如在本文后面还要介绍的一位国际著名科学家英国剑桥大学Dan McKenzie教授,他是位物理学家和数学家,20世纪50—60年代他将数学热力学与地球动力学结合,系统地建立了板块热结构模型和地幔动力学模型,对板块构造理论创立所做的开拓性和奠基性工作,得到了地学界的广泛认可和尊重,被誉为板块理论的四大贡献者之一。但McKenzie先生的工作往往被归为地球物理和大地构造学范畴,他也被称为地球物理学家。虽然文献中也提出过几种关于数学地球科学学科的描述性定义和术语,但还缺乏比较系统的包容性强的标准学科定义。例如,数学地球科学通常被简单地称为“数学和统计方法在地质(地球科学)中的应用,或者在地学数据分析和定量预测模型开发中的应用。IAMG网站上也一度将IAMG的使命定义为:促进地球科学中数学、统计学和信息学的发展和应用。将数学地球科学(MG)作为一门正规的分支学科,还是仅仅作为数学在地球科学中的应用工具,这是一个基本问题,它对学科的发展具有至关重要的影响。为此,我在担任IAMG主席期间,尝试给出了数学地球科学的新定义,也与时任IAMG执委会的委员们进行了咨询和讨论,得到了大家的认可,发表在IAMG通讯(Neuisletter)的主席报告栏目里(第76~79期)(可见学会网站www.iamg.org),并在2018年庆祝学会50周年的数学地球科学手册中详细论述了数学地球科学学科的定义、内涵、贡献和前缘等。本文将在以上数学地球科学新的学科体系框架下详细探讨数学地球科学的主要贡献、科学进展、学科前缘和科普教育。1 什么是数学地球科学?
前面已经谈到了,Vistelius给出了数学地质学较早的学科定义,并作为国际学会的名称使用。地质统计学是由IAMG领域学者提出并广泛应用的一个数学地质学科新方向,也一度被称为统计方法在地质或者其他地学领域中的应用,这个简单的定义似乎仍在使用。地球数学(geomathematics)一词也被许多作者使用。2008年IAMG学会将其名称从数学地质更改为数学地球科学,之后,数学地球科学一词就常出现在IAMG的通讯文件、会议名称及其三大期刊中。关注数学地质学和数学地球科学之间的区别不应该仅局限在术语上,还要从学科内涵和内容上理解。数学地球科学应该是地球科学的一个交叉学科分支,并应与地球科学中其他交叉学科,如,地球化学、地球物理学和地球生物学等概念平行(图1),它包含数学地质学。在笔者个人看来,这种学科体系的区分对于学科的发展至关重要,比如,在数学地质学的概念下,该学科仅限于数学在地质学中的应用,但作为数学地球科学,就像地球化学和地球物理学一样,它服务于整个地球科学。那么,数学地球科学或地球数学的定义应该是什么?数学地球科学在地球科学体系中应该扮演什么角色?数学地球科学家为地球科学的发展做出了哪些重大贡献?当今数学地球科学的学科前缘是什么?未来数学地球科学的发展,特别是在大数据-机器学习-人工智能快速发展的背景下数学地球科学将如何发展?这些问题都是数学地球科学家应该感兴趣和必须回答的问题,尤其是地球科学专业学生和青年研究人员需要了解的。结合笔者这些年在数学地球科学领域和担任国际地科联(IUGS)主席期间的一些思考与大家共享,希望开展有助于科学发展的更多学术讨论。图1 数学地球科学是自然科学与地球科学融合形成交叉学科,采用数学、计算机和数据解决地球科学问题为了给出数学地球科学的定义,我们不妨先了解其他相关交叉学科的情况,比如地球化学、地球物理学和地球生物学等。√ Geophysics as a science of “thestudy of the earth’s physical properties and of the physical processes actingupon,above,and within the earth.”(Collins English Dictionary).√ Geochemistry as a science that deals with the chemical compositionof and chemical changes in he solid matter of the earth or a celestial body(Merriam-Webster Dictionary).√ Biogeosciences as an interdisciplinary field of studyin~tegrating geoscience and biological science:thestudy of the interaction of biological and geological proceses (Meriam-WebsterDictionary).可以看出,以上柯林斯和韦氏英语词典关于地球物理学的定义是:“地球物理学是作为研究地球的物理特性和作用于地球内部和之上的物理过程的一门科学。”类似的,地球化学可定义为:“地球化学是研究地球的化学组成、化学性质和化学变化的一门科学。”地球生物学可定义为:“地球生物学是研究地质过程与生物过程相互作用的一门地球科学和生物学交叉的科学。”以上关于地球科学与其他自然科学交叉学科的定义具有跨学科的通用性。类似的,我们可以将数学地球科学定义为:“作为融合数学、计算机科学与地球科学的交叉科学,它是研究地球(及其他星球)的数学特征和过程以及对其资源和环境进行预测和评估的交叉科学”。以上这些定义的关键词是地球的“性质和过程”。地球的化学性质和物理性质以及化学过程、物理过程、生物过程是比较容易理解的,因此,对地球化学、地球物理、地球生物学的定义也是容易接受的。但什么是地球的数学特征、数学性质和数学过程?以及为什么对地球资源和环境的预测和评估与数学有内在联系?这是数学地球科学能否成为独立的交叉学科而有别于其他相关学科的关键。那么,我们先来看看数学、物理和化学学科之间的差异性。大家在中小学就开始学习这些基础性自然课程。化学主要在分子、原子等微观层面研究物质的组成、性质、结构与变化规律;物理主要研究物质的物理性质和过程,包括物质最一般的运动规律和基本结构;数学可以理解为主要研究数量、结构、变化、空间以及信息等概念。这些基础学科与地球科学结合就形成了地球化学、地球物理、数学地球科学等。相应的多个化学分支学科与地球科学结合形成了众多的地球化学学科方向,如常量元素地球化学、微量元素地球化学、稳定同位素地球化学、同位素年代学等。化学领域所发展的各种测试分析技术,如质谱分析、荧光分析、激光剥离分析技术等均拓展应用到地球化学研究领域,为地球科学提供了新的分析测试技术支撑。同样,物理学的各个分支学科与地球科学结合形成了多个地球物理方向,如重、磁、电、震、放射性、超导等地球物理学科方向,相应的各种物理探测和模拟测量技术,如重力测量、核磁共振、磁测、地震测量、电法测量等均被开发和应用到地球物理研究中。类似的,数学也有各种学科分支,如几何、微积分、能谱分析、形态学、拓扑学、概率和数理统计、模糊数学等。这些数学分支为定量研究地球提供了不可或缺的理论和方法。地球的数学特征和数学性质可包括但不限于地球的几何学特征、动力学特征、地球观察和测量的不确定性、地质事件的预测误差等。这些关于地球的数学性质以及相关的重要科学问题离开了数学就无法进行定量研究。因此,数学的多个分支与地球科学结合就会产生不同的数学地球科学研究方向,比如统计学与地球科学结合产生了地质统计学,分析数学(微积分)与地球科学结合产生了数学地球动力学,几何学用于地球科学研究解决各种地球几何问题如地球形状、坐标、角度、长度、体积、数量、距离、方向等,这样的例子可以举出很多。下一节中我会专门介绍一些在地球科学研究中发挥了重要作用的数学地球科学研究实例。虽然不可能完整地给出所有数学地球科学的问题,还有大量的实例不能一一列举,但举例的主要目的是为了说明数学地球科学不仅在地球科学的发展过程中做出了巨大贡献,在未来地球科学的创新变革中还将继续发挥不可取代的重要作用。2 数学地球科学对地球科学的发展的重要贡献
有许多实例表明,数学地球科学和数学地球科学家们对现代地球科学的发展做出了不可或缺的基础性贡献。这里简要介绍几方面的实例。2.1 地球几何性质与数学模型
地球的几何性质既是地球的重要要素,也是定量研究地球的重要基础。地球形状的数学模型,比如克拉克椭球(Clar kellipsoid)和海福德椭球(Hay-ford ellipsoid)被用作大地测量学,是大地基准面的基础模型,也是当今空间定位和导航系统(例如GPS,北斗系统等)、遥感技术(RS)、空间测量和空间分析的基础。地球的形状是复杂的,但是为了能够建立地球空间坐标系,需要采用数学模型近似表达地球的形状,这就是地球椭球(Ellipsoid或者Spheroid)(图2)。图2 地球几何形状的数学模型—椭球地球
椭球在笛卡儿坐标系中的数学方程是:
式中a和b是沿着x和y轴的赤道半径,c是沿着——轴的极半径。这3个参数决定了椭球的形状,包括地球的椭圆扁度或者扁度率。这里我不必介绍太多关于椭球和大地水准面(geoid)的关系,只想说明地球形状的确是地球的数学特征。最早建立地球椭球模型并命名大地测量学(geodesy)的是英国学者克拉克(Alexander Ross Clarke,1828—1914)。他是位国际著名的数学家和大地测量学家(mathe-maticianand geodesist)。他的重要贡献除了建立了地球椭球概念和模型外,还包括实现了英国大地基准三角网的计算(1858)、地球形状的计算(1858—1880)以及出版了有重要影响的大地测量专著(1880)。2.2 地质统计学和多元统计分析
地质统计学是统计学与地球科学融合而形成的一门新的统计学和数学地球科学分支。它是由数学地球科学家们根据地质问题提出,并建立了其完善的理论体系的一门学科。最初是由南非矿业工程师克里格(Dame Krige)在其硕士论文中提出了基于高斯模型插值方法预测矿石品位概率分布和储量计算。之后法国数学家和矿山土木工程专家马特伦(Georges Matheron)将克里格方法命名为Kriging,并建立了地质统计学理论体系。从此,Kriging作为一种线性无偏估计的最优空间插值方法,在地球科学的各个领域得到广泛应用,形成了数学地球科学领域颇具特色的分支学科。近些年来人们注意到,虽然地质统计学方法应用越来越广,但其插值的光滑效应也常常被诟病。随着计算机算力的不断提升和地学数据量的快速增长,地质统计学也得到了快速发展。比如,基于高阶矩统计量的高阶地质统计学,它克服了基于半变异函数(二阶矩统计量)为基础的传统Kriging对数据的光滑效应,能够较细致地刻画空间数据的局部变化性。另一重要进展是多点地质统计学的发展(multiple-point statistics,MPS)。MPS采用训练图像取代半变异函数,无需数据满足高斯分布,可根据图像结构建立统计模型并进行预测。但是,由于要求数据具有二阶平稳性等苛刻条件限制,传统的类似Kriging的地质统计学方法不能处理带有“奇异性”的时空数据,笔者提出了多重分形地质统计学的拓展途径,将局部奇异性指数引入滑动加权平均模型,实现了对不具备平稳性而带有奇异性数据的地质统计学模拟和预测 (图3)。图3 多重分形插值
(A)—deWijs'的玻利维亚铅锌矿剖面Zn元素含量;(B)—局部奇异性分析方法(LSA)计算的Zn元素的局部奇异性指数;(C)—多重分形Kriging插值结果(黄色拟合线)与传统滑动平均的结果(红色拟合线)对比,蓝色点为实际测量结果。2.3 板块构造理论和地球动力学数学模型
20世纪60年代提出的地球板块构造理论成为推动固体地球科学发展的一场深刻革命,深刻地解释了资源能源、地震和火山、岩浆与造山等重大地质事件的形成和分布规律,全面革新了固体地球的全球观,促进了地球系统概念的形成与发展,被誉为20世纪科学领域3个重大突破之一。半个世纪以来在地质学、地球物理、海洋学、地球化学、地层古生物、地理学、数学动力学等多学科成果基础上,在天-空-地-地球物理与遥感探测、钻探、测试分析、数值模拟等技术的支持下,板块构造理论得到了进一步的发展和完善。在公认的对现代板块理论做出奠基性贡献的先驱中就包括前面提到的英国剑桥大学的Dan Mckenzie教授、美国普林斯顿大学的Jason Morgan教授、法国的XavierLe Pichon教授、加拿大多伦多大学Tuzo Wilson教授等。其中,英国剑桥大学的Dan Mckenzie是位物理学家和数学家,他早年曾拿到数学的奖学金入读了自然科学专业,系统研读了数学、物理、化学以及地质学,23岁便博士毕业。他将数学和物理创造性地应用到地球科学,取得了公认的卓越成绩。以下简要介绍他的几方面工作。2.3.1 板块构造的数学原理
Mckenzie的最有影响的成果之一是他和Bob Parker合作发表的采用瑞士数学家和物理学家欧拉(Leonhard Euler)1775年证明的欧拉旋转定理(Euler's rotation theorem)研究刚性板块的成果。他们采用欧拉旋转定理证明刚性板块的3种边界洋中脊、俯冲带和转换断层的共轭关系。欧拉旋转定理表明,刚性体(如板块)在三维空间中发生位移其内部至少有一点固定不动,刚性体的位移等价于绕着包含该固定点的固定轴的旋转(图4)。这一成果被同行誉为板块构造在球体上运动的数学原理是板块构造理论最理论化的工作。图4(A)刚性体在球面旋转可由Euler轴和角度来表示;(B)Enler向量定理解释洋中脊、俯冲带、转换断层的共轭关系口门;(C)太平洋板块与北美板块俯冲区域的洋中脊、俯冲带、转换断层的共轭关系
McKenzie的另一项具有重要影响的成果是关于洋中脊热通量和重力异常的研究成果。该模型修改了由美国学者Harry Hess(1906—1969)所建立的海底扩张模型,建立了洋中脊热扩散模型和地幔对流数学模型,奠定了该领域长期以来一系列创新研究成果的基础。McKenzie和后来许多作者基于板块热扩散模型建立了盆地形成模型、板片热结构模型、俯冲板片模型等。McKenze的原始建模思想将介于洋中脊裂解和洋陆俯冲之间的板块看成边界规则的刚形体,板块扩张速度(V)和厚度(a)均匀,板块(岩石圈)底部温度(T0)和顶部温度(T0)为已知边界条件。板块热通量可以由以下扩散方程表示:式中:ρ为岩石圈质量密度;T为温度Cp为比热容;t为时间,;k为热扩散系数,z为深度(模型参数和边界条件见图5)。图5A给出了McKenzie建立的洋中脊热扩散模型与边界和初始条件,图5B显示该模型的理论结果与实际测量结果存在较大差别。许多作者认为该理论曲线和实际测量结果的差异是由于洋中脊附近(比如小于55Ma的年轻洋壳)热液对流导致热量损失的结果。进而,有作者以此计算了洋中脊热损耗的总量。笔者从洋中脊岩石圈结构复杂性和分形结构出发,采用由作者提出的“分形密度”指数取代了McKenze模型中的岩石圈密度指数(r),重新构建了扩散模型,得到的理论结果显著改善了与实际测量结果的拟合度(图5C),而且,表明新老洋壳范围热扩散机制没有本质变化,热能损耗的原理也需重新审定。笔者近年来的一系列研究表明,诸如基于规则边界条件和均匀介质参数的数学动力学模型,如热扩散这类模型,对于平稳的、渐变的、线性和简单非线性的地质过程是有效的,但难以用于突变的、非线性、复杂性、奇异性地质过程和地质事件的定量模拟和预测。对如后者具有不规则边界和复杂介质(如分形边界和分形介质)的地质过程需要引入分形密度和奇异性原理和方法。图5 McKenze建立的洋中脊热流扩散模型
(A)—模型参数、初始条件、边界条件;(B)—McKenze模型的理论结果与实际测量存在显著差距,反映洋中脊由于热流对流可能损失热流;(C)—成秋明采用他提出的分形密度取代了McKenze模型中的岩石圈密度,显著改善了理论结果与实际测量结果的拟合度(黑线)。
2.4 矿物结晶体系
矿物学(mineralogy)是地质科学的一门重要基础学科。矿物化学成分和晶体结构决定了矿物的基本物理和化学性质。结晶学(crystallography)是研究矿物的原子排列的晶体结构,是矿物学的核心和基础。微观原子层面上,矿物晶体结构可以表示为晶格。晶格是晶体在分子层面的最小单元,通过晶格的规则排列而形成晶体。因此,晶格的几何形状和数学性质是决定矿物性质和矿物分类的重要要素。数学在研究晶格中发挥了不可取代的作用。由于结晶学领域科学家们的贡献也使结晶学成为一门新的数学分支。在结晶学研究领域,不乏国际顶级的科学家和数学家的工作。这里举几个实际例子:德国矿物学家、物理学家和数学家维斯(ChristianSamuel Weiss,1780—1856)是现代结晶学的重要贡献者,他建立了结晶体系(crystalsystems)和依据晶格轴(crystallographic axes)进行晶系分类方案(图6)。他所建立的魏斯晶面指数或后来被称为米勒晶面指数(Weiss indices or Miller indices)以及晶面指数之间的数学代数关系(图6)被称为晶带定律(Weiss'szonelaw),也是一直沿用至今的结晶参数计算方法。图6 矿物结晶学体系
(A)—晶体对称性(symmetry);(B)—晶体体系(crystal systems) ; (C)—魏斯晶面指数或者米勒晶面指数(Weiss indices or Millerindices)。
另一位不能不提的科学家是法国的物理学家和统计学家布拉维(Auguste Bravais)(1811—1863)。他不仅是位伟大的物理学家,也称得上杰出的统计学家。布拉维系统地学习了数学和统计学,1840年起给自然科学学院的天文系学生讲授应用数学课程。布拉维于1844发表了统计相关性概念的论文,他定义了后来被称之为著名的皮尔森相关系数(Karl Pearsoncorrelaton coefcent)。皮尔森相关系数至今仍然是自然科学和社会科学以及经济学中最常用的度量相关性的统计方法。布拉维还专门研究了观测误差理论,并于1946年发表了误差概率数学分析的研究成果。当然,布拉维最有名的学术贡献还是关于结晶学方面的工作,特别是1848所建立的晶格体系(图6)。他从数学上证明了只有14种独立的不同空间格子类型,之后被称为布拉维晶格(Bravais lattices)。此外他还创建了六方系晶体和三方系晶体的定向方向,被后人称之为布拉维定向,相应的晶面指数被称为布拉维-米勒指数(Bravais-Miller Indices)。矿物的物理化学性质除了取决于其化学组成外,晶体结构也是重要的制约因素。晶体的对称性(symmetry)不仅是晶格的基本几何特性,也是影响矿物光学性质等物理化学性质的重要属性。欲使对称图形的相同部分重复,必须通过一定对称操作或者对称运算(symmetry operation)来实现。晶体对称性包括3种类型:对称面(symmetryplane)、轴对称(symmetry axis)和中心对称(symmetrycenter)。每种对称性可采用一种对称要素(symmetry lement)来表达,各种对称要素可以组合出更多组合类型,这些组合类型之间是不独立的。1830年,德国矿物学家赫塞尔(Johan Friedrich Hesse)采用数学运算推演研究对称性运算,据此,从数学上证明了存在32种独立的晶体对称性,相应可将矿物晶体划分为32个组(groups)。但当时32组并没有完全被实际观察到,后来才逐渐得到证实,可见建立起数学模型和数学规律就具有了预测性。2.5 沉积学-沉积物粒度分类数学指标
沉积学(sedimentology)是研究沉积物的基础地质学科。沉积物的颗粒大小及其分布是沉积物的基本性质,不仅对许多其他性质有重要影响,而且也反映了沉积环境等机制,如悬浮性、运输和沉积、孔隙度、渗透率、负荷强度、化学反应等,均与沉积物粒度及分布有着内在关系。因此,粒度分析是沉积学和其他工程研究中的基本问题。根据沉积物粒度大小可以将沉积岩划分为:泥岩(<0.0039mm)、粉砂岩(0.0039~<0.0625mm)、砂岩(0.0625~<2mm)和砾岩(2~256mm)等。这样的分级方案最初是基于乌登分级和温氏分级建立的。后来美国学者克伦宾于1934年创立了知名的基于颗粒大小(ξ)的对数变换的phi(φ)粒度phi(φ)粒度为乌登-温氏分级(Udden-Wentworthscale)提供了可定量计算的标准指标,为沉积学粒度分类和沉积岩的分类奠定了重要基础。克伦宾之后还发表了关于沉积物颗粒形状度量指标等一系列数学地质的学术论文,为数学地质学科的创立发挥了奠基性作用,因此,被称为数学地质之父,国际数学地球科学学会(IAMG)以克伦宾(Krumbein)名字设立了IAMG领域最高奖。2.6 地理信息系统的基础:拓扑数据模型
拓扑学(topology)是由前面提到的瑞典数学家和物理学家欧拉(Leonhard Euler)17世纪中叶建立研究关于几何图形或空间逻辑关系的一门数学分支。它主要研究在几何图形和空间形状发生连续变化条件下仍保持不变的一些几何性质。简单的拓扑关系包括方位关系(如内外、上下、左右)、连通性和方向性等等。拓扑学理论和方法被广泛应用于许多自然科学研究领域。比如,拓扑学在空间信息系统、地学信息系统或地理信息系统(GIS;Spatial Information System,or GeoinformationSystem or Geographical Information Systems)中的应用起到了奠基性的作用。GIS拓扑数据结构或数据模型使GIS有别于其他计算机制图和图像处理系统,成为具有空间拓扑信息分析功能的空间信息系统。20世纪60年代初由地理信息系统之父———加拿大学者罗杰·汤姆林森(Roger F.Tmlinson)开发了世界上第一套GIS系统一一加拿大地理信息系统(CGIS)。几十年来,GIS系统成为具有空间图像数据存储、查询、处理、分析等功能的应用领域最广的技术之一。GIS与一般的计算机辅助制图软件(如CAD)的本质差别就在于其具有空间拓扑分析功能。实现拓扑分析功能的基础是GIS的拓扑数据模型,如ArcGIS软件中使用的Coverage数据模型,该模型将图形或图像分解成点、线、面分别保存,通过空间坐标和属性信息建立点线面之间的拓扑关系(如面积、方向、相邻关系等)并将其拓扑关系保存便于查询和分析。2.7 地球化学元素分布基本定律
地球化学(geochemistry)是近些年发展较快的一门地球科学交叉学科,在现代地球科学研究中发挥着重要作用。地球化学的概念首先是由德国化学家舍恩拜因(Christian Friedrich Schonbein)于1838年首先提出的,但之后的几十年里,人们还是习惯称其为化学地质学(chemicalgeology)。谈到现代地球化学,就不得不提两位大家非常熟悉的奠基人,一位是美国化学家克拉克(Frank Wigglesworth Clarke,1847—1931),另一位是挪威矿物学家戈尔德施密特(VictorGoldschmidt,1888—1947)。克拉克经过大量数据统计分析发现了地壳元素丰度与含量的关系,发表了被后人广泛引用和使用的“地壳克拉克值”。克拉克本人由此被称为现代地球化学之父,国际地球化学协会以克拉克名字设立了青年地球化学家奖项。克拉克在他的其他研究中也用到了统计理论和最小二乘法等统计方法。戈尔德施密特(VictorGoldschmidt)在挪威大学期间学习了无机化学、物理化学、地质学、矿物学、物理、数学、植物学等课程,他提出了元素的分类方案规则,成果发表在《元素分布的地球化学规律》(GeochemicalLaws of the Distributionof Elements)系列书籍中,对现代地球化学产生了长远的影响,被称为现代地球化学之父,国际地球化学协会以戈尔德施密特名字设立地球化学领域最高奖项。地球化学元素分布规律的研究为数学地球科学开辟了新的研究方向。20世纪50—60年代兴起了对地球化学元素分布基本定律的研究热潮,如美国学者在大量数据分析的基础上,认为正态分布(normal distribution)或者对数正态分布(lognormaldistribution)是岩石地球化学元素分布的基本定律(A FundamentalLaw of Geochemstry)。这一普遍认同的统计分布模型奠定了统计方法在地球化学元素数据分析的理论基础。半个多世纪以来,统计学理论、统计模型和统计方法在地球化学领域得到了广泛的应用,包括地球化学数据误差分析(±2σ),地球化学元素相关性分析(R2),统计检验、统计推理、统计判别等统计分析,多元统计分析(因子分析和聚类分析等),异常与背景识别(基准、异常阈值等确定),地球化学模式识别,地球化学过程与机制研究等。然而,地球化学元素的正态或对数正态分布也受到一定质疑。Aubrey发现煤样品中的某些元素分布会偏离正态或对数正态分布。什么是地球化学元素分布的基本定律也成为长期悬而未决的基本科学问题。笔者在博士论文研究期间通过太平洋板块俯冲相关的斑岩铜矿床的研究,从分析岩石原生晕数据发现,成矿元素在研究区岩石样品中服从正态或对数正态分布,而在矿化蚀变样品中会偏离正态(对数)分布。进一步研究发现,成矿元素异常面积随含量变化显示自相似性,具有分形特征,据此提出了元素含量的“密度-面积”分形模型(Concentration-Area或C-A模型):式中,A代表异常面积,C(A)代表面积A范围内的元素含量密度。多种成矿相关元素(如Au、Cu、As、Pb/Zn等)均具有以上规律。从以上公式可以看出,对于均匀分布的样品,异常面积与样品数成正比,因此,元素的样品频率和元素含量密度服从powerlaw(分形)分布。该模型的建立也首次给出了定量刻画成矿元素超常富集规律-异常结构的数学公式。据此,笔者利用C-A模型不仅刻画并有效区分了地球化学“异常”与“背景”。C-A分形模型被证明是一种定量研究和识别异常的新思路和新方法。C-A模型的理论背景是多重分形理论的极端数据统计分布。多重分形是一种较正态分布和对数正态分布更复杂的新的统计模型。它可同时刻画在均值附近具有正态分布或者对数正态分布的正常值和刻画两端具有powerlaw分布或者分形长尾分布的异常值。多重分形分布统一了正态分布、对数正态分布、帕累托(Pareto)定律或者Zipf定律(图7),因此,可以作为地球化学元素分布的基本定律。C-A方法的建立和多重分形理论的引入被认为开启了采用分形方法圈定地球化学异常的先河,被学界广泛应用和引用。到目前为止,C-A方法已被应用于全球几十个成矿带的矿产资源预测和环境评价中,被评价为最有效的方法。论文已被引用近千次,是该论文发表以来国际勘查地球化学杂志发表的引用率最高的论文。图7 地球化学元素分布定律
(A)—基于正态或者对数正态分布区分地球化学异常与地球化学背景;(B)—成矿元素异常显示空间自相似性,服从幂律(powerlaw)分布,具有分形自相似规律;(C)—多重分形模型。
2.8 矿产资源与能源定量预测与评价
地学中的定量预测问题是数学地球科学中的核心研究内容。建立合理的预测模型是有效开展定量预测的基础。矿产资源和能源是任何国家实现经济和社会发展的基本要素。随着国民经济水平的不断提高,社会可持续发展对资源和能源的需求也不断增加,给地球科学家寻找矿产资源和能源、保障社会需求提出了巨大挑战。同时也不断促进矿产资源和能源预测理论、方法和技术的创新。矿产资源和能源定量预测主要是对矿产资源和能源的产出位置、储量、资源量、资源价值、开采环境等要素进行定量预测和评价,其目的是为政府或企业开展资源和能源开发、环境规划和决策提供科学依据和技术支撑。由于矿产资源和能源产出机制与时空分布的复杂性和人类认识及研发技术的局限性,目前对矿产资源和能源的定量预测还存在较强不确定性。自iamg成立以来,矿产资源和能源定量预测与评价就一直是该学会的重要研究领域,先后发展了一系列预测理论和方法技术,在全球、国家、地区等范围得到了广泛应用,比如美国地调局(USGS)发展“三步式”矿产预测理论方法,加拿大地质调查局发展了基于证据权模型的数据综合矿产资源预测理论方法,中国学者发展了地质异常矿产统计预测理论方法、综合信息矿产资源预测理论方法和基于分形奇异性理论的非线性矿产资源定量预测理论方法。随着社会经济发展不断提出新的需求,矿产资源和能源定量预测与评价是一项长期的常态化创新研究工作。近几年来,矿产资源和能源开发利用领域也不断发生变化,比如,开展地球深部、覆盖区、深海、深空等非传统领域矿产资源和能源预测已成为地学前缘。这里仅举几个例子,2009年USGS开展了北极圈油气资源统计预测。研究结果表明,北极地区冰层下蕴藏有全球15%的石油和30%的天然气。2016年日本学者在西太平洋海底发现资源量可观的稀土资源。意大利科学家采用雷达技术在火星上发现了冰层下直径达20km的冰下湖。从2010年起,笔者研究团队持续开展了覆盖区矿产资源定量预测评价,在东天山沙漠覆盖区、内蒙古草原-第四纪沉积物-火山岩浅覆盖区、福建武夷山火山岩覆盖或老地层推覆构造覆盖区,以及西南三江及周边高山峡谷等非传统地区开展了多金属矿产资源定量预测,圈定了大量有找矿潜力的靶区,部分靶区经工作验证发现了新的矿床,获得了找矿突破(图8)。例如,1998年笔者在中国地质大学211项目资助下,与云南省地调院在云南兰坪—金顶地区开展了铅锌多金属矿预测,对两幅半1:20万比例尺水系沉积物地球化学数据(图8A)进行处理,采用由笔者提出的基于多重分形滤波原理的能谱-面积(S-A)异常与背景分解方法有效消除了复杂背景及玄武岩干扰的影响,分解了矿致异常与背景。新圈定了具有等间距、串珠状、自相似分布的铜铅锌找矿靶区五处(图8B),提供给合作单位云南省地调院作为进一步工作部署依据,经勘探部门进一步工程勘探新发现了五宝山、菜子地矿床,实现了找矿新突破。S-A多重分形模型也被云南省地质调查局进一步应用在三江地区圈定若干找矿靶区,在所用的方法中S-A方法被证明最为有效,圈定了其他方法未能圈定的地球化学异常。由于当时与云南省地质调查院(局)签订数据使用的保密协议,图8中的预测成果在本文首次发表,但相关成果已多次在国内外学术会议进行交流和研讨。近年来,S-A和C-A等基于分形理论的新方法在国际上得到了广泛应用,已成为勘查地球化学数据和其他数据处理的常用标准方法,分别被收录于国际《勘查地球化学手册》,并作为新概念词条和方法被收录于国际《数学地球科学词典》。图8 云南兰坪一金顶地区S-A方法Zn异常与背景分解(A)—原始水系沉积物地球化学数据;B)—新圈定的五处具有等间距、串珠状、自相似分布的铜铅锌找矿靶区(1998年笔者与云南省地质调查院(局)签订数据保密协议,成果未公开发表,但在国内外多次学术会议进行交流,经勘探新发现了五宝山、菜子地矿床)。3 数学地球科学前缘
以上介绍了数学地球科学家在地球科学相关领域所做的一些贡献,接下来我们分析数学地球科学前缘,回答数学地球科学家是否已经站在地球科学前缘。
分析数学地球科学前缘可以从两个方面入手,一方面从数学地球科学领域目前从事的研究工作;另一方面还通过分析国际主要学术组织制定并公布的科学前缘和今后5~10年的战略计划,例如,国际科学理事会(ISC)执行的《未来地球2025年远景战略研究议程》(Future Earth计划)和2020年新发布的四个战略挑战领域(Strategic Challenge Domains);国际地质科学联合会(IUGS)相继发起的“后代资源”(RFG)和深时数字地球(DDE)大科学计划;美国国家科学基金会(NSF)2020年刚刚发布的未来10年规划(AVisionfor NSF EarthSciences2020—2030:Earth in Time);美国地质调查局刚刚发布的未来10年规划;国际大洋科学钻探——面向2050年的科学框架。这些战略报告和大科学计划从不同角度诠释了未来10年的地球科学发展趋势。此外,笔者参加了众多国际计划的讨论和国际会议的交流,如国际科学理事会科学管理委员会(ISC-CSP)、国际大地测量与地球物理(IUGG)会议、美国地球物理年会(AGU)、欧洲地学联盟会议(EGU)、美国地质年会(SGA)、加拿大矿业大会(PDAC)、中国地球科学联合会(CGU)等活动。根据以上活动和信息,笔者曾总结了地学前缘和数学地球科学前缘,并发表在IAMG学会和IU-GS联盟的主席年度报告中。以上信息来源中常出现的关键词和专题可以反映地球科学当前的趋势和前沿,比如,数据科学、数据分析、计算、交叉学科/多/跨学科科学、综合模型、与观测和预测相关的不确定性、地球的属性和动态、气候变化、地震和风暴等破坏性过程以及北极、南极和青藏高原都是常出现的关键词。也反映出围绕了解地球系统与人类系统的相互作用,认识宜居地球环境的过去、现在和未来变化,预测预警地球的极端事件等基本任务所面临的三大挑战:(1)地球系统及其多层圈相互作用的复杂性;(2)地球过程的混沌性与极端地球事件的奇异性和预测性;(3)观测和监测多尺度非线性混合过程的有效性。以上挑战均与数学地球科学密切相关,获得突破性进展必须发展新的数学理论、模型、计算方法和计算机技术。因而,数学地球科学家也面临着巨大的挑战和机遇,已经站在地球科学的前沿。许多研究团队在以上地学前缘领域长期探索,相继取得重要进展。以下将列举一二:定量模拟地球系统复杂性和大数据与人工智能新技术与应用。
3.1 定量研究地球复杂性:新的学科增长点
复杂性和混沌性是地球系统的基本特点。理解和模拟地球系统复杂性是科学家们的长期攻关目标。但关于什么是地球系统复杂性还没有明确的学科定义,有些学者把模拟地球复杂性作为一门新的科学(Modelinggeocomplexity:'Anew kind of science”)。这些作者强调,地球系统复杂性是指无法采用经典数学微积分方程度量的非线性地质过程。简单的地质过程可以采用经典数学方程,通过设置边界条件和初始条件即可完全预测地质过程的时空分布,比如前面提到的板块构造有关洋中脊热扩散模型。将洋中脊附近板块作为规则的刚性体,其上下表面温度作为边界条件,洋中脊裂解作为起始条件,所建立的热扩散方程的解析解或者数值解可以预测板块任意位置的热通量。然而,人们发现许多复杂地质过程是不能采用以上经典方程预测的,比如,浊流(turbulence)具有统计不确定性,无法用确定性数学模型进行预测。为了研究这类过程和现象,20世纪60年代美国数学家和气象学家洛伦茨提出并发展了混沌(chaos)理论,法裔美国数学家曼德布罗特提出并发展了分形(fractal)理论。对混沌现象或混沌过程来说,预测结果往往随初始条件或者边界条件的微小扰动而产生巨大变化,呈现很大的不确定性和不可预测性。但人们也发现,混沌过程往往具有尺度不变性、分形性和自相似性。分形理论是在分形几何概念基础上发展起来的一门新的数学分支。分形几何学是从分数维度的视角和数学方法描述和研究几何体,包括介于传统几何体(如点、线、面、体)之间的不规则几何体或几何图形。显然,分形几何概念极大拓展了传统几何的范畴,特别是对于研究复杂的几何体提供了有效的数学理论工具。近年来,分形几何理论在几乎所有的学科领域包括地球科学领域都得到广泛应用。比如,地震震级-个数模型、板块面积-个数分布、板块边界形态分布、岩浆岩面积-频率分布、火山喷发间隔分布、矿床大小-个数分布、矿化带面积-周长分布和勘查地球化学异常奇异性等等。随着分形几何学的发展及其在各个领域的应用,分形的概念和分形理论也得到了进一步发展,比如,多重分形理论的提出将分形几何拓展到研究几何体上的分形测度分布,实现了从分形几何向分形测度的重要扩展。多重分形的提出使分形研究从关注分形几何复杂图形和图形的自相似性特征,拓展到研究定义在几何体(本身也可以分形几何)上的复杂分布。多重分形被证明是统一正态分布、对数正态分布和powerlaw分布的新的统计分布模型,它为研究复杂空间模式提供了新的途径,也为进一步研究建立分形微积分和分形动力学体系提供了基础。几何集合理论是建立数学分析包括微积分的基础。只有建立了几何测度-微积分系统才能发挥几何学的更大作用。如何在分形几何基础上建立数学微积分以及其他物理量?比如密度、导热系数等,这些方面的研究都是真正扩大分形理论应用领域和提升其应用能力和效果的重要研究方向。目前,这方面的研究进展还很缓慢,需要更多一流学者特别是青年学者的关注和投入。笔者长期关注以上问题,在发现矿化元素含量密度服从多重分形分布模型的基础上,提出了建立分形几何的“分形密度”概念和计算模型(图9a),并建立了局部奇异性计算方法,探讨了产生分形密度的地质过程(地震、成矿、岩浆事件、火山事件等,图9B)以及可能的物理机制(相变、自组织临界性、多重级联与混沌等,图9C),形成了定量研究复杂地质过程和极端性地质事件的奇异性理论。传统的几何体质量密度(c)是质量(△m)与体积(△V)之比(导数):在此基础上,笔者定义了“分形密度”和“分形导数”为
式中,α是分形维数,当α=3时分形密度变成正常体密度,而当α<3时密度为分形密度。前者的密度单位为质量单位与体积单位比(如g/cm3、kg/m3等),而分形密度的度量单位则是质量与分形几何体的单位(如g/cmα、g/cm2.73和kg/m2.73)。对于分形几何体的传统密度和分形密度之间存在如下powerlaw关系:其中,△α=(E—α)是正常维数(E)与分形维数(α)之差,或者叫余维数(codimension)。该指标(—般△α>0)是非常有用的可以度量“分形性程度”或者“奇异性强度”的指标。以上公式也表明,对于分形几何体而言,传统的密度是不收敛的并且具有奇异性(尺度无限小与密度无限大,c→∞,ε→0)。它的数值随着度量尺度而变化,不再是常数,因此不再适合度量分形几何密度。对于刻画具有分形结构的几何体或具有分形性质的测度的密度需要采用新的分形密度定义和计算模型。分形密度可以简单定义为:分形几何密度或者具有分形特性的测度。分形密度可以看作是对希腊数学家阿基米德(Archimedes,287—212BC)公元前提出并沿用了两千多年的传统密度概念的拓展。作为一种新的物理学概念,它的存在性如何证明?它的物理机制又是什么?这些都必须要得到回答。笔者从数学多重级联过程出发,从数学上证明了分形密度的存在性,并且结合地球系统突变导致的多种极端事件(如地震、火山、岩浆作用、成矿作用、海啸、滑坡等等)探讨了分形密度形成的物理机制(图9C)和结果的奇异性,其中包括相变机制(phase transition,如:超临界流体、莫霍间断面、俯冲板片界面、深部岩浆与地表水之作用面等)、自组织临界性(self-organized criticality,如:岩石圈拆沉、岩层断裂、板片断离等)和多重级联循环过程、耗散结构、混沌过程(multiplicativecascade processes,dissipative system和chaotic processes,如:浊流、岩浆对流、地幔对流、变质变形等)。笔者把这类极端地质事件称其为奇异性地质事件或事件具有奇异性,建立了度量这类事件结果的分形密度概念和局部奇异性模型和分析方法,形成了定量研究极端地质事件的局部奇异性理论。分形密度和局部奇异性理论和方法成功应用于多种极端地质事件的定量模拟和预测。比如,覆盖区隐伏矿致地球化学异常识别和找矿靶区的圈定、地震概率密度-震级模型、岩浆flare-up与印度大陆/欧亚大陆碰撞、洋中脊热流异常、大规模岩浆幕式活动与大陆演化及其板块构造未来预测和岩石圈相变奇异性等。由于篇幅关系,本文就不一一介绍,感兴趣的读者可以参看相关论文。
图9 分形几何-分形密度-分形动力学机制
(A)—从正常几何以及几何体密度(左图)到从分形几何以及分形几何体密度(右);(B)—产生分形密度(质量密度、能量密度、热量密度等)的几种奇异性地质过程;(C)—产生分形密度和奇异性的几种机制:相变、自组织临界性、多重级联-循环和混沌机制。
3.2 大数据、深度机器学习与复杂人工智能
大数据(bigdata)和人工智能(Artificial Intelligence,AI)是当前在自然科学、社会科学以及经济学等多个领域非常流行以及政府和大众所关注的话题。它和人们的生活越来越密切,也让科学家们自觉不自觉地希望引入并应用到各自的研究领域。但是,人们对大数据和人工智能的理解程度还有较大差别。这里,笔者只想从数学地球科学的角度探讨数学地球科学与大数据和人工智能的相互关系。一方面,如何在数学地球科学领域发挥大数据和人工智能的作用;另一方面,数学地球科学家如何发展和丰富大数据和人工智能技术和拓展其应用领域。同其他任何一个学科一样,人工智能的发展也经历了漫长的历史和冷热起伏的变化。20世纪初由英国数学家图灵提出了人工智能概念(AI)并建立了一系列数学理论与计算方法。人工智能是通过计算机程序实现机器的智能化,来模拟人类智能和行为。其中,由美国计算机和人工智能专家塞缪尔首先提出的机器学习(MachineLearning,ML)是人工智能的重要领域,主要目的是通过计算机自动从原始数据中提取特征和信息。人工智能和机器学习植根于应用数学、应用统计学、计算技术的交叉发展。进入21世纪以来,随着大数据的发展和计算机算力的爆发式增长,机器学习和人工智能也得到了飞速发展。尤其是近5年来,由于谷歌公司(DeepMind)研发成功能够战胜人类最好棋手的人工智能阿尔法狗(AlphaGo),人工智能在社会上受到广泛关注和认可。2019年谷歌成功研发了“量子霸权”——里程碑式计算机,再次表明,超级计算仍然有巨大发展空间。超级计算机算力和大数据将极大地推动复杂人工智能、深度机器学习与机器阅读等技术的发展。数学模型与算法以及计算机算力决定了人工智能和机器学习的能力。目前最常用的简单的机器学习计算方法包括线性回归分析(linear regression)、逻辑回归分析(logistic regression)、人工神经网络(artificialneural network)、朴素贝叶斯(NaïveBayes)和证据权方法(Weights of Evidence)、随机森林(randomforests)、自适应增强(AdaBoost)和主成分分析(principl componnt analysis)等。此外,蒙特卡洛模拟、极值计算、最小二乘拟合等传统数学方法也常常被机器学习所使用。比如,阿尔法狗的设计中就利用了贝叶斯准则、蒙特卡洛模拟、最速下降极值求解和统计分布等方法。以上列举的这些方法对于大多数数学地球科学领域的研究人员都是非常熟悉的。过去几十年来,这些方法在数学地球科学领域的研发和应用一直非常活跃,也发表了大量理论、方法、计算机软件和应用成果。比如,20世纪60—70年代IAMG就开展并推广全球矿产资源和能源定量预测评价理论和方法,先后研发了被业界广泛应用的资源潜力预测评价的多种方法,其中应用最广的方法包括逻辑回归、模糊逻辑、证据权、人工神经网络等方法。这些方法在GIS软件平台实现后极大方便了用户使用,在全球得到迅速推广。此外,在应用实践过程中数学地球科学家们还深入研发了多种新模型和新方法。比如,建立了基于贝叶斯原理的证据权方法的各种变化形式,从要求预测变量完全条件独立性模型(朴素贝叶斯,Naïve Bays,或者正常证据权,Wights of Evidnc),到变量之间存在弱条件独立性模型(AdaBoost-证据权,AdaBoost Weights of Evidence),再到不要求条件独立性的修正模型(加权证据权,Weighted Weights of Evidence)等。图10 地球科学、数学与计算机科学交叉支撑地学信息、地学大数据、地学人工智能应用
随着深度机器学习的迅速发展,人工神经网络类的模型正成为机器学习研究的主流方法。但还应该看到,尽管根据通用近似定理(universal approximation theorem),人工神经网络从理论上可以逼近任何勒贝格可积性函数(lebesgueintegrable function),也就是说,对于任何能够用比较光滑的、连续的、可积分的函数来表达的问题均可采用人工神经网络进行无限逼近,但是对于复杂的不可积函数(如分形曲线或曲面),由于奇异性、不可积性或不可微性,目前的人工神经网络还无法无限逼近。只能采用更大宽度和深度的人工神经网络近似表达复杂函数。但人工神经网络宽度和深度的较大增加会造成模型参数的增多,从而需要更多数据和更大算力,其结果也会出现不稳定和不收敛性,其重复性和精度会相应降低。如何针对极端地质事件产生的具有奇异性的分形密度问题进行人工神经网络的设计和建模仍需要创新研究,这类型的人工智能我们不妨称为复杂人工智能(complex artificialintelligence)或者局部精准人工智能(local precson artfcalintelligence)。4 数学地球科学的科普与教育
教育是学科发展的基石和保障,没有好的教育就不可能发展好学科。目前数学地球科学领域还缺乏相应的完善的学科教育体系,如在本科教育中鲜有数学地球科学专业。目前,包括国际数学地球科学学会中的大部分会员也都是由地质学、地球物理学、地球化学、大地测量学、计算机科学、数学和地球信息方面毕业的专业人员组成,他们中大部分人都没有数学地球科学的本科学位或者学历,这是因为大学课程中很少有数学地球科学课程,至少在发达国家的大多数课程中都没有专门的数学地球科学内容,以至于对数学有兴趣的地学人才只能在其他相近的领域如地球物理学就读。这也许是为什么在全球的大部分地学学术机构或行业和企业中几乎没有设立数学地球科学或地球数学的工作职位,许多从事数学地球科学和工程技术相关的专业人员也都是以其他职位雇佣的。在国际上,除精算科学、数学物理和商业数学以外,很少有把数学作为名称的跨学科专业。这造成的误解是,学习数学只能未来从事两种工作:纯粹的数学家或数学老师,或者是从事需要较好数学基础的工程或商业的职业。这可能是国际上特别是西方大部分中学生和大学生不愿选择学数学的原因之一。因此,数学地球科学作为一门交叉学科,如何教育和培训下一代专业人才是我们面临的重大课题和巨大挑战,也是制约发展和壮大数学地球科学学科的瓶颈。开展公众科普教育是提升数学地球科学社会影响力和知名度,促进教育和人才培养的重要环节。要以开放包容的态度鼓励交流与合作,不仅要宣传传统的数学地球科学方向的成果,如发表在IAMG主办的国际杂志上的学术成果,而且也要关注在其他领域发表的相关成果,如统计数据分析、几何建模、动力学和过程模拟、地球系统的预测和评估等等。要宣传数学地球科学在解决传统固体地球科学应用问题中的贡献,如矿产资源和能源预测评估,也要关注其他领域的应用,如水文学、气候变化、水资源、替代能源和环境问题,还要介绍在地球科学重大科学问题研究和学科体系建设中的作用等。要打破目前数学地球科学领域尤其是国内数学地质领域学术交流较封闭和学科面过窄的局面。2013年由国际数学联盟(IMU),与联合国教科文组织(UNESCO)、国际科学理事会(ISC)和国际工业和应用数学委员会(ICIAM)共同发起了“国际行星地球数学年'(The International Year of Mathematics of PlanetEarth,MPE)。MPE得到国际上100多家学术机构和社团积极参与,举行了一系列的学术交流和宣传活动,覆盖的内容包括诸多全球性问题,如自然灾害问题(飓风、地震、海啸等)、全球变化、可持续发展、病毒等等。这些活动增强了公众了解宜居地球面临的许多重大科学问题,以及急需开展数学与地球科学的交叉融合,迫切需要引入更多先进的数学理论和方法。实际上,从小学到高中再到大学数学都是必修课程,地球科学也是中学生和大学生毕业论文中常选的题目。数学和地球学科的融合不仅可行,而且一定有利于帮助中学生、大学生和研究生开展实践和研究选题。利用网络信息资源和大数据技术已经成为年轻一代的基本技能。云端大数据(数据、图件、遥感图像、视频、语音等)为开展数学地球科学的教学实践和科学创新提供了良好的共享数据资源。这方面的成功范例可以举美国的一位高中学生爱丽丝·翟(Alice R.Zhai)所做的研究工作。她和合作者分析了73个在美国登陆的热带飓风,并使用多元回归分析方法研究了飓风造成的经济损失与飓风的最大风速和覆盖面积的相互关系,建立了新的更有效的飓风风险计算模型,更新了保险业的灾害风险评估方法。从非线性数学地球科学角度,这项研究也表明飓风作为极端事件其面积与飓风经济损失满足C-A分形分布。5 结论
数学地球科学是定量研究地球特征和地质过程以及定量预测评价资源、能源、环境与灾害的一门交叉学科。在研究宜居地球系统演化以及预测和评价各种极端事件、服务社会可持续发展中发挥着不可取代的作用,在建立地球科学学科体系和发展重大地质基础理论和地球科学服务人类重大需求中做出了重要贡献。数学地球科学已处于地球科学前缘领域。要全面正确地宣传数学地球科学的科学内涵、学科贡献、发展前景,鼓励和培养中学生和大学生对数学地球科学的兴趣,吸引更多青年人才加入从事数学地球科学研究行列。相信面对21世纪人类面临的宜居地球和可持续发展的重大挑战,在大数据和人工智能背景下促进地球科学从局部到全球,从描述到机理,从定性到定量,从模式到预测的转变,数学地球科学将发挥不可替代的作用,是充满希望和具有巨大发展前景的新兴学科。感谢Frits Agterberg等国际数学地球科学学会(IAMG)理事同行们的有益讨论和交流,感谢与笔者团队成员包括研究生们的有益讨论和交流,感谢张振杰和赵默雷对论文文字和图件格式的修改、排版和校对。谨以此文献给我国著名数学地质学家、矿产勘查学家赵鹏大院士,恭贺先生九十华诞!