石油勘探的数据量和计算规模要求它必须用高性能计算机。
简单的说,石油勘探面对的数学问题就是Ax=b。b是野外采集到的数据,规模通常是几百GB到几十TB之间;x是地下结构模型,.简单的情况是仅考虑纵波速度,如果是一个20kmx20km的工区,深度为10km,为了使反演的地下结构达到足够的精度,模型的网格不能太大,比如50mx50mx20m,这个模型就有80,000,000个网格,或者说8千万个需要求解的未知数。A:经过精细的信号处理,可以近似得到A。20kmX20km的工区,石油勘探要做的是解一个有8千万个未知数的方程,而且是病态欠定非线性方程。
实际上,石油勘探的工区通常远远大于20kmX20km,地下结构模型也并不是只包括纵波速度,同时野外采集到的几百GB~几十TB的数据也需要进行复杂繁琐的信号处理以提高信号质量。从计算时间上来说,即使仅仅考虑勘探数据处理工作中的.后一步:偏移。直到本世纪初,工业界才开始在日常的数据处理工作中引入深度偏移,就是因为从那时开始高性能并行计算机才可以处理这样大规模的问题,也仅仅是能够处理而已;因为一次偏移通常需要几天到几周,甚至几个月(这应该是上世纪末的水平)。
即使是,做一次20kmX20kmX10km这个规模的工区的简单偏移,使用cluster,几百个节点,每个节点上有16个64位的CPU,一次偏移也需要十个小时左右的满负荷运算。而且通常情况下,速度模型需要迭代求解,所以一个项目可能需要多次偏移。