SmartUQ-软件功能

Data Sampling 数据采样

       数据采样是指从一个大数据集合中选择一小部分数据来表示整个数据集合。在模拟、优化和预测方面,数据采样非常重要,因为在大数据集中执行这些操作可能非常昂贵。选择正确的采样技术可以极大程度地减少需要执行这些操作的计算资源和时间。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

        DOE通常用于从系统中收集新数据且收集的数据量非常大,分析起来非常困难。例如,从现场元件传感器获取的健康监测数据可能是在元件的整个使用寿命内持续捕获的实时数据。SmartUQ的数据采样工具可以将数据分成子集,以模拟填充空间的DOE。与在数据收集之前开发的DOE不同,数据采样(如子采样和切片采样)使用现有的输入-输出数据对,并选择能够很好地代表设计空间的数据点。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

     

       子采样算法会从一个现有的大数据集中随机采样出用户指定数量的数据点,以足够地代表原始数据集。通过使用初始数据的子集,可以显著减轻计算负担,同时通过智能选择过程来维持准确执行高级分析的能力。剩余的更大数据子集可以用于进行模型验证,因此节省了模拟和测试资源,同时仍然保持了预测精度的可靠性。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       将现有数据集切成四个部分,每个部分模仿填充空间的实验设计(DOE),使用一片填充空。

       切片采样算法将数据集划分为不同的组。然而,不再假设初始数据集是填满空间的设计实验。每个切片可以用于构建仿真器或进行模型验证。通过切片结构实现的独特仿真过程是分割和组合仿真方法。每个用于训练的切片都有自己的仿真器,然后所有仿真器合并成一个用于体现结果的仿真器。允许并行计算从而减少执行大型数据集的高级分析所需的内存需求。

DoE 实验设计

       DOE是一种系统化、全面和高效的试验设计方法,旨在探索和分析各种因素对系统或过程的影响,以便优化和改进系统性能。

       阶乘DOE提供了强大的信息收集能力,但它们经常需要采取比在高度非线性系统中确定因果关系所需的样本更多、更昂贵的样本。

对于仿真和具有高度非线性响应的复杂物理实验,现代空间填充设计通常是有效的DOE。空间填充设计,例如拉丁超立方设计和优化

拉丁超立方设计,采样一系列代表性输入配置,均匀分布以填充设计空间。研究表明,这种DOE可以极小化运行次数,同时较大化每个

仿真所获得的潜在学习。因此,空间填充设计提供了高精度,同时减少了采样点的总数。

        SmartUQ提供一套专业的填充空间设计、一系列先进的实验设计(DOE)以及几种独特的专利待审DOE用于解决复杂挑战。在

实验设计方面,我们了解您有两个主要问题:如何获得足够的数据以准确地代表被采样的系统,并通过减少样本数量来控制成本。
       实验设计(DOEs)是一种系统的采样模式,用于进行实验以确定输入和输出之间的因果关系。如果没有确保从正确的实验中收集

足够信息的DOE,可能很难或不可能实现测试的目标。如果使用依赖于实验者或仿真用户直觉的采样模式进行仿真或测试实验,可能会

导致不理解输入之间如何相互作用,这可能会浪费测试资源并导致错过机会。
        使用多因素设计,同时变化多个因素,可以帮助解决这些问题。关键是要评估不仅个别因素的影响,还要评估各种因素对输出值产生影响的各种组合方式。

        该案例中首先生成一个4点的初始序列试验设计,然后进行第二个4点的序列试验设计,最后进行第三个8点的序列试验设计,依次增加初始序列试验设计的分辨率。

       Sequential and Multi-Fidelity DOEs(顺序型和多保真度实验设计)是一种实验设计方法,它使用多个DOE(设计试验)来填补之前采样模式的空白。这个过程可以重复进行,以增加仿真精度,通过只运行必要的仿真来优化总仿真时间。此实验设计还可以为组合多保真度仿真提供新的选择。可以使用低保真度仿真来生成仿真模型,并快速探索设计空间。为确保准确性,可以使用更小的高保真度仿真采样来校准仿真模型。还可以使用此实验设计来有计划地运行仿真,并随着计算资源的增加提高仿真模型的准确性。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

        该图展示了一个优秀的二维、20个采样点、4批次的DOE,适用于处理两个连续输入和一个具有四个水平的离散输入。  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

        该示例展示了一个2维、36个点的双重平行 DOE,适用于处理两个连续输入和两个离散输入,每个输入有三个水平。

       在平行DOEs中,采样点被分为不同的平行批次。这在变化连续和离散输入的混合时特别有用:每个批次可以处理一个单独的离散输入水平。还可以通过构建每个批次,使其由较小的平行DOEs组成,来支持多个离散输入。
       这些DOEs也非常有用,可以将计算和实验工作分配给多个团队。对于计算机实验来说,能够将整个实验的计算负载分配给更大的计算设备组,可以显著减少时钟时间。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       该案例展示了一个测试表面,具有若干难以拟合的特征。我们使用了两种方法来模拟该表面,一种是一次性的最优拉丁超立方设计,另一种是我们的自适应设计实验方法。

       自适应设计允许用户通过自适应地向用于创建模拟器的 DOE 中添加更多点来增加拟合的模拟器(代理模型、元模型)的精度。在这个过程中,从现有的 DOE 和相关的结果数据创建一个模拟器。然后使用该模拟器来确定下一个模拟运行应该在哪里添加,以增加模拟器的精度。该过程可以重复进行,直到达到所需的拟合精度水平为止。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       第一个设计实验方法是一次性的优化拉丁超立方设计。使用该设计实验方法生成的模拟器产生了以上展示的模型表面

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       第二种 DOE 是 SmartUQ 公司的自适应 DOE。该方法以一个初始的 20 个点的优秀 LHD(Latin Hypercube Design,拉丁超立方设计)为起点,每次向设计空间添加五个点。这五个点是根据算法选择的前一个模拟器的特定区域进行选择的。这种方法更准确,将误差降低了一个数量级,同时使用了相同数量的模拟运行

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       该案例展示了一个测试表面,具有若干难以拟合的特征。我们使用了两种方法来模拟该表面,一种是一次性的优化拉丁超立方设计,另一种是我们的自适应设计实验方法。

       自适应设计允许用户通过自适应地向用于创建模拟器的 DOE 中添加更多点来增加拟合的模拟器(代理模型、元模型)的精度。在这个过程中,从现有的 DOE 和相关的结果数据创建一个模拟器。然后使用该模拟器来确定下一个模拟运行应该在哪里添加,以增加模拟器的精度。该过程可以重复进行,直到达到所需的拟合精度水平为止。

Emulation and Machine learning

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       构建准确的高速仿真器是分析和不确定性量化任务中的关键步骤。从模拟或物理测试到仿真器的剧烈提速和成本降低,使得可以执行许多本来过于缓慢或昂贵的任务。在任何输入配置下对系统输出进行高速预测,对于设计空间探索、优化、校准、敏感性分析和不确定性传播非常有价值。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Large Scale Emulation

 

      该案例使用一个包含75个输入变量的数据集,包含4,000个实验点,构建了一个仿真器。SmartUQ的算法仅需不到5分钟的时间,在标准笔记本电脑上即可完成仿真器的拟合。如交叉验证图所示,所有输出点都接近于对角线,表明该仿真器非常精确。

 

 

Multivariate Response Emulation

 

       多元响应仿真器适用于具有多个连续输入和多个输出的系统,如汽车模拟和测试。提高了效率,这意味着用户可以同时探索和理解不同输出和输入之间的关系,而不是单独地进行探索,使整个过程比以往更快。
      
上图显示了输出Y1对输入变量V1和V2的预测响应。预测结果接近对角线,表明仿真器捕捉到了Y1的大部分行为。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Large Scale Emulation

 

       该上图显示了输出Y2对输入变量V1和V2的预测响应。留一法预测结果在对角线上,表明仿真器捕捉到了该输出的所有重要行为。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Large Scale Emulation

 

       上图显示了输出Y3对输入变量V1和V2的预测响应。留一法预测结果在对角线上,表明仿真器捕捉到了该输出的所有重要行为。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       上图显示了对于离散输入的前四个级别,输出Y相对于输入变量V2和V3的预测响应。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       上图展示了数据集中所有点的交叉验证误差。

       混合输入仿真对于处理既有连续输入又有离散输入的系统非常有用。离散输入可以包括一组固定的组件,甚至包括完全不同类型的设备或子系统的仿真。使用混合输入仿真意味着您可以更轻松地构建和分析不同设计。通过同时考虑更多选项,您可以创建更好的设计。
       飞机发动机仿真中离散变量的例子可能包括使用多个不同的求解器、多种离散大小和涡轮叶片几何形状,或多种不同类型的涡轮/压缩机传动。
        混合输入问题的一个例子是辐射泄漏模型,它可能涉及连续输入,如水流量,和离散输入,如放射源材料的类型(例如污染设备、燃料棒、玻化废燃料)。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Efficient Functional Response Emulation

 

       SmartUQ有一个独立的函数仿真器类别,利用了输入和输出变量之间的函数映射,使仿真器的构建和使用更加高效。通常情况下,函数输入值(例如时间步长或位置)的数量比其他输入变量多几个数量级,这使得SmartUQ能够仿真更大的函数数据集。

    “Transient Response Emulator”指的是瞬态响应仿真器,该例子展示了一个大型瞬态数据集的测量值与生成的仿真器之间的对应关系。

Optimization 统计优化

       SmartUQ可以直接与现有的计算机模型和仿真程序集成,使其在不同的场景和条件下具有可靠的可预测性。SmartUQ的统计优化工具基于统计学的优化方法和现代计算技术可以处理不同类型的变量和目标函数。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       SmartUQ能够处理不同类型的输入参数和输出变量,支持离散和连续变量,以及多维输出变量,支持多种不同的校准方法,包括贝叶斯方法、最小二乘法和响应面法等。能够自动选择极佳的校准方法和输入参数组合,从而使得模型的预测结果更加准确。支持并行计算。

 

Sensitiity Analysis 敏感性分析

        一种系统性的方法,用于评估模型或系统的输入参数对输出结果的影响程度。其目的是识别模型或系统中对输入参数敏感的部分,并确定哪些参数对结果有极大的影响,以帮助优化模型或系统设计。

       敏感性分析可以帮助确定仿真模型中哪些输入变量是最重要的,以及可以忽略哪些变量。通过了解哪些变量最重要,可以提高模型的准确性和效率,并缩小设计和优化中所用的搜索空间。SmartUQ提供了两种经过验证的敏感性分析解决方案:基于模拟的方法和广义多项式混沌扩展(gPCE)。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       该案例构建了一个代理模型并使用它对一个包含75个输入变量、一个输出变量和10,000个数据点的数据集进行敏感性分析。

上面的柱状图总结了主效应和总效应的结果

       使用基于广义多项式混沌展开的方法对一个包含五个输入变量和一个输出变量的数据集进行了敏感性分析。根据预期的不确定性,

预测了输入变量的概率分布,并使用这些分布生成了稀疏格点实验设计。然后,使用实验设计评估系统,并使用结果输出进行gPCE分

析。主效应和总效应的结果总结在表格中。

Uncertainty Propagation 不确定性传播

       用于评估由不确定性输入参数引起的输出结果的不确定性程度。其目的是将输入参数的不确定性传递到输出结果,并确定输出结果的不确定性范围,以帮助理解和控制系统或过程的风险。

       SmartUQ的不确定性传播工具,它可以帮助用户评估模拟模型中输入参数的不确定性如何影响输出结果的不确定性。不确定性传播可以提供有关输入变量和输出变量之间关系的信息,以及每个输入变量对输出变量的影响程度的量化。

       可以采用不同的方法来处理不确定性,包括蒙特卡罗模拟和基于概率统计方法的方法,如多项式混沌展开和高斯过程回归。用户可以根据自己的数据和需求选择适合的方法。

       案例1建立了一个仿真器,用于计算由三个输入变量和一个输出变量组成的仿真数据集的不确定性传播。输入变量根据其预期的不确定性被分配概率分布。给定分配的输入分布,输出的计算密度分布如图1所示。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       案例2基于 gPCE 的方法来计算由五个输入变量和一个输出变量组成的数据集的不确定性传播。根据这些输入变量的预期不确定性,预测其概率分布,并利用此来生成稀疏网格实验设计。然后,使用实验设计来评估系统,并将生成的输出用于 gPCE 分析。给定输入概率分布,输出的计算密度分布如图2所示

Statistical Calibration统计校准

        用于调整模型或系统的输入参数,以使其输出结果与观测数据或实验结果相符。其目的是优化模型或系统的准确性和可靠性,从而提高其预测和设计能力。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       支持多种不同的优化算法,包括遗传算法、模拟退火算法和蚁群算法;可以自动选择极佳的优化算法和输入变量组合,从而使得模型的优化结果更加准确。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       上图表显示了模拟和物理数据集之间模型差异的2D表面图。

INVERSE ANALYSIS逆向分析

        使用SmartUQ的逆向分析功能,可以更快地确定输入参数值,以产生给定的输出,并评估不确定性和故障源。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

        逆向分析是指基于输入和输出数据,推导出模型参数和输入的不确定性,从而提高模型精度和预测可靠性的过程。

       •     识别输入参数的重要性和影响
       •     预测输出变量的不确定性和方差
       •     优化输入参数以达到特定的输出目标
       •     构建可靠的、高精度的模型

 

 

 

                                        图1                                                                                                                                 图2