模型 vs. 数字孪生

数字孪生 目前存在各种各样的定义。有些差异是不同部门之间的差异，但一个部门内的定义也可能有显著差异。在工程领域，据称使用数字孪生有利于设计、优化、过程控制、虚拟测试、预测维护和寿命估算。在其许多应用中，模型和数字孪生之间的区别尚不清楚。这种多样性和模糊性的危险在于，对数字孪生的定义和解释不尽如人意或不一致，可能导致人们拒绝它，将其视为炒作，因此，一旦炒作和不可避免的反弹超过最终的兴趣和使用水平，最终得到生产力可能远远低于技术的最大潜力。数字孪生的基本组成部分（本质上是模型和一些数据）通常比较成熟，理解得很清楚。在模型中使用数据的许多方面同样得到很好的理解，从模型验证和验证的长期经验，以及从测量值中开发边界、初始和加载条件。然而，存在许多有趣的开放问题，有些与数据的体积和速度有关，有些与可靠性和不确定性有关，有些与动态模型更新有关。本文突出了模型与数字孪生之间的本质区别，概述了使用数字孪生的一些关键益处，并为进一步研究指明了方向，以充分挖掘该方法的潜力。

1、介绍

数字孪生是一个术语，用于广泛的应用，从高价值制造和个性化药物到炼油厂管理，以及城市规划的风险识别和缓解。对于一些定义，使用"孪生"的原因已经找不到。这种多样性和模糊性的危险在于，对数字孪生的定义和解释不当可能导致人们拒绝它，将其视为炒作，因此，一旦炒作和不可避免的反弹超过最终的兴趣和使用水平，稳定生产力水平可能会远远低于技术的最大潜力。

Defense Acquisition大学对数字孪生的定义，通常用于国防、航空航天和相关行业：

"由数字线程赋能的集成多物理、多尺度、概率模拟的构建系统，它使用最佳可用的模型、传感器信息和输入数据来镜像和预测其相应物理孪生的全生命周期的活动/性能。

NAFEMS理事会成员Rod Dreisbach最近将其定义为：

"物理对象的动态计算机表示，利用分布式信息管理和虚拟增强现实技术来监控对象，并在虚拟和真实产品之间动态共享和更新离散数据"

从这些定义中可以清楚地看出，对象的数字孪生体中有三个重要部分：

对象的模型，
一组不断发展的与对象相关的数据，
根据数据动态更新或调整模型的手段。

并非所有从业者都使用此定义。例如，LMS Research在其电子书"在离散制造中锻造数字孪生"中指出：

"虽然我们看到许多"数字孪生"的定义，LMS Research 保持简单：数字孪生是物理事物或系统的可执行虚拟模型。

这个定义只是重新命名已经存在多年的技术，导致许多工程师想知道为什么他们已经成功地采用了几十年的做法，现在是一个新的和充满活力的事情。

数字孪生中使用的模型不必是数据驱动模型，但它应产生等效于测量值的结果（以便模型更新过程由数据驱动），并且模型很可能将其他测量值作为边界条件、负载或材料属性。在本文的后面将更详细地讨论了数字孪生模型的关键特征。

使用不断发展的数据意味着数字孪生方法的一个关键优点是，它提供了对随着时间变化的对象的准确描述。经验证的模型可以提供特定时刻对象行为的快照，但在数字孪生中使用该模型可以将该模型的使用扩展到对象及其行为将发生重大变化的时间尺度。

上述部分的关键方面之一是数字孪生必须与实际存在的对象关联：没有物理孪生的数字孪生是一个模型。生物同卵双胞胎是同时产生的，在它们被创造时是相同的，并且它们继续随着发展和年龄的发展而保持一致。两个物体在整个发展和进化过程中保持相似是真正的数字孪生的关键，要使这种相似性成为可能，物理孪生也必须存在。

要求物理对象存在的必然结果意味着，只有达到原型设计阶段，"数字孪生设计"才有意义。在这个阶段，通常的程序是测试原型，并根据结果、工程理解和以前的经验更新设计。数字孪生方法将使用原型中的测试数据更新原型模型中的参数，使用更新的模型预测使用中的性能，然后更新设计。在许多情况下，这为设计过程增加了额外的步骤（模型更新和预测），而无需提供额外的知识。

例外情况是模型和原型不够相似，模型预测不可靠，因此更新原型模型会带来新的知识。原型通常少量制造，因此不太可能受到与大规模制造相关的变异性影响，因此更有可能与模型版本相似。因此，数字孪生在设计中的应用可能会受到相当有限的影响。

对于大多数高价值工程应用，数字孪生适合的宏伟愿景是支持数字的供应链，可以将供应商数据、内部测试结果以及在线和离线测量结果输入数字孪生产品，从而根据最新数据获得快速性能预测，如下图所示。对于其他应用，实时方面不太关键（或实时意味着小时而不是秒），但随着现实的变化而发展模型并以高度的信心做出预测的能力仍然有益处。‌

NPL（国家物理实验室）是英国国家测量研究所，负责实现和传播 SI 单位。NPL在测量、建模、不确定性评估和数据分析方面的专业知识意味着其在促成数字孪生的关键领域拥有丰富的经验。NPL的目标是确保测量结果可追溯和可靠，并确保模型经过验证和验证，并使用适合数据特性的可靠方法进行更新，从而支持对数字孪生数据智能和有效使用的信心。

2、我需要数字孪生吗？

当对象随时间变化时，数字孪生最有用，因为变化会使对象的初始模型失效，可以捕获与此更改相关的测量数据。这些变化可能是不可获取的，例如轴承磨损或金属部件疲劳，或者它们可能是中性的，但很重要，例如供应材料特性的变化。如果对象随时间变化不大，或者无法捕获与此更改相关的数据，则数字孪生不太可能有用。

数字孪生概念在制造中如此有价值的原因之一是，它允许在统一的框架内开发单个对象的单个模型，使模型开发、验证和更新变得简单。在制造和服务期间，可针对许多应用使用单独定制的模型，包括：

增强的在线测量过程，使用模型识别最能提高物理实体理解的数据，
智能装配，确保选择单个部件以实现最佳性能，并降低报废率，
装配验证，使内部细节不易访问的复杂多组件结构能够使用装配外表面的测量，以提供对内部结构正确部署的信心，
性能保证，以检查任何测量偏离产品规格不会损害性能到不可接受的程度，
维护调度和智能维护，通过使用孪生更新与已知可能故障相关的参数，从而在问题变得灾难性之前识别问题，
终身预测，包括在服务中修改组件或系统寿命估计的能力。

这些应用与复杂的多组件组装对象以及某些单独组件或材料价格足够昂贵的产品特别相关，减少废料是一个重要驱动因素。在产品层面，如果性能或外观的某种程度的产品变异是可以接受的，在已经制定了可靠的质量控制程序，或者返工和报废成本不高的情况下，这种方法的相关性较小。

展望制造业之外，数字孪生概念在医学方面具有显著优势。能够定制药物特征、植入物和假肢几何形状，以及根据患者个人需求进行治疗规划，将带来更高效、更有效的治疗，减少副作用，并相关改善健康结果。例如，根据患者的反应定制药物剂量或成分，监测假肢以检测损伤和磨损，以及适应放射治疗，使治疗能够适应内部解剖变化和患者反应的时间变化。

数字孪生也可以有利于基础科学。科学设备具有影响实验结果的特性。这些特征可能会随着时间而改变，可能难以直接评估。数字孪生方法可以确保与实验结果相关的不确定性可以包括这些特征的正当贡献。对科学结果的可靠解释需要了解与实验结果相关的不确定性，使用数字孪生可以提供这些不确定性的准确估计和识别方法。

这种类型的设备的一个例子是Kibbl平衡。Kibble 平衡是继 2019 年 5 月 20 日重新定义部分 SI 基单位之后，用于实现 SI 质量单位（公斤）的实验之一。以前，公斤被定义为在巴黎保存的铂金-虹膜圆柱体的质量，但在 2019 年重新定义后，它现在被定义为 Planck 常数的固定值，并且可以通过任何合适的实验[4]实现。实现通常发生在国家测量研究所（NMI）级别，并通过可追溯链级联到最终用户。简单地说，Kibble平衡将电磁力和引力等同起来，以非常精确的量子电标准[5]来确定质量。

下图显示了与标记的关键组件的Kibble平衡的草图。Kibble 平衡有几个功能将影响其性能。其中包括：

用于测量线圈中的电压和电流的伏表和电阻器的稳定性，
磁铁的场强度随温度和时间的变化，
永磁体产生的磁场内电磁线圈的对齐，
测定线圈位置的干扰仪中使用的光学的对齐和稳定性，
干涉仪中使用的激光频率的稳定性，
由于重力的局部加速度，
空气和地面振动。

通过使用测量过程中收集的所有数据，可以更好地了解这些参数及其随时间的变化，从而优化实验，并导致更准确的不确定性估计，从而有利于整个可追溯链的全球质量测量。Kibble 平衡的数字孪生的主要好处之一是动态评估不确定性，特别是与不确定性相关性。由于存在大约 90 个不确定因素，因此它们之间的相关性在很大程度上被忽略，或者最多估计非常大致。

更广泛地，数字孪生理念可以应用在比个别产品更高的水平。特定产品体积过大而不值得单独孪生的行业可以在工厂一级从孪生中受益。这种双层管理能够管理库存、维护、轮班模式和调度，通过最大限度地减少停用时间和浪费来优化生产效率。此类应用程序中使用的模型通常是实证模型，而不是基于物理的模型。使用实时数据为这些模型提供信息，可以改进这些模型的参数的确定，并确定参数何时变化，从而可以提前警告维护需求。

制造业的进一步可能性是使用数字孪生来监控供应链。例如，如果可以开发一个模型，将制造中使用的原材料的机械特性与最终产品质量联系起来，则可以使用产品的质量评估数据来估计这些特性。然后，这些估计值可能用于调整工艺设置以提高质量，并向材料供应商提供反馈。

类似的方法可用于实时管理大型资产，如能源网络，甚至城镇由于传统发电和绿色发电技术（包括国内发电）和储能设施的结合，能源网络变得越来越复杂。随着交通和取暖方法更多地依赖电力，需求状况正在发生变化。许多国家的基础设施老化，不是为这些业务变化设计的。能够平衡供求关系，并避免根据实时数据和网络模型已知脆弱的资产超载，将确保应对这些挑战。对于城市环境而言，增加廉价的空气质量和噪音传感器的可用性，可以使被动交通管理能够减少污染，并且能够根据基础设施管理数据为洪水等事件提供数据驱动的反应性管理，从而可节省大量资金。

城市规模数字孪生的另一个应用是自动系统测试，特别是自动驾驶车辆决策算法的测试。AV 可能遇到的潜在危险场景数量非常大。许多最危险的情况是（幸运地）罕见，因此在正常驾驶期间不太可能遇到这种情况。对所有这些事件进行真实测试的成本高昂、实施可靠性复杂且具有潜在危险性。因此，模拟这些测试的成本效率和安全性要高得多。此应用程序的数字孪生将链接：

真实驾驶环境的准确和可升级模型，包括其他车辆和行人，以及天气和其他大气和环境影响的一些描述，
模拟部署在车辆上的传感器响应的模型，基于这些传感器测试数据的仔细选择，
车辆对驾驶命令响应的模型（如转向变化、制动等），该模型考虑到路面条件，
AV控制算法。

3、数字孪生应该使用什么样的模型？

数字孪生可以使用任何类型的模型，这是一个足够准确的物理对象的孪生体。在理想世界中，计算将是瞬时的，准确性很完美，数字孪生将使用直接从物理学中提取的模型，这些模型将可能影响测量和更新数量的所有现象考虑在内。例如，机床的数字孪生将能够实时模拟金属铣削中涉及的热和机械过程，并根据对部分温度和形状的实时测量更新有关工具磨损的知识，从而使工厂维护变得更加积极主动和高效。

高精度计算成本的障碍并不意味着基于物理的方法，如有限元建模和计算流体动力学，应该完全放弃。数字孪生的某些应用不需要高速计算，因为孪生体要更新的时间框架是小时而不是几秒钟。一个例子是海上风电场中风力涡轮机的数字孪生体。如果双胞胎被用来安排预防性维护，那么做出决策的时间尺度很可能是小时或数天，而不是几秒钟，因此基于物理的建模是可行的。同样，喷气发动机的数字孪生体在飞机飞行时可能能够使用起飞数据进行更新，从而在适当的时间范围内做出维护决策。

数字孪生的某些应用程序可以使用结构或对象的关键部分的本地模型，而不是考虑完整的系统。这些模型可以定义为包括直接受要更新的参数影响的区域，以及周围结构的其他部分，用适当的边界条件替换计算域的某些部分或将元素近似置之以法。一个例子是飞机起落架的数字孪生。该模型不需要包括整个飞机的全空气动力学模型。

在其他情况下，如果问题不能轻易地简化为子模型，可以使用高精度物理模型在物理对象的已知操作参数范围内生成一组可靠的结果，并且可以根据这些结果构建代孕模型或元模型。代孕模型是一个简化模型，通常是数据驱动的，而不是基于物理的，运行速度比完整的物理模型快，因此可用于更快地生成更新的参数估计和相关的不确定性。代孕模型的准确度将低于基于物理的模型，但如果精度水平已知，并且理想情况下，如果操作参数接近其封装的边缘，则在根据数字孪生做出决策时可以考虑精度损失。

也可以构建一个纯数据驱动的模型，作为数字孪生的核心。由于几个原因，这种方法往往不可取。最明显的是，数据驱动模型仅在输入参数空间区域内可靠，用于构建模型的数据来自该区域。使用数据驱动的模型进行外推而不根据物理知识施加任何限制是一种危险的方法。

一般来说，数字孪生的模型应该是：

基于足够的物理基础，根据测量数据更新模型中的参数是一件有意义的事情，
足够准确，更新的参数值将有利于应用利息
足够快地运行有关应用程序的决定可以在所需的时间范围内作出。

如前一节所述，满足这三个标准的模型的可用性对哪些应用程序最能从数字孪生中受益有重大影响。这些标准还影响基于物理的数字孪生模型与其他目的的物理模型不同的方式，例如安全验证或性能建模，高精度可能比短期更重要，因为模型具有安全关键性，但运行频率较低。在许多情况下，设计阶段使用的模型很可能被重复用于孪生（经过一些适应后），因为它们通常在子系统级别开发，并用于快速设计迭代。所需的主要适应通常是将参数的模型纳入随着时间而变化的模型中，除非相关现象在设计阶段已经模拟。

4、还需要做什么？

上述数字孪生最有可能的应用都是高价值或安全关键。因此，能够相信数字双胞胎的预测是非常重要的。此要求还意味着还必须信任数据、信任模型和信任更新过程。

信任模型需要验证和验证程序。虽然这是一个成熟的领域，最佳实践是可用的，但仍然存在悬而未决的问题。许多数字孪生有价值的工程应用需要一系列联动模型，例如发动机可能需要热流、流体流和应力模型。以完全耦合的方式解决此类模型通常计算成本高昂，尤其是因为不同的分析需要在不同位置进行网格优化。按顺序解决它们通常需要使用一个模型的结果作为另一个模型的输入，可能需要插值和处理结果，并引入验证需要考虑的进一步错误和近似值。

另一个复杂因素是，不确定性的存在意味着验证（与现实相比）需要被视为一个统计过程。所有测量都要求相关的不确定性是有意义的。此要求意味着模型输入、因此模型输出和验证数据都存在相关的不确定性，因此，将数据与模型结果进行比较应生成对值一致概率的估计，而不是使用"5% 错误足够好"的方法。

不确定性评估还有助于更好地了解模型结果中可以信任多少。这种信任对于包含无法独立确定的参数的模型尤其重要。这些模型正是数字孪生概念非常有用的案例：它允许你直接估计无法测量的内容，从而改进模型。

有许多出版物提供不确定性评估的介绍和指导。示例包括

来自NAFEMS的出版物，特别是来自Stochastics工作组的出版物
测量中不确定性表达指南 [GUM] 及其附件可免费下载。特别是第1补充第6节就将输入分配分配给各种信息的数量提供建议，
最佳实践指南侧重于与计算昂贵问题的不确定性评估相关的挑战。

传感器收集的数据的信任可以通过将元数据与数据关联来部分解决。元数据（"有关数据的数据"）捕获了测量过程中可能影响数据可靠性和未来可用性的方面，例如：

传感器类型和功能（精度、标准不确定性、已知对环境的敏感性等），
上次传感器校准日期和任何其他可追溯性信息，
操作员（如果相关），
数据收集时间，
传感器位置等。

要使元数据得到最大程度的使用，元数据标准需要跨行业通用，因为大多数类型的传感器都用于多个行业。元数据在使用精心策划的历史数据方面也发挥着关键作用。元数据结构（"本体论"）对进行数据搜索的便利性有很强的影响，特别是对于具有多个元数据级别的数据集。有效执行此类搜索的能力支持了将收集在时间和空间不同点但与单个对象相关的数据集合并的能力，而该任务对于有效使用数字双胞胎至关重要。这种可搜索性也是产品故障时数据重复使用和数据可追溯性的关键。

NPL 的数据科学小组正在努力开发元数据协议，以确保数据具有与之相关、结构适当的信息。这项工作以数据固化的"可查找性、可访问性、互操作性和可重复使用性"（FAIR）原则为起点，并确定了需要特别考虑的测量数据的独特要求。

目前由欧盟资助的两个以计量为重点的项目正在解决在制造环境中将校准和不确定性信息定义为元数据的必要性，从而增强对数据的信任度。 "未来工厂的计量学"项目正在开发数字工业传感器的校准方法，并将建立必要的基础设施和软件，以考虑到测量不确定性和质量以及测量数据。"IoT-网络智能数据的通信和验证"补充项目正在定义用于测量相关数据的安全传输和明确解释的数字格式，并正在为联网测量设备开发安全的数字校准证书，以便校准变得更加简单。

还应考虑数据的详细信息以及它们与模型的关系。数字孪生的数据集需要超越几何形状、材料属性、边界条件和负载定义所需的范围，以及模型验证所需的范围。双开发过程需要识别一组模型参数，这些模型参数在制造或使用过程中可能鲜为人知或可能发生变化，并且数据需要足以更新这些参数。例如，发电站的模型可能包括各种涡轮机的效率曲线，这些曲线可能会随着涡轮机老化而变化。使用实时功率和角度速度数据更新效率曲线的估计值可以支持智能维护并缩短工厂停机时间。

传感器成本低，易于访问云存储，导致大量收集超大型数据集。这些集通常由来自不同类型的多个传感器的数据组成，这些传感器以短时间间隔收集。在数字孪生中使用此类数据集的挑战在于确定哪些测量在哪些位置或时间对双胞胎中要更新的参数影响最大。数据减少技术为应对这一挑战提供了一种方法。最简单的方法是单值分解，这需要连接数据和参数的模型的线性，但有效的数据减少方法是当前研究的生动领域，以及处理具有各种数据结构的非线性和瞬态模型的新技术。

更新模型的最佳流程选择取决于用于更新模型的数据的大小以及可用于更新的参数数量。如果只使用少量参数，那么简单的优化方法可能是合适的。对于更多的参数，数据同化可能更合适。数据同化方法广泛应用于气象学，其中系统初始条件仅大致为已知，如果初始条件随着数据的提供而更新，则可以获得更好的预测。

在许多情况下，与这些大型多物理模型复杂的系统相关的计算费用意味着不可能实现有效过程控制所需的实时更新。同样，如上所述，计算费用可能使完全的不确定性评估过于耗时。对于这些情况，用运行速度更快的近似模型替换计算成本高昂的模型可以使这些挑战更容易解决。这种模型被称为代孕模型或元模型。

从消防安全到添加剂制造等一系列应用中，代理模型开发的一种技术是高斯工艺建模，也称为 kriging。此技术要求用户在输入量的一组已知值（称为训练集）中拥有一组完整模型的结果。该技术使用相关函数构建一个模型，该模型使用相关函数来插值这些点的结果，该函数有效地假设类似的输入量值将导致类似的模型结果，从而使两个点在输入量空间中越接近，它们之间的相关性就越强。这种方法相当普遍，只要模型大致连续，并且为不同目的开发了各种相关函数。另一个优点是，当代孕模型在一组输入值上进行评估时，如果完整的模型结果未知，它返回这些值的模型结果的估计值和与该估计相关的误差估计值。错误估计意味着很容易识别输入空间的区域，知道模型结果通过减少错误最多来增加最大的好处，因此代孕模型可以反复开发。

一个简单的例子显示在下图中。左手图显示了训练数据集（黑点）和相关元模型（彩色表面）预测的值。右手图显示相关错误估计值。元模型插值培训数据，此时错误估计值也是零，但误差估计值在距离培训数据集更远的地方更大，可确定进一步训练数据可以减少误差的区域。

提高基于偏微分方程模型计算效率的另一种方法是应用模型订单减少（MOR）方法。该方法旨在根据少量功能或"模式"来描述系统的特点。该方法类似于 Fourier 系列分解时间依赖信号作为正弦和余弦的总和。更先进的 MOR 技术可以包括关键参数作为对减少订单模型的输入，使模型更新更简单。

5、结论

数字孪生的概念汇集了现有的几项成熟技术。随着潜在用户对营销流行语产生反感，该术语的过度使用可能导致技术使用不足。

本文讨论了"普通"模型与数字双胞胎的区别，强调了数字孪生可以带来真正益处的一些应用，并确定了仍需要研究的领域。成功部署数字孪生将需要信任模型、信任数据以及信任用于基于数据更新模型的算法。一旦这些要素到位，我们就可以对使用该技术做出的决定充满信心。

原文链接：How to tell the difference between a model and a digital twin

BimAnt翻译整理，转载请标明出处