21.2. 有限元方法#

../../_images/animation-elastomers-tetrahedron.png — 图 21.7 一个正四面体形状的弹性体被离散化成弹簧质点系统，其底面三个黑色顶点固定，顶部蓝色顶点受到向下的力 \(\boldsymbol F\) 的作用。#

弹簧质点系统给出了一个对弹性物体十分简单的建模，在一定范围内的形变下能够较好地模拟出弹性的动态；然而对于一些较为极端的情形，它将会产生错误的结果。我们以一个体积很小的弹性正四面体为例，其底面固定，一较大的向下的外力 \(\boldsymbol F\) 作用于四面体的顶部。如图 21.7 所示，在弹簧质点系统下这个正四面体会自然地被空间离散化成四个处于顶点处、由弹簧两两连接的质点，每根弹簧的原长为正四面体的边长 \(l\)，劲度系数为 \(k\)；底面的三个质点（图 21.7 中的黑色顶点）固定，顶部的质点（图 21.7 中的蓝色顶点）受到力 \(\boldsymbol F\) 的作用。这个场景的动态如图 21.8 所示：初始时四面体静止，顶部质点只受到 \(\boldsymbol F\) 的作用开始向下运动；随后由于顶部质点所连接的三根弹簧被压缩，顶部质点还会受到三根弹簧的弹力，由于是正四面体，三个弹力的合力向上，这也符合弹性体总是倾向于恢复原状的性质；但是三根弹簧的合力大小存在上界，当 \(\Vert\boldsymbol F\Vert>3kl\)（即 \(\boldsymbol F\) 的大小比三根弹簧压缩至 \(0\) 长度的弹力总和还大）时，顶部质点的合力一直向下，从而会一直加速向下运动，即便整个四面体已经被完全压扁乃至反向；在四面体反向后更严重的问题发生了，此时弹簧的合力朝下，也就是说即便撤掉力 \(\boldsymbol F\)，四面体也不会恢复至原状。

../../_images/animation-elastomers-tetrahedron_a.png — 图 21.8 正四面体弹簧质点系统的动态#

../../_images/animation-elastomers-tetrahedron_b.png — 图 21.8 正四面体弹簧质点系统的动态#

这个例子告诉我们弹簧质点系统只能模拟一个弹性的“框架”，而在生活中常见的弹性体通常是具有一定体积的连续物体，所以不应当出现上述被完全压扁至 \(0\) 体积的情况；即便是在一些极端的数值条件下出现了体积翻转的情况，弹性力也应当趋向于恢复成体积翻转前的原本形状。

有限元方法就具备这样的性质，它将一个物体空间离散化成四面体网格，每个最小模拟单元不再是弹簧与质点，而是单个四面体；每个四面体无缝拼接在一起，形成一个占有一定体积的连续形状，从而能够更加贴近现实中弹性体的行为。但是这样的模型也会更加的复杂，我们需要了解更多的物理背景才能够正确地借助这个模型进行模拟。

21.2.1. 物理模型#

在本章中，我们需要借助连续介质力学（continuum mechanics）中的一些概念来刻画弹性体的物理动态。在接触一个新的力学分支时，我们应当先了解它的语言，理解它描述各种力学概念的方式，随后才能够应用它完成我们想要的任务。对于弹性体来讲，我们先从其运动学开始，理解如何描述一个弹性体的形变；随后再进入到动力学，从弹性体的能量到它的内力；再将二者联系起来，从而理解力如何影响弹性体的运动。

21.2.1.1. 描述形变#

在弹簧质点系统中，我们通过记录每个质点的位置来描述弹性体的当前形状；但对于一个连续介质，存在不可数个质点，因此我们也应当将形变的描述方式拓展成场，将未形变状态下每一个点的位置都映射成形变后的位置。具体来讲，我们首先将未形变的弹性体放置于一个空间坐标系当中，并记其所占据的空间区域为 \(\Omega\)，这个区域又称为参考构型（reference configuration）；我们记参考构型内的点为 \(\boldsymbol X\)，该点在形变后的位置为 \(\boldsymbol x\)，定义变形函数（deformation function）

(21.17)#\[\begin{split} \boldsymbol\phi:\Omega&\to\mathbb R^3\\ \boldsymbol X&\mapsto\boldsymbol x \end{split}\]

即为对弹性体形变的描述。

../../_images/animation-elastomers-deform_map.png — 图 21.9 参考构型 \(\Omega\)、形变前位置 \(\boldsymbol X\)、形变后位置 \(\boldsymbol x\) 与变形函数 \(\boldsymbol\phi\) 的关系#

变形函数 \(\boldsymbol\phi\) 确实能够充分地表示出弹性体的形变，但作为一个全局的信息表示，它包含了过多的信息。我们马上就会看到，弹性体每一个点的能量与内力只由其局部的形变所决定。因此，在连续介质力学中会引入形变梯度（deformation gradient）的概念，形变梯度一般记为 \(\boldsymbol F\)，其定义为变形函数 \(\boldsymbol\phi\) 关于形变前位置 \(\boldsymbol X\) 的雅可比矩阵：

(21.18)#\[\begin{split} \boldsymbol F\mathrel{\mathop:}=\frac{\partial(\phi_x,\phi_y,\phi_z)}{\partial(X,Y,Z)}=\begin{bmatrix}\frac{\partial\phi_x}{\partial X}&\frac{\partial\phi_x}{\partial Y}&\frac{\partial\phi_x}{\partial Z}\\\frac{\partial\phi_y}{\partial X}&\frac{\partial\phi_y}{\partial Y}&\frac{\partial\phi_z}{\partial Z}\\\frac{\partial\phi_z}{\partial X}&\frac{\partial\phi_z}{\partial Y}&\frac{\partial\phi_z}{\partial Z}\end{bmatrix}， \end{split}\]

其中 \(\boldsymbol\phi(\boldsymbol X)=\begin{pmatrix}\phi_x&\phi_y&\phi_z\end{pmatrix}^\top\)，\(\boldsymbol X=\begin{pmatrix}X&Y&Z\end{pmatrix}^\top\)。我们知道导数可以很好地反映原函数的局部特征，所以在连续介质力学中形变梯度是最常用也最直观的刻画弹性体形变的量之一，变形函数反而没有那么重要。

注意

由式 (21.18) 可见，形变梯度 \(\boldsymbol F\) 是一个关于形变前坐标 \(\boldsymbol X\) 的矩阵函数。
在本章的后续内容中，我们将继续使用不加粗的 \(x,y,z\) 和 \(X,Y,Z\) 分别表示形变后和参考构型下的坐标分量。

21.2.1.2. 描述能量#

弹性体的形变会累积弹性势能，在连续介质力学中又称为应变能（strain energy）。由于总能量完全由弹性体的形变决定，我们可以将应变能表示成变形函数的泛函 \(E[\boldsymbol\phi]\)。值得注意的是，在这种表示中，应变能的值仅与弹性体的最终形变有关，和弹性体的变形路径（或历史时刻的形变）无关，也即弹性力是保守力（conservative force）。这个性质是超弹性（hyperelastic）材料的特性，在本章中我们只会讨论这一种材料的模拟。

一般来讲，弹性体不同位置的材料会有不同的形变，因此为了准确描述每一处材料的动态，我们应当把能量定义在局部范围上。与变形函数的定义类似，我们定义一个以参考构型下的位置为自变量的能量密度函数 \(\Psi[\boldsymbol\phi;\boldsymbol X]\)，其含义为单位体积未形变材料所蕴含的应变能。将能量密度在参考构型上积分即可得到应变能：

(21.19)#\[ E[\boldsymbol\phi]=\int_\Omega\Psi[\boldsymbol\phi;\boldsymbol X]\mathrm d\boldsymbol X。 \]

注意

我们现在没有给出能量密度 \(\Psi\) 的具体形式，只描述了能量由什么决定。事实上，\(\Psi\) 的形式有多种，对应于不同性质的弹性材料，§21.2.1.5 将会给出一些常见的形式。

下面我们考虑参考构型下一个特定位置 \(\boldsymbol X_0\) 的能量密度 \(\Psi[\boldsymbol\phi;\boldsymbol X_0]\)。由于能量密度是一个局部的物理量，它应当只与 \(\boldsymbol X_0\) 附近一个无穷小的邻域形变后的状态相关，在 \(\boldsymbol X_0\) 处 \(\boldsymbol\phi(\boldsymbol X)\) 进行一阶泰勒展开

(21.20)#\[\begin{split} \boldsymbol\phi(\boldsymbol X)&\approx\boldsymbol\phi(\boldsymbol X_0)+\frac{\partial\boldsymbol\phi}{\partial\boldsymbol X}(\boldsymbol X_0)(\boldsymbol X-\boldsymbol X_0)\\ &=\boldsymbol x_0+\boldsymbol F(\boldsymbol X_0)(\boldsymbol X-\boldsymbol X_0)\\ &=\boldsymbol F(\boldsymbol X_0)\boldsymbol X+\boldsymbol x_0-\boldsymbol F(\boldsymbol X_0)\boldsymbol X_0， \end{split}\]

其中，\(\boldsymbol x_0=\boldsymbol\phi(\boldsymbol X_0)\) 为其大写字母符号对应的形变后位置，本章中将继续遵循这个命名习惯。令 \(\boldsymbol F_0=\boldsymbol F(\boldsymbol X_0)\)（这个命名习惯也会在本章中继续使用），\(\boldsymbol t=\boldsymbol x_0-\boldsymbol F_0\boldsymbol X_0\)，则式 (21.20) 最终可化为 \(\boldsymbol\phi(\boldsymbol X)\approx\boldsymbol F_0\boldsymbol X+\boldsymbol t\)。这告诉我们参考构型下 \(\boldsymbol X_0\) 周围很小一块区域的形变可以完全由 \(\boldsymbol F_0\) 和 \(\boldsymbol t\) 刻画，而 \(\boldsymbol t\) 仅仅代表这个小区域整体的平移，不会带来任何变形，所以这个小区域的能量应当完全由 \(\boldsymbol F_0\) 决定，也即 \(\Psi\) 能够表示成只关于形变梯度的函数：\(\Psi[\boldsymbol\phi;\boldsymbol X_0]=\hat\Psi(\boldsymbol F(\boldsymbol X_0))\)。为了简便，我们在接下来将使用 \(\Psi(\boldsymbol F)\) 来表示能量密度函数。

21.2.1.3. 描述力#

弹性体积累了弹性势能就会产生弹性力，我们仍然可以借助图 21.1 中的例子来回顾一下势能与保守力之间的关系：当粒子处于位置 \(\boldsymbol x=\begin{pmatrix}x&y&z\end{pmatrix}^\top\) 时，其重力势能为 \(E(\boldsymbol x)=m\boldsymbol{G\cdot x}=mgz\)，其中 \(\boldsymbol G=\begin{pmatrix}0&0&g\end{pmatrix}^\top\) 为重力加速度（取 \(z\) 轴正方向为竖直向上），那么粒子所受重力即为

\[\begin{split} \boldsymbol f_\mathrm{gravity}=-\frac{\partial E(\boldsymbol x)}{\partial\boldsymbol x}=\begin{pmatrix}0\\0\\-mg\end{pmatrix}。 \end{split}\]

由此可见，保守力等于能量的负梯度。在连续介质中，由于存在不可数无穷多个质点，我们同样需要类似能量密度一样定义一个力密度（force density）\(\boldsymbol f(\boldsymbol X)\)，代表单位体积未形变材料所受的力。对于标准构型内的任意有限区域 \(A\subset\Omega\)，其形变后所受力的总和为力密度在 \(A\) 上的积分：

\[ \boldsymbol f_\mathrm{aggregate}(A)=\int_A\boldsymbol f(\boldsymbol X)\mathrm d\boldsymbol X。 \]

然而，只定义这样一种力密度不足以描述一个弹性体的全部受力，我们还需要引入牵引力（traction）的概念来描述弹性体表面所受的力。牵引力 \(\boldsymbol\tau:\partial\Omega\to\mathbb R^3\) 是一个定义在标准构型表面的向量函数，含义是每单位面积未形变材料表面所受的力。对于标准构型边界上任意有限区域 \(B\subset\partial\Omega\)，其形变后所受的表面力为牵引力在 \(B\) 上的积分：

\[ \boldsymbol f_\mathrm{aggregate}(B)=\oint_S\boldsymbol\tau(\boldsymbol X)\mathrm dS。 \]

我们为什么要将弹性体的力密度与表面受力分开表示呢？读者不难注意到，牵引力的单位是牛顿每平方米，而力密度的单位是牛顿每立方米，也就是说牵引力带来的力是远比力密度带来的大。这也是弹性体常见的受力情况——表面的受力要远大于内部的受力，如果我们仅使用力密度来描述整个弹性体的受力的话，那么表面处的力密度将会变成无穷大，这样在计算上就没有意义了。因此，为了弥补定义上的缺陷，我们额外引入牵引力来描述弹性体表面所受的力，这样一来力密度和牵引力就都是有限函数了。

但仅到这里还不能解开读者所有的疑惑——为什么弹性体表面的受力和内部受力会有这么大差别呢？如图 21.10 所示，我们在弹性体的内部取一点 \(P_1\)，表面处取一点 \(P_2\)，然后考察两点附近小邻域的受力：它们都会受到来自周围材料的弹性力，而区别在于内部点 \(P_1\) 受到的力是来自四面八方的，几乎能够完全抵消；\(P_2\) 由于处在表面，有一侧没有材料，所以只会受到单侧的弹性力，形成一种“强烈”的不平衡状态。这就是为什么表面受到的力一般会远大于内部受到的力。

../../_images/animation-elastomers-interior_surface.png — 图 21.10 内部与表面处受力的区别#

21.2.1.4. 能量与力的关系#

在 §21.2.1.3 的开头我们回顾了质点重力场中能量与力的关系，但是对本章讨论的弹性体而言情况会更加复杂一些，我们不能直接建立能量密度 \(\Psi\) 与力密度 \(\boldsymbol f(\boldsymbol X)\) 和牵引力 \(\boldsymbol\tau(\boldsymbol X)\) 之间的关系。幸运的是，这个关系可以通过引入一个中间变量建立起来，这个中间变量叫做第一类皮奥拉-基尔霍夫应力张量（first Piola-Kirchhoff stress tensor），一般记作 \(\boldsymbol P\)。接下来我们不加证明地给出 \(\boldsymbol P\) 的性质，对更深层原理感兴趣的同学可以参考 [SB12]。

首先，我们可以通过能量密度 \(\Psi\) 计算 \(\boldsymbol P\)：

(21.21)#\[ \boldsymbol P=\frac{\partial\Psi(\boldsymbol F)}{\partial\boldsymbol F}。 \]

边界上的牵引力 \(\boldsymbol\tau\) 与 \(\boldsymbol P\) 具有如下的关系：

\[ \boldsymbol\tau(\boldsymbol X)=-\boldsymbol P\cdot\boldsymbol N,\quad\forall\boldsymbol X\in\partial\Omega， \]

其中 \(\boldsymbol N\) 为 \(\boldsymbol X\) 处形变前物体的表面法向，这里的点乘就是矩阵乘法。

另外，力密度 \(\boldsymbol f\) 与 \(\boldsymbol P\) 具有如下的关系：

\[ \boldsymbol f(\boldsymbol X)=\mathrm{div}\boldsymbol P(\boldsymbol X)， \]

写成分量形式就是（省略自变量 \(\boldsymbol X\)）

\[ f_i=\sum_{j=1}^3\frac{\partial P_{ij}}{\partial X_j}。 \]

21.2.1.5. 常见超弹性模型#

前面的讨论中我们给出了弹性体的形变、能量和应力之间的关系，但是我们还没办法计算一个弹性体的具体受力情况。事实上，我们只需要知道能量密度 \(\Psi(\boldsymbol F)\) 的具体表达式即可进行计算，每一种能量密度的具体形式对应于一种本构模型（constitutive model），它充分描述了弹性体的全部力学性质。在本节，我们将给出一些常见超弹性模型的能量密度的具体形式，并且为了避免每次都计算一遍矩阵求导，我们会同时给出 \(\boldsymbol P\) 的表达式。

21.2.1.5.1. 线性模型#

正常来讲，能量密度的具体形式应当是 \(\boldsymbol F\) 的表达式。但是我们往往难以直接使用 \(\boldsymbol F\) 的元素直接描述出形变与力的关系，而是需要借助一些中间变量。现在我们介绍其中一种中间变量——格林应变张量（Green strain tensor），定义如下：

(21.22)#\[ \boldsymbol E=\frac 12\left(\boldsymbol F^\top\boldsymbol F-\mathbf I\right)。 \]

格林应变张量具有一些良好的性质，使其能够较好地反映出弹性形变的程度。当弹性体只经历了刚性运动时，其变形函数为 \(\boldsymbol\phi(\boldsymbol X)=\boldsymbol{RX}+\boldsymbol t\)，其中 \(\boldsymbol R\) 为旋转矩阵，\(\boldsymbol t\) 为平移向量，则 \(\boldsymbol F=\boldsymbol R\)，此时格林应变张量为 \(\boldsymbol E=\frac 12\left(\boldsymbol R^\top\boldsymbol R-\mathbf I\right)=\mathbf 0\)——这表明格林应变张量不会受刚性运动的影响，又称为刚性运动下的不变量（invariant）。对于更一般的形变，我们可以将形变梯度进行极分解 \(\boldsymbol F=\boldsymbol{RS}\)，表示成旋转矩阵 \(\boldsymbol R\) 和对称矩阵 \(\boldsymbol S\) 乘积的形式，那么格林应变张量可化为

(21.23)#\[ \boldsymbol E=\frac 12\left(\boldsymbol S^\top\boldsymbol R^\top\boldsymbol{RS}-\mathbf I\right)=\frac 12\left(\boldsymbol S^2-\mathbf I\right)。 \]

这表明格林应变张量只和形变梯度的对称因子 \(\boldsymbol S\) 有关，而 \(\boldsymbol S\) 中包含了拉伸、剪切这些真正导致弹力的信息。

但是，格林应变张量也存在缺点——关于 \(\boldsymbol F\) 非线性，相比线性能量形式的本构模型而言，这会加大模拟的计算量。因此，为了解决这个问题，我们引入一个 \(\boldsymbol E\) 的线性近似作为小应变张量（small strain tensor），其定义如下：

(21.24)#\[ \boldsymbol\epsilon=\frac 12\left(\boldsymbol F+\boldsymbol F^\top\right)-\mathbf I。 \]

关于 \(\boldsymbol\epsilon\) 是 \(\boldsymbol E\) 的线性近似的证明可以参考 [SB12]。借助小应变张量，我们立即可以定义出线性模型的能量密度：

(21.25)#\[ \Psi(\boldsymbol F)=\mu\mathrm{tr}\left(\boldsymbol\epsilon^2\right)+\frac\lambda 2\mathrm{tr}^2(\boldsymbol\epsilon)， \]

其中，\(\mu,\lambda\) 是拉美系数（Lamé coefficients），它们可以通过杨氏模量（Young’s modulus）\(k\) 和泊松比（Poisson’s ratio）\(\nu\) 计算得到：

\[ \begin{array} &\mu=\frac k{2(1+\nu)}，&\lambda=\frac{k\nu}{(1+\nu)(1-2\nu)}， \end{array} \]

其中杨氏模量反应了材料对拉伸的抵抗能力，泊松比反应了材料的不可压性。线性模型的第一类皮奥拉-基尔霍夫应力张量为

(21.26)#\[ \boldsymbol P(\boldsymbol F)=2\mu\boldsymbol\epsilon+\lambda\mathrm{tr}(\boldsymbol\epsilon)\mathbf I。 \]

在线性模型中，虽然应力能够表示成形变梯度的线性函数从而能够快速地模拟，但由于小应变张量 \(\boldsymbol\epsilon\) 对格林应变张量 \(\boldsymbol E\) 在无形变（\(\boldsymbol F=\mathbf I\)）处进行了线性近似，所以只在材料形变很小的情况下才具有较好的性质。当材料形变过大时，\(\boldsymbol\epsilon\) 会与 \(\boldsymbol E\) 相差甚远，从而不再具有 \(\boldsymbol E\) 的忽略刚性运动等性质，模拟会产生错误的结果。

21.2.1.5.2. 圣维南-基尔霍夫模型#

圣维南-基尔霍夫模型（St. Venant-Kirchhoff model）的能量形式就是将式 (21.25) 中的小应变张量替换成格林应变张量：

(21.27)#\[ \Psi(\boldsymbol F)=\mu\mathrm{tr}\left(\boldsymbol E^2\right)+\frac\lambda 2\mathrm{tr}^2(\boldsymbol E)， \]

从而此模型具有格林应变张量的全部良好性质，但它不再是一个线性的本构模型。此模型的第一类皮奥拉-基尔霍夫应力张量为

(21.28)#\[ \boldsymbol P(\boldsymbol F)=\boldsymbol F[2\mu\boldsymbol E+\lambda\mathrm{tr}(\boldsymbol E)\mathbf I]。 \]

圣维南-基尔霍夫模型的一个典型问题在于无法抵抗过强的压缩。当一个该模型的材料从自然状态被压缩时，在刚开始它会产生抗拒压缩、恢复原体积的弹力；但随着压缩的力度逐渐增大、材料的体积逐渐减小，会出现弹力的最大值，此后弹力将逐渐减小；直至整个材料被压缩成一个质点，此时 \(\boldsymbol F=\mathbf 0\)，代入式 (21.28) 得到 \(\boldsymbol P=\mathbf 0\)，所以产生的力密度和牵引力均为 \(\mathbf 0\)；如果力的方向保持不变导致弹性体翻转，则产生出的弹力会试图恢复成翻转的参考构型，类似本章开头提到的弹簧质点系统产生的效果。这样的性质会导致模拟出的弹性体在强力的压缩作用下很容易产生打结、翻转等非物理的现象。

21.2.1.5.3. 共旋转线性模型#

线性模型只能处理微小形变，圣维南-基尔霍夫模型又引入了过多的非线性项从而导致非物理的零应力现象，共旋转线性模型（corotated linear elasticity）的提出就是为了结合二者的设计、避免二者的问题，此模型尽可能地使用形变梯度的线性项去刻画应力，同时采用最少的非线性项来保证刚性运动下的不变性。此模型的能量形式为

(21.29)#\[ \Psi(\boldsymbol F)=\mu\Vert\boldsymbol S-\mathbf I\Vert_\mathrm F^2+\frac\lambda 2\mathrm{tr}^2(\boldsymbol S-\mathbf I)， \]

其中形变梯度的极分解为 \(\boldsymbol F=\boldsymbol S-\mathbf I\)，所以这个模型的能量形式可以完全过滤掉材料的刚体运动，同时相比于式 (21.27)，式 (21.29) 中的能量模型关于 \(\boldsymbol S\) 的次数更低（前者为 \(4\) 次，后者为 \(2\) 次）。此模型的第一类皮奥拉-基尔霍夫应力张量为

(21.30)#\[ \boldsymbol P(\boldsymbol F)=2\mu(\boldsymbol F-\boldsymbol R)+\lambda\mathrm{tr}\left(\boldsymbol R^\top\boldsymbol F-\mathbf I\right)\boldsymbol R。 \]

共旋转线性模型试图找到一个最贴近形变后位置的旋转，并在这个旋转下模仿线性模型的行为，其模拟的计算量介于线性模型与圣维南-基尔霍夫模型之间，并且不会有非物理的零应力现象。

21.2.1.5.4. 新胡克模型#

我们已经知道，圣维南-基尔霍夫模型和共旋转线性模型的能量和力在刚体运动下都不会发生变化，这种性质叫做旋转不变性（rotational invariance）。关于这个名称，由于能量密度的形式 \(\Psi(\boldsymbol F)\) 已经表明了平移下的不变性（形变梯度 \(\boldsymbol F\) 不受材料平移的影响），所以我们只会关注刚体运动中的旋转变换。下面我们给出旋转不变性的数学定义：

Definition 21.1

我们称一个超弹性本构模型是旋转不变的（或具有旋转不变性），当且仅当对于任意旋转矩阵 \(\boldsymbol R\) 和任意形变梯度 \(\boldsymbol F\)，其能量密度函数满足

\[ \Psi(\boldsymbol{RF})=\Psi(\boldsymbol F)。 \]

一个本构模型具有旋转不变性，等价于其能量形式能够表示成形变梯度对称因子的函数，即对于任意形变梯度 \(\boldsymbol F=\boldsymbol{RS}\)，有 \(\Psi(\boldsymbol F)=\Psi(\boldsymbol{RS})=\Psi(\boldsymbol S)\)。显然，圣维南-基尔霍夫模型和共旋转线性模型的能量形式都能够表示成 \(\boldsymbol S\) 的函数。

另外一个形似但不同的概念叫做各向同性（isotropy），它表明一个超弹性材料对任意方向形变的抵抗是同样强的。这个概念只有在研究材料的局部性质时才有意义，因为如果从宏观角度考虑，任意一种材料组成的物体都可以通过巧妙地设计它的形状来使得它在总体上对某个方向的形变与其他方向不同。我们考虑一个体积无限小的球形弹性体，首先将其关于一个过球心的轴进行旋转，然后再对它施加一个特定的形变，各向同性的材料意味着无论第一步的旋转变换如何，最终得到的能量都是相等的。下面我们给出各向同性的数学定义：

Definition 21.2

我们称一个超弹性本构模型是各向同性的，当且仅当对于任意旋转矩阵 \(\boldsymbol R\) 和任意形变梯度 \(\boldsymbol F\)，其能量密度函数满足

\[ \Psi(\boldsymbol{FR})=\Psi(\boldsymbol F)。 \]

图 21.11 旋转不变性与各向同性的区别。考虑一个微小的球体超弹性材料，球心处于原点，设 \(\boldsymbol F=\begin{bmatrix}\frac 12&0&0\\0&1&0\\0&0&1\end{bmatrix}\) 为将材料在 \(x\) 轴方向压缩的形变，\(\boldsymbol R=\begin{bmatrix}0&-1&0\\1&0&0\\0&0&1\end{bmatrix}\) 为将材料绕 \(z\) 轴旋转 \(\frac\pi 2\) 的变换。在旋转不变性的定义中，等式左侧的能量密度是在先进行 \(\boldsymbol F\) 变换、后进行 \(\boldsymbol R\) 变换的形变上度量的，它等于只进行 \(\boldsymbol F\) 变换带来的能量密度，这表明后续进行的旋转变换不会改变能量密度。在各向同性的定义中，等式左侧的能量密度是在先进行 \(\boldsymbol R\) 变换、后进行 \(\boldsymbol F\) 变换的形变上度量的，原本沿 \(y\) 轴分布的材料在第一步旋转之后变成了沿 \(x\) 轴分布，第二步的 \(\boldsymbol F\) 在 \(x\) 轴方向压缩了原先沿 \(y\) 轴分布的材料，而这样带来的能量密度与只进行 \(\boldsymbol F\) 变换的能量密度表明材料沿 \(x\) 轴的抵抗和沿 \(y\) 轴的抵抗相同。#

可以看到 Definition 21.1 和 Definition 21.2 的区别仅仅在于旋转矩阵与形变梯度乘积的次序，但这个细微差别带来的含义是迥然不同的——前者指的是对材料进行旋转不影响能量，后者指的是对形变梯度的方向进行旋转不影响能量，如图 21.11 所示。

在我们身边，各向同性与各向异性的材料随处可见，如图 21.12 所示。金属、橡胶等材料对各个方向的抵抗能力均相同，是典型的各向同性材料。我们每个人身上都有一种很典型的各向异性材料——肌肉，肌肉由多束平行的肌纤维组成，它对平行于肌纤维的形变与垂直方向的形变有着显著不同的响应。其余各向异性的材料还包括木材、碳纤维复合材料等，各向异性的材料一般都在微观结构上具有一定的方向性。

金属——各向同性 — 图 21.12 一些常见的各向同性与各向异性材料 [1]#

橡胶——各向同性 — 图 21.12 一些常见的各向同性与各向异性材料 [1]#

对于同时满足旋转不变性且各向同性的材料而言，对于任意两个旋转矩阵 \(\boldsymbol P,\boldsymbol Q\) 以及任意的形变梯度 \(\boldsymbol F\)，都有 \(\Psi(\boldsymbol{PFQ})=\Psi(\boldsymbol F)\)。那么如果我们对形变梯度进行奇异值分解 \(\boldsymbol F=\boldsymbol{U\Sigma}\boldsymbol V^\top\)，就可以立刻得到 \(\Psi(\boldsymbol F)=\Psi(\boldsymbol\Sigma)\)，也就是说能量密度的形式可以表示成形变梯度所有奇异值的函数。虽然任何一个旋转不变且各向同性的能量形式都能够直接用奇异值表示出来，但是在实践中进行奇异值分解的计算量较大，所以我们会引入一些各向同性不变量（isotropic invariant），这些不变量只和奇异值相关，但无须奇异值分解就能计算出来；用这些不变量定义能量形式，就能够得到一个旋转不变且各向同性的本构模型，同时减少其模拟的计算量。这些不变量分别如下：

(21.31)#\[\begin{split} &I_1(\boldsymbol F)=\mathrm{tr}\left(\boldsymbol\Sigma^2\right)=\mathrm{tr}\left(\boldsymbol F^\top\boldsymbol F\right)，\\ &I_2(\boldsymbol F)=\mathrm{tr}\left(\boldsymbol\Sigma^4\right)=\mathrm{tr}\left[\left(\boldsymbol F^\top\boldsymbol F\right)^2\right]，\\ &I_3(\boldsymbol F)=\det\left(\boldsymbol\Sigma^2\right)=(\det\boldsymbol F)^2。 \end{split}\]

它们的导数分别是

\[ \begin{array} &\frac{\partial I_1}{\partial\boldsymbol F}=2\boldsymbol F，&\frac{\partial I_2}{\partial\boldsymbol F}=4\boldsymbol F\boldsymbol F^\top\boldsymbol F，&\frac{\partial I_3}{\partial\boldsymbol F}=2I_3\boldsymbol F^{-\top}。 \end{array} \]

因此，对于用这些不变量表示的能量形式 \(\Psi(I_1,I_2,I_3)\)，其第一类皮奥拉-基尔霍夫应力张量为

\[ \boldsymbol P(\boldsymbol F)=\frac{\partial\Psi}{\partial I_1}\cdot 2\boldsymbol F+\frac{\partial\Psi}{\partial I_2}\cdot 4\boldsymbol F\boldsymbol F^\top\boldsymbol F+\frac{\partial\Psi}{\partial I_3}\cdot 2I_3\boldsymbol F^{-\top}。 \]

新胡克模型（Neohookean elasticity）就是一个使用各向同性不变量定义能量形式的本构模型，其能量密度为

(21.32)#\[ \Psi(I_1,I_3)=\frac\mu 2[I_1-\log(I_3)-3]+\frac\lambda 8\log^2(I_3)， \]

其第一类皮奥拉-基尔霍夫应力张量为

(21.33)#\[ \boldsymbol P(\boldsymbol F)=\mu\boldsymbol F-\mu\boldsymbol F^{-\top}+\frac{\lambda\log(I_3)}2\boldsymbol F^{-\top}。 \]

从 \(I_3\) 的表达式可以看出，它反映了形变后材料相对形变前的体积大小。当体积被压缩至 \(0\) 时，\(I_3\) 会趋于 \(0\)，则式 (21.32) 中的 \(\log^2(I_3)\) 项会占主导地位，让能量密度趋于正无穷；这样快速增长的能量会让材料对强烈的压缩产生巨大的抵抗，与圣维南-基尔霍夫模型形成了对比。利用这个性质，在模拟高度不可压的弹性体时，第二拉美系数 \(\lambda\) 会非常大，从而式 (21.32) 中的 \(\log^2(I_3)\) 项的权重变大，惩罚形变后的体积变化。与此同时，这个性质也会是此模型的一个缺点，在模拟当中不可避免地会出现一些因数值爆炸或边缘情况导致的体积变零甚至反向的情况（即 \(\det\boldsymbol F\le 0\) 的情况），此时能量形式将不会有定义，所以在实际处理时会将当前形变梯度 \(\boldsymbol F\) 替换为一个最接近的、行列式为一个很小的正值 \(\varepsilon\) 的形变梯度。

21.2.1.5.5. 各种本构模型的比较#

我们小结一下前面介绍的所有本构模型，表 21.1 总结了所有模型的优缺点，在了解每个模型的性质之后我们应当根据模拟的需求适当地选择。

表 21.1 各种本构模型#
名称	\(\Psi\)	\(\boldsymbol P\)	模拟效率	旋转不变性	各向同性	能处理强压缩
线性模型	\(\mu\mathrm{tr}\left(\boldsymbol\epsilon^2\right)+\frac\lambda 2\mathrm{tr}^2(\boldsymbol\epsilon)\)	\(2\mu\boldsymbol\epsilon+\lambda\mathrm{tr}(\boldsymbol\epsilon)\mathbf I\)	高	无	无	否
圣维南-基尔霍夫模型	\(\mu\mathrm{tr}\left(\boldsymbol E^2\right)+\frac\lambda 2\mathrm{tr}^2(\boldsymbol E)\)	\(\boldsymbol F[2\mu\boldsymbol E+\lambda\mathrm{tr}(\boldsymbol E)\mathbf I]\)	低	有	有	否
共旋转线性模型	\(\mu\Vert\boldsymbol S-\mathbf I\Vert_\mathrm F^2+\frac\lambda 2\mathrm{tr}^2(\boldsymbol S-\mathbf I)\)	\(2\mu(\boldsymbol F-\boldsymbol R)+\lambda\mathrm{tr}\left(\boldsymbol R^\top\boldsymbol F-\mathbf I\right)\boldsymbol R\)	中	有	有	否
新胡克模型	\(\frac\mu 2[I_1-\log(I_3)-3]+\frac\lambda 8\log^2(I_3)\)	\(\mu\boldsymbol F-\mu\boldsymbol F^{-\top}+\frac{\lambda\log(I_3)}2\boldsymbol F^{-\top}\)	低	有	有	是

21.2.2. 空间离散化#

我们在前文讲到的所有物理模型都是建立在连续体上的，与弹簧质点系统一样，要使用计算机将这些物理模型模拟出来也需要进行空间离散化。在有限元方法中，一个连续的超弹性材料被表示成一个四面体网格（tetrahedral mesh），即一些紧密相连的四面体组成的图（如图 21.13 所示）。

../../_images/animation-elastomers-hand.png — 图 21.13 一个手形弹性体分别在有限元方法（左）和弹簧质点系统（右）中的离散化#

设四面体网格拥有 \(N\) 个顶点和 \(M\) 个四面体单元，离散化后的弹性体的全部自由度即为所有四面体的顶点，我们记未形变状态下顶点的坐标为 \(\boldsymbol X_1,\cdots,\boldsymbol X_N\)，形变后的顶点坐标为 \(\boldsymbol x_1,\cdots,\boldsymbol x_N\)。利用这些自由度，我们需要构造出一个合适的变形函数 \(\boldsymbol\phi(\boldsymbol X)\)，使其满足 \(\boldsymbol\phi(\boldsymbol X_i)=\boldsymbol x_i,i=1,\cdots,N\)；这样，我们就从离散的定点上定义的变形映射延拓到了一个连续区域内，便可以进一步地计算出形变梯度 \(\boldsymbol F\)，再结合本构模型计算出 \(\Psi\) 和 \(\boldsymbol P\)。但是，在离散意义下，我们并不能简单地使用 §21.2.1.4 中的方法计算到的力密度和牵引力去更新弹性体的状态；因为在离散化之后，我们只能够通过更新这 \(N\) 个顶点的位置来实现弹性体的动态，定义在连续域上的力密度和牵引力就不能直接使用了；我们的方法是利用力密度的积分计算总能量，然后将整个弹性体的质量分配在每个顶点上，每个顶点的受力就变成负能量梯度了。接下来，我们将一一讲述这些步骤。

21.2.2.1. 变形函数的选择#

我们假设每个四面体单元都只能经历线性形变，即在任意一个四面体 \(\mathcal T_i\) 内部，变形函数都是线性函数。因此，整个变形函数 \(\boldsymbol\phi\) 可以表示为一个分段线性函数：

(21.34)#\[ \boldsymbol\phi(\boldsymbol X)=\boldsymbol A_i\boldsymbol X+\boldsymbol b_i,\quad\boldsymbol X\in\mathcal T_i,\quad\quad i=1,\cdots,M， \]

其中 \(\boldsymbol A_i\in\mathbb R^{3\times 3}\) 和 \(\boldsymbol b_i\in\mathbb R^3\) 刻画了第 \(i\) 个四面体经历的线性变换。通过对式 (21.34) 两端关于 \(\boldsymbol X\) 求导，可以得到每个四面体内的形变梯度：

\[ \boldsymbol F(\boldsymbol X)=\boldsymbol A_i,\quad\boldsymbol X\in\mathcal T_i,\quad\quad i=1,\cdots,M， \]

因此在后文我们记四面体 \(i\) 的形变梯度为 \(\boldsymbol F_i\)，式 (21.34) 又可以写为

(21.35)#\[ \boldsymbol\phi(\boldsymbol X)=\boldsymbol F_i\boldsymbol X+\boldsymbol b_i,\quad\boldsymbol X\in\mathcal T_i,\quad\quad i=1,\cdots,M。 \]

21.2.2.2. 形变梯度的计算#

接下来的目标就是将式 (21.35) 中的 \(\boldsymbol F_1,\cdots,\boldsymbol F_M\) 计算出来。对于一个四面体 \(i\)，我们可以通过它四个顶点形变前和形变后的位置列出如下的方程：

\[\begin{split} \begin{cases} \boldsymbol x_i^1=\boldsymbol F_i\boldsymbol X_i^1+\boldsymbol b_i\\ \boldsymbol x_i^2=\boldsymbol F_i\boldsymbol X_i^2+\boldsymbol b_i\\ \boldsymbol x_i^3=\boldsymbol F_i\boldsymbol X_i^3+\boldsymbol b_i\\ \boldsymbol x_i^4=\boldsymbol F_i\boldsymbol X_i^4+\boldsymbol b_i \end{cases}， \end{split}\]

其中 \(\boldsymbol X_i^{1,2,3,4}\) 代表四面体 \(i\) 的四个顶点在参考构型下的位置，\(\boldsymbol x_i^{1,2,3,4}\) 代表四个顶点形变后的位置。通过等式的作差我们可以将此方程组中不关心的未知量 \(\boldsymbol b_i\) 去掉：

\[\begin{split} \begin{cases} \boldsymbol x_i^1-\boldsymbol x_i^4=\boldsymbol F_i(\boldsymbol X_i^1-\boldsymbol X_i^4)\\ \boldsymbol x_i^2-\boldsymbol x_i^4=\boldsymbol F_i(\boldsymbol X_i^2-\boldsymbol X_i^4)\\ \boldsymbol x_i^3-\boldsymbol x_i^4=\boldsymbol F_i(\boldsymbol X_i^3-\boldsymbol X_i^4) \end{cases}。 \end{split}\]

这三个等式又可以写成矩阵形式

(21.36)#\[ \boldsymbol D_\mathrm s=\boldsymbol F_i\boldsymbol D_\mathrm m， \]

其中 \(\boldsymbol D_\mathrm s=\begin{bmatrix}x_i^1-x_i^4&x_i^2-x_i^4&x_i^3-x_i^4\\ y_i^1-y_i^4&y_i^2-y_i^4&y_i^3-y_i^4\\ z_i^1-z_i^4&z_i^2-z_i^4&z_i^3-z_i^4\end{bmatrix}\) 为变形形状矩阵（deformed shape matrix），\(\boldsymbol D_\mathrm m=\begin{bmatrix}X_i^1-X_i^4&X_i^2-X_i^4&X_i^3-X_i^4\\ Y_i^1-Y_i^4&Y_i^2-Y_i^4&Y_i^3-Y_i^4\\ Z_i^1-Z_i^4&Z_i^2-Z_i^4&Z_i^3-Z_i^4\end{bmatrix}\) 为参考形状矩阵（reference shape matrix）或材料空间形状矩阵（material-space shape matrix），因为我们称形变后的空间为材料空间。值得注意的是，这里的 \(\boldsymbol D_\mathrm s\) 和 \(\boldsymbol D_\mathrm m\) 都是和四面体有关的，为了符号简便我们省略了 \(i\) 这个角标。

由式 (21.36) 我们可以立刻计算出形变梯度矩阵：

(21.37)#\[ \boldsymbol F_i=\boldsymbol D_\mathrm s\boldsymbol D_\mathrm m^{-1}。 \]

虽然这里需要求矩阵的逆，但是由于 \(\boldsymbol D_\mathrm m\) 只与弹性体的参考构型有关，我们可以将它们的逆提前计算好并存储下来，从而不需要在模拟过程中额外计算。

21.2.2.3. 能量与力的计算#

其实，在我们选择好变形函数之后，就能够通过式 (21.19) 得到离散化后的能量了：

(21.38)#\[ E=\int_\Omega\Psi(\boldsymbol F(\boldsymbol X))\mathrm d\boldsymbol X=\sum_{i=1}^M\int_{\mathcal T_i}\Psi(\boldsymbol F_i)\mathrm d\boldsymbol X=\sum_{i=1}^MW_i\Psi(\boldsymbol F_i)， \]

其中 \(W_i=\frac 16\vert\det\boldsymbol D_\mathrm m\vert\) 为标准构型下四面体 \(\mathcal T_i\) 的体积，与 \(\boldsymbol D_\mathrm m\) 一样，它也是一个可以提前计算好的量。

提示

我们知道，四面体的体积等于底面积乘以高的三分之一。因此对于四面体 \(\mathcal T_i\)，如果我们将它的 \(2,3,4\) 号顶点组成的三角形视为底面的话，它的面积可以写成 \(\frac 13\left(\left\vert\frac 12(\boldsymbol X_i^3-\boldsymbol X_i^4)\times(\boldsymbol X_i^2-\boldsymbol X_i^4)\right\vert\cdot(\boldsymbol X_i^1-\boldsymbol X_i^4)\right)\)，由此读者不难推出文中 \(W_i\) 的形式。

式 (21.38) 中的能量可以看成一个关于所有自由度 \(\boldsymbol x_1,\cdots,\boldsymbol x_N\) 的函数，简记为 \(E(\boldsymbol x)\)。在离散意义下，我们可以假设每个四面体的质量都平均分配给了它的四个顶点，那么由这些顶点的机械能守恒，我们可以知道每个顶点 \(j\) 的受力就是势能 \(E(\boldsymbol x)\) 关于其位置 \(\boldsymbol x_j\) 的负梯度，即 \(\boldsymbol f_j=-\frac{\partial E(\boldsymbol x)}{\partial\boldsymbol x_j}\)。

为方便推导出每个顶点受力的具体形式，我们考察每个四面体为它四个顶点贡献的力。记四面体 \(i\) 的能量为 \(E_i=W_i\Psi(\boldsymbol F_i)\)，四面体对它的第 \(j\) 个顶点贡献的力为 \(\boldsymbol f_i^j=-\frac{\partial E_i}{\partial\boldsymbol x_i^j}\)。通过对 \(E_i\) 关于 \(\boldsymbol x_i^{1,2,3,4}\) 分别求导我们可以得到这些力的值：

(21.39)#\[\begin{split} &\boldsymbol H_i\mathrel{\mathop:}=\begin{bmatrix}\boldsymbol f_i^1&\boldsymbol f_i^2&\boldsymbol f_i^3\end{bmatrix}=-W_i\boldsymbol P(\boldsymbol F_i)\boldsymbol D_\mathrm m^{-\top}，\\ &\boldsymbol f_i^4=-\boldsymbol f_i^1-\boldsymbol f_i^2-\boldsymbol f_i^3。 \end{split}\]

因此，我们只需要对于每个四面体计算好它对四个顶点的力的贡献，并将其累加到四个顶点的受力上，即可得到完整的弹性力。

21.2.3. 数值求解算法#

21.2.3.1. 显式时间积分#

我们可以按照 §21.2.2 计算弹性体在一个状态下的弹性力，然后在加上外力，即可进行显式时间积分的模拟。我们在这里通过模拟的过程对上述弹性体各个量的计算进行一个小结：

对参考构型下的每一个四面体，计算参考形状矩阵 \(\boldsymbol D_\mathrm m\)、它的逆 \(\boldsymbol D_\mathrm m^{-1}\) 以及四面体的体积 \(W_i\)。
计算每个顶点分配到的质量 \(m_i\)。
对每一个顶点施加外力：\(\boldsymbol v_i\gets\boldsymbol v_i+\frac h{m_i}\boldsymbol f_i^{\mathrm{ext}}\)。
准备弹性力向量 \(\boldsymbol f\gets\mathbf 0\in\mathbb R^{3N}\)，它表示所有顶点的弹性力堆叠而成的向量。
循环遍历每一个四面体，设四面体 \(i\in\{1,\cdots,M\}\) 的四个顶点编号分别为 \(a,b,c,d\)（请注意，这四个顶点的顺序很重要）：
- 计算变形形状矩阵 \(\boldsymbol D_\mathrm s\)、形变梯度 \(\boldsymbol F_i\) 以及 \(\boldsymbol P(\boldsymbol F_i)\)。
- 计算四面体对每个顶点的弹性力贡献 \(\boldsymbol H_i\gets-W_i\boldsymbol P(\boldsymbol F_i)\boldsymbol D_\mathrm m^{-\top}\)，设 \(\begin{bmatrix}\boldsymbol h_1&\boldsymbol h_2&\boldsymbol h_3\end{bmatrix}=\boldsymbol H_i\)。
- 更新弹性力向量：\(\boldsymbol f_a\gets\boldsymbol f_a+\boldsymbol h_1\)，\(\boldsymbol f_b\gets\boldsymbol f_b+\boldsymbol h_2\)，\(\boldsymbol f_c\gets\boldsymbol f_c+\boldsymbol h_3\)，\(\boldsymbol f_d\gets\boldsymbol f_d-\boldsymbol h_1-\boldsymbol h_2-\boldsymbol h_3\)。
对每一个顶点施加弹性力：\(\boldsymbol v_i\gets\boldsymbol v_i+\frac h{m_i}\boldsymbol f_i\)。
对于每一个顶点，使用速度更新位置：\(\boldsymbol x_i\gets\boldsymbol x_i+h\boldsymbol v_i\)。
进入下一个时间步，回到第 3 步。

以上的 \(h\) 表示时间步长，\(m_i\) 表示顶点 \(i\) 分配到的总质量，请注意每个顶点的质量并不相同，取决于它和那些四面体相关。第 1 和 2 步是模拟的预计算过程，第 2 到 7 步是一个时间步的时间积分，不断循环以模拟出每个时间步之后弹性体的状态。和弹簧质点系统一样，显式时间积分是非常不稳定的，很容易产生数值爆炸，除非你用很小的时间步长模拟，代价就是要花费大量的时间模拟同样长的一段动态。为了让弹性体的模拟更加稳定，我们需要使用隐式时间积分，并在系统中引入阻尼，这些都会在接下来进行介绍。

21.2.3.2. 隐式时间积分#

与弹簧质点系统类似，弹簧有劲度系数，弹性体也有相应的劲度矩阵（stiffness matrix）。为了了解这个概念，我们先回顾一下一根弹簧对质点的弹力是什么样的。为了简便，我们假设整个系统在一维空间下，弹簧的一端固定在原点，另一端连接着一个位置为 \(x(x>0)\) 的质点，弹簧的原长为 \(l\)、劲度系数为 \(k\)，那么质点受到的弹力为 \(f=-k(x-l)\)。我们知道劲度系数反应了弹簧的“坚硬程度”，但是这个坚硬程度的具体含义是什么呢？从弹力的形式我们不难看出，\(k=-\frac{\partial f}{\partial x}\) 反映了力随位置的变化速率，这个变化速率越快，拉长或压缩一单位距离的弹簧，所受到的弹性阻碍的增量也越多，弹簧就越“硬”。将弹簧的劲度系数拓展到有限元四面体网格的情形，我们就能够得到劲度矩阵的定义——劲度矩阵即为所有顶点的弹性力关于顶点位置的负雅可比矩阵：

(21.40)#\[ \boldsymbol K(\boldsymbol x)=-\frac{\partial\boldsymbol f(\boldsymbol x)}{\partial\boldsymbol x}， \]

这里的 \(\boldsymbol f\) 继承了 §21.2.3.1 中的含义，表示所有顶点受到的弹性力堆叠而成的向量。

通过劲度矩阵，我们可以立即给出阻尼力（damping force）的定义：

(21.41)#\[ \boldsymbol f_\mathrm d(\boldsymbol x,\boldsymbol v)=-\gamma\boldsymbol K(\boldsymbol x)\boldsymbol v， \]

其中 \(\boldsymbol v\) 表示顶点的速度，\(\boldsymbol f_\mathrm d,\boldsymbol v\) 都是类似 \(\boldsymbol x\) 的堆叠向量。在本节，如无特殊说明，所有向量均为这样的堆叠向量。

我们回顾一下弹簧质点系统中介绍过的隐式时间积分的概念，就是使用时间步末端时刻的状态来近似整个时间步内的量，例如从时间步 \(k\) 到 \(k+1\) 的隐式时间积分可以写为如下方程组：

(21.42)#\[ \boldsymbol x^{k+1}=\boldsymbol x^k+h\boldsymbol v^{k+1}， \]

(21.43)#\[ \boldsymbol v^{k+1}=\boldsymbol v^k+h\boldsymbol M^{-1}\left(\boldsymbol f(\boldsymbol x^{k+1})+\boldsymbol f_\mathrm d(\boldsymbol x^{k+1},\boldsymbol v^{k+1})\right)， \]

其中 \(\boldsymbol M=\mathrm{diag}\{m_1,m_1,m_1,m_2,m_2,m_2,\cdots,m_N,m_N,m_N\}\) 为质量矩阵。这里为了简便，我们忽略了外力，事实上我们可以认为外力项包含在了 \(\boldsymbol v^k\) 内。

为求解这个方程组，我们同样使用迭代法来求解 \(\boldsymbol x^{k+1}\) 和 \(\boldsymbol v^{k+1}\)，也就是说我们的求解器会产生两个序列 \(\{\boldsymbol x_{(i)}\}_{i=1}^\infty\) 和 \(\{\boldsymbol v_{(i)}\}_{i=1}^\infty\)，使得 \(\lim_{i\to\infty}\boldsymbol x_{(i)}=\boldsymbol x^{k+1}\)，\(\lim_{i\to\infty}\boldsymbol v_{(i)}=\boldsymbol v^{k+1}\)。我们将时间步开始时刻的状态作为求解算法的初始值，即 \(\boldsymbol x_{(0)}=\boldsymbol x^k\)，\(\boldsymbol v_{(0)}=\boldsymbol v^k\)，然后每一个迭代由 \(\boldsymbol x_{(i)},\boldsymbol v_{(i)}\) 推出 \(\boldsymbol x_{(i+1)},\boldsymbol v_{(i+1)}\)，对式 (21.43) 中的弹性力在 \((\boldsymbol x_{(i)},\boldsymbol v_{(i)})\) 处进行泰勒展开可以得到：

\[ \boldsymbol v^{k+1}=\boldsymbol v^k+h\boldsymbol M^{-1}\left(\boldsymbol f(\boldsymbol x_{(i)})+\frac{\partial\boldsymbol f(\boldsymbol x_{(i)})}{\partial\boldsymbol x}(\boldsymbol x^{k+1}-\boldsymbol x_{(i)})-\gamma\boldsymbol K(\boldsymbol x_{(i)})\boldsymbol v^{k+1}\right)， \]

这里我们对阻尼力的处理是代入 \(\boldsymbol f_\mathrm d(\boldsymbol x_{(i)},\boldsymbol v^{k+1})\)，这是为了避免对劲度矩阵 \(\boldsymbol K\) 进行泰勒展开，因为它的导数将会是一个三阶张量，为求解器带来极大的计算量。在当前迭代中，我们的目标就是求出这个泰勒展开后的方程关于 \(\boldsymbol x^{k+1}\) 和 \(\boldsymbol v^{k+1}\) 的解，所以我们可以将 \(\boldsymbol x_{(i+1)}=\boldsymbol x^{k+1}\) 和 \(\boldsymbol v_{(i+1)}=\boldsymbol v^{k+1}\) 代入泰勒展开后的方程，再令 \(\Delta\boldsymbol x_{(i)}=\boldsymbol x_{(i+1)}-\boldsymbol x_{(i)}\)，\(\Delta\boldsymbol v_{(i)}=\boldsymbol v_{(i+1)}-\boldsymbol v_{(i)}\)，得到

\[ \boldsymbol v_{(i)}+\Delta\boldsymbol v=\boldsymbol v^k+h\boldsymbol M^{-1}\left(\boldsymbol f(\boldsymbol x_{(i)})+\boldsymbol K(\boldsymbol x_{(i)})\Delta\boldsymbol x-\gamma\boldsymbol K(\boldsymbol x_{(i)})(\boldsymbol v_{(i)}+\Delta\boldsymbol v)\right)。 \]

再利用式 (21.42) 将方程表示成仅关于 \(\Delta\boldsymbol x\) 的：

\[ \frac 1{h^2}\boldsymbol M\Delta\boldsymbol x=\frac 1h\boldsymbol M(\boldsymbol v^k-\boldsymbol v_{(i)})+\left(\boldsymbol f(\boldsymbol x_{(i)})-\boldsymbol K(\boldsymbol x_{(i)})\Delta\boldsymbol x-\gamma\boldsymbol K(\boldsymbol x_{(i)})\left(\boldsymbol v_{(i)}+\frac 1h\Delta\boldsymbol x\right)\right)， \]

于是得到这样一个线性系统：

(21.44)#\[ \left[\left(1+\frac\gamma h\right)\boldsymbol K(\boldsymbol x_{(i)})+\frac 1{h^2}\boldsymbol M\right]\Delta\boldsymbol x=\frac 1h\boldsymbol M(\boldsymbol v^k-\boldsymbol v_{(i)})+\left(\boldsymbol f(\boldsymbol x_{(i)})-\gamma\boldsymbol K(\boldsymbol x_{(i)})\boldsymbol v_{(i)}\right)。 \]

如果能解出 \(\Delta\boldsymbol x\)，我们就可以进行本轮迭代的更新：\(\boldsymbol x_{(i+1)}=\boldsymbol x_{(i)}+\Delta\boldsymbol x\)，\(\boldsymbol v_{(i+1)}=\boldsymbol v_{(i)}+\frac 1h\Delta\boldsymbol x\)。一般来讲，重复 2 到 3 步这样的迭代就足以模拟出很真实的弹性效果了。

求解式 (21.44) 的线性系统需要格外关注一个事实：劲度矩阵 \(\boldsymbol K(\boldsymbol x_{(i)})\) 的表达式十分复杂，我们希望能够通过无矩阵（matrix-free）的方式求解这个系统。幸运的是，许多线性求解器是支持无矩阵求解的，例如无矩阵的共轭梯度法（matrix-free conjugate gradient method），这类方法一般只需要你提供一个接口，对于任何输入的向量 \(\boldsymbol x\)，能够输出 \(\boldsymbol{Ax}\)，这里的 \(\boldsymbol A\) 是线性系统的矩阵。那么根据式 (21.44)，我们想提供接口只需要能够计算 \(\boldsymbol K(\boldsymbol x_{(i)})\boldsymbol x\) 即可。

考虑在 \(\boldsymbol x_{(i)}\) 基础上的任意一段微小的位移 \(\delta\boldsymbol x\)，它所导致的弹性力的变化为 \(\delta\boldsymbol f=\frac{\partial\boldsymbol f(\boldsymbol x_{(i)})}{\partial\boldsymbol x}\delta\boldsymbol x=-\boldsymbol K(\boldsymbol x_{(i)})\delta\boldsymbol x\)，所以只要我们能够计算出 \(\delta\boldsymbol f\) 就能够提供这样的接口。

为求 \(\delta\boldsymbol f\)，我们还是回到单个四面体 \(i\) 对力的贡献，即求 \(\delta\boldsymbol H_i=\begin{bmatrix}\delta\boldsymbol f_i^1&\delta\boldsymbol f_i^2&\delta\boldsymbol f_i^3\end{bmatrix}\)，那么 \(\delta\boldsymbol f_i^4=-\delta\boldsymbol f_i^1-\delta\boldsymbol f_i^2-\delta\boldsymbol f_i^3\)，随后我们将 \(\delta\boldsymbol f_i^{1,2,3,4}\) 分别加到 \(\delta\boldsymbol f\) 的对应位置上即可（类似 §21.2.3.1 中计算弹性力的过程）。通过对式 (21.39) 两边求微分可得

\[ \delta\boldsymbol H_i=-W_i\delta\boldsymbol P(\boldsymbol F_i;\delta\boldsymbol F_i)\boldsymbol D_\mathrm m^{-\top}， \]

这是因为 \(W_i\) 和 \(\boldsymbol D_\mathrm m^{-\top}\) 都与形变后的四面体顶点位置无关。这里将应力张量的微分写成这个形式是为了突出其表达式中会显含 \(\boldsymbol F_i\) 和 \(\delta\boldsymbol F_i\)，但严格来讲 \(\delta\boldsymbol F_i\) 也是一个关于 \(\boldsymbol F_i\) 的函数，\(\delta\boldsymbol P(\boldsymbol F;\delta\boldsymbol F)\) 的具体形式取决于你选择的本构模型，我们会在本节的最后给出常用的两种。那么剩下的就是求出 \(\delta\boldsymbol F_i\) 了，由式 (21.37) 可得

\[ \delta\boldsymbol F=(\delta\boldsymbol D_\mathrm s)\boldsymbol D_\mathrm m^{-1}， \]

而 \(\boldsymbol D_\mathrm s\) 就是由位置坐标组成的矩阵，所以它的微分十分简单：

\[\begin{split} \delta\boldsymbol D_\mathrm s=\begin{bmatrix}\delta x_i^1-\delta x_i^4&\delta x_i^2-\delta x_i^4&\delta x_i^3-\delta x_i^4\\\delta y_i^1-\delta y_i^4&\delta y_i^2-\delta y_i^4&\delta y_i^3-\delta y_i^4\\\delta z_i^1-\delta z_i^4&\delta z_i^2-\delta z_i^4&\delta z_i^3-\delta z_i^4\end{bmatrix}。 \end{split}\]

下面我们分别给出圣维南-基尔霍夫模型和新胡克模型下的第一类皮奥拉-基尔霍夫应力张量的微分。首先，格林应变张量的微分是

\[ \delta\boldsymbol E=\frac 12(\delta\boldsymbol F^\top\boldsymbol F+\boldsymbol F^\top\delta\boldsymbol F)， \]

进而给出圣维南-基尔霍夫模型下应变张量的微分：

\[ \delta\boldsymbol P(\boldsymbol F;\delta\boldsymbol F)=\delta\boldsymbol F[2\mu\boldsymbol E+\lambda\mathrm{tr}(\boldsymbol E)\mathbf I]+\boldsymbol F[2\mu\delta\boldsymbol E+\lambda\mathrm{tr}(\delta\boldsymbol E)\mathbf I]。 \]

接下来我们不加证明地给出一些矩阵变换下的微分的形式，矩阵的逆的微分为 \(\delta[\boldsymbol F^{-1}]=-\boldsymbol F^{-1}\delta\boldsymbol F\boldsymbol F^{-1}\)，矩阵的逆的转至的微分为 \(\delta[\boldsymbol F^{-\top}]=-\boldsymbol F^{-\top}\delta\boldsymbol F^\top\boldsymbol F^{-\top}\)，矩阵行列式的微分为 \(\delta[\det\boldsymbol F]=\det\boldsymbol F\cdot\mathrm{tr}(\boldsymbol F^{-1}\delta\boldsymbol F)\)。借助这些我们可以得出新胡克模型下应变张量的微分：

\[ \delta\boldsymbol P(\boldsymbol F;\delta\boldsymbol F)=\mu\delta\boldsymbol F+[\mu-\lambda\log J]\boldsymbol F^{-\top}\delta\boldsymbol F^\top\boldsymbol F^{-\top}+\lambda\mathrm{tr}(\boldsymbol F^{-1}\delta\boldsymbol F)\boldsymbol F^{-\top}， \]

其中 \(J=\sqrt{I_3}=\det\boldsymbol F\)。

有限元方法

目录

21.2. 有限元方法#

21.2.1. 物理模型#

21.2.1.1. 描述形变#

21.2.1.2. 描述能量#

21.2.1.3. 描述力#

21.2.1.4. 能量与力的关系#

21.2.1.5. 常见超弹性模型#

21.2.1.5.1. 线性模型#

21.2.1.5.2. 圣维南-基尔霍夫模型#

21.2.1.5.3. 共旋转线性模型#

21.2.1.5.4. 新胡克模型#

21.2.1.5.5. 各种本构模型的比较#

21.2.2. 空间离散化#

21.2.2.1. 变形函数的选择#

21.2.2.2. 形变梯度的计算#

21.2.2.3. 能量与力的计算#

21.2.3. 数值求解算法#

21.2.3.1. 显式时间积分#

21.2.3.2. 隐式时间积分#