数学拾遗

离散数学(Discrete Mathematics)

研究离散而非连续的数学结构也是计算机科学的领域之一

数理逻辑(Mathematical Logic)

见哲学杂记的数理逻辑

集合论(Set Theory)

格奥尔格·康托尔(Georg Cantor)

德国数学家现代集合论的创始人之一

将一些确定的可以区分的事物构成的整体称为集合(Set)简称集构成集合的每个对象称为元素(Element)又称成员(Member)两个集合相等当且仅当它们包含的元素相同

不含任何元素的集合称为空集(Empty Set)记作在一定范围内如果所有涉及的集合都是某一集合的子集则称该集合为论域(Universe)或译全集一般记作

数系的集合论定义

数系的集合论定义如下

符号 名称 定义
(Zahlen) 整数(Integer)

自然数(Natural Number)
非负整数(Non-Negative Integer)
正整数(Positive Integer)
(Quotient) 有理数(Rational Number)
实数(Real Number) 与数轴上的点相对应的数
非负实数(Non-Negative Real Number)
正实数(Positive Real Number)
复数(Complex Number)

有限集(Finite Set)指集合的元素个数有限反之则称无限集(Infinite Set)无限集合的基数意义在于比较两个集合的大小有限集个元素则称集合基数(Cardinality)或势为记为

可数集(Countable Set)指集合能从一个元素开始将集合的所有元素按一定顺序排成一列即与自然数集的某个子集具有相同基数即与自然数集合是等势的(Equinumerous)反之则称不可数集(Uncountable Set)

阿列夫数(Aleph Number)用于衡量集合大小自然数集的基数记为而不可数集的基数用表示康托尔提出的连续统假设(Continuum Hypothesis)认为之间没有其他基数存在

若根据某法则对于集合的每一个都有一个确定的实数与之对应的映射(Mapping)记为通常变量称为变量单值函数(Single-Valued Function)记为若每一个有多个与之对应多值函数(Multivalued Function)

映射在不同的数学分支中有不同的名称一些情形如下

  • 可称映射为变换(Transformation)
  • 可称映射为函数(Function)
  • 可称映射为泛函(Functional)

容斥定理(Inclusion–Exclusion Principle)

又称包含排斥定理使用子集元素个数对集合元素个数进行计算两个有限集的容斥定理公式如下 三个有限集的容斥定理公式如下 推广至个集合的容斥定理公式如下

笛卡尔积(Cartesian Product)

有序对(Ordered Pair)又称序偶由有次序的两个元素组成记为

笛卡尔积又称直积是两集合的所有有序对的运算笛卡尔积的符号化表示如下

一般情况下笛卡尔积不满足交换律和结合律但对集合的并和交满足分配律

二元关系(Binary Relation)

二元关系简称关系本质上是序偶集合如算数中的大于等于

上不同的关系有特殊的关系如空关系(Empty Relation)全关系(Universal Relation)恒等关系(Identity Relation)

域的一些概念如下

  • 前域(Domain)
  • 值域(Range)
  • 全域(Field)

关系的一些基本运算如下

  • 逆关系(Inverse Relation)
  • 复合关系(Composition of Relations)
  • 关系的幂(Powers of Relations)

关系的一些重要性质如下

其中反对称性不是对称性的否定可以既对称又反对称对称性的强形式否定为禁对称性(Asymmetric)满足使得

  • 自反性(Reflexive)使得
  • 反自反性(Irreflexive)使得
  • 对称性(Symmetric)使得
  • 反对称性(Antisymmetric)使得
  • 传递性(Transitive)使得

特殊关系性质表

特殊关系具备的性质如下

关系 自反性 反自反性 对称性 反对称性 传递性
空集上的空关系
非空集上的空关系

运算的关系性质稳定性表

运算的关系性质稳定性如下

运算 自反性 反自反性 对称性 反对称性 传递性

是集合上的关系如果同时是自反的对称的和传递的则称是一个等价关系(Equivalence Relation)

是集合上的等价关系定义等价类(Equivalence Class)等价类满足使得当且仅当

是集合上的等价关系定义关于商集(Quotient Set)商集就是的一个划分(Partition)集合上的一个划分确定中元素间的一种等价关系

是非空集合上的关系的自反(对称或传递)闭包(Closure)上的关系也是自反(对称或传递)满足且对上任何包含的自反(对称或传递)关系

构造三种闭包的方法如下

  • 自反闭包(Reflexive Closure)
  • 对称闭包(Symmetric Closure)
  • 传递闭包(Transitive Closure)每执行一次并操作验证一次传递关系

偏序关系(Partially Ordered Relation)

满足自反反对称和传递的关系称非严格偏序(Non-Strict Partial Order)或简称偏序(Partial Order)记为满足反自反禁对称和传递的关系称为严格偏序关系(Strict Partial Order)记为

偏序关系的相关概念

假设为集合上的偏序关系

最小元(Least Element)定义为使得最大元(Greatest Element)定义为使得最小元和最大元不一定存在但若存在必唯一

极小元(Minimal Element)定义为使得极大元(Maximal Element)定义为使得极小元和极大元一定存在且可能有多个

上界(Upper Bound)定义为使得下界(Lower Bound)定义为使得上界和下界不一定存在且存在也不一定唯一上确界(Supremum)记为即最小的上界下确界(Infimum)记为即最大的下界上确界和下确界不一定存在但若存在必唯一

既有上界又有下界的数集称为有界集(Bounded Set)没有上界或下界的数集称为无界集(Unbounded Set)

使得则称覆盖(Cover)

哈斯图(Hasse Diagram)根据覆盖关系绘制绘制于上方

是集合上的偏序关系满足使得则称为全序关系(Total Order Relation)哈斯图呈链状的任一非空子集都有最小元存在则称为良序关系(Well-Order Relation)良序关系必是全序关系有限全序关系必是良序

罗素悖论(Russell's Paradox)

罗素悖论可描述为设论域是所有集合的集合并定义是不以自身为元素的全体集合的集合那么是否为自身的元素伯特兰·罗素用理发师悖论(Barber Paradox)来解释该悖论镇上某位理发师宣布他只给那些不给自己刮脸的人刮脸那么理发师是否应给自己刮脸

图论(Graph Theory)

见数据结构和算法相关整理的图论

数论(Number Theory)

见数据结构和算法相关整理的数论

博弈论(Game Theory)

博弈(Game)至少有两名理性参与者(Rational Player)每名参与者有多于一个的策略(Strategy)博弈的结果(Outcome)或称收益(Payoff)取决于所有参与者的决策博弈论考虑博弈中理性参与者的策略交互并研究优化策略所谓理性即参与者在可能竞争的情况下使自己的收益最大化博弈论是相互依存情况中的理性行为的数学建模

静态博弈(Static Game)指在博弈中参与者同时选择或虽非同时选择但后行动者并不知道先行动者采取何种具体策略

若两名博弈参与者都完全知晓对方参与者的决策空间和收益函数则称为完全信息博弈(Complete Information Game)

纯策略(Pure Strategy)

在完全信息博弈中理性参与者唯一能选择的特定策略称为纯策略

无论对手采取何种策略若参与者可选择的某个策略都可以得到比采取其他策略更好的结果即收益高于其他策略则称这个策略为严格支配性策略(Strictly Dominant Strategy)或称优势策略收益不低于其他策略的情况则称这个策略为弱支配性策略(Weakly Dominant Strategy)或称弱优势策略

类似地可以定义严格被支配策略(Strictly Dominated Strategy)或称严格劣势策略以及弱被支配策略(Weakly Dominated Strategy)或称弱劣势策略

正则形式博弈(Normal-Form Game)是使用矩阵来描述博弈的方式严格劣势策略可以通过正则形式博弈被迭代剔除(Iterated Elimination)

若两名博弈参与者的策略组合分别构成各自的严格支配性策略则称这个策略组合为纳什均衡(NE; Nash Equilibrium)或纯策略纳什均衡(PNE; Pure Strategy Nash Equilibrium)假设每个参与者都知晓其他参与者的策略的情况下没有参与者可以透过改变自身策略使自身受益时就达到了纳什均衡纯策略的纳什均衡是可能不存在的

混合策略(Mixed Strategy)

若在给定信息下理性参与者以某种概率选择不同策略则称为混合策略通俗而言混合策略即参与者可选策略的概率分布

混合策略的纳什均衡称为混合纳什均衡(MNE; Mixed Strategy Nash Equilibrium)纳什指出有限的静态博弈中一定存在混合策略纳什均衡

动态博弈(Dynamic Game)

又称扩展式博弈(Extensive Game)或序贯博弈(Sequential Game)即参与者的策略有先后顺序且后行动者能够观察到先行动者所选择的策略

动态博弈中参与者轮流决策因此动态博弈可以使用博弈树(Game Tree)表示其中非叶子结点代表博弈参与者叶子结点代表收益而边则代表参与者的决策博弈树的子树称为子博弈(Subgame)

若动态博弈的博弈序列在每个子博弈上都构成纳什均衡则称为子博弈完美纳什均衡(Subgame Perfect Nash Equilibrium)库恩定理(Kuhn Theorem)指出每一个完全信息的有限动态博弈至少存在一个纯策略纳什均衡

博弈论研究者一般相信序惯理性(Sequential Rationality)即不论过去发生的事件参与者都应该在博弈树的每个结点上最优化自己的策略因此子博弈完美纳什均衡可由如下的反向归纳(Backward Induction)方式寻找从最末端的非叶子结点开始寻找纳什均衡即寻找最优收益用最优收益替代该子博弈的根结点如此重复直至博弈的根结点

线性代数(Linear Algebra)

研究矩阵和线性空间的数学分支

向量(Vector)

向量又称矢量如二维空间中的向量可记为三维空间中的向量可记为从物理专业的角度看向量是空间中具有长度和方向的箭头从计算机专业的角度看向量是有序的数据列表这两种观点通过箭头以原点作为起点终点即列表的方式达成统一

所有元素为0的向量称为零向量(Zero Vector)记为

如果向量的全部个元素都属于那么该向量属于次笛卡尔积构成的集合记为其中是第维的元素通常向量可被视为的矩阵此时称为列向量(Column Vector)而列向量的转置就是行向量(Row Vector)

向量组的线性相关性

考虑一组向量和一组实数则向量组的线性组合(Linear Combination)记为如下数学形式 向量组的所有线性组合即向量组张成的空间(Span)

如果向量组的某个向量能用向量组的其他向量的线性组合表示即这个向量落在其他向量张成的空间中则称这组向量线性相关(Linearly Dependent)如果向量组的所有向量都不能用其他向量的线性组合表示即任意一个向量都为其他向量张成的空间增添了新的维度则称线性无关(Linearly Independent)向量组的(Rank)即其包含线性无关向量的最大数目

张成空间的一个线性无关向量的集合称为该空间的一组(Basis)该集合包含的线性无关向量的数量即该空间的维数(Dimension)记为是有限维的(Finite-Dimensional)否则称之为无限维的(Infinite-Dimensional)此时线性组合的系数称为坐标(Coordinate)分量(Component)如二维空间中最常见的一组基为二维空间的向量亦可记为

若空间满足如下运算规律则称为线性空间(Linear Space)

是线性空间的非空子集上的线性运算封闭都有则称的线性子空间(Linear Subspace)简称子空间(Subspace)

是线性空间的非空子集的子空间且对的任一包含的子空间都有则称的线性生成空间(Linear Span)的线性包(Linear Hull)记为

范数(Norm)

距离(Distance)的严格定义为满足如下性质的函数其中被称为以为距离的度量空间(Metric Space)记为

  • 正定性
  • 次可加性满足三角不等式(Triangle Inequality)
  • 对称性

欧几里得距离(Euclidean Distance)定义如下 此时称维欧几里得空间(Euclidean -Space)

范数也称为模用于衡量向量的大小是将向量映射到非负值的函数范数的严格定义为满足如下性质的函数其中被称为赋范线性空间(Normed Linear Space)

  • 正定性
  • 次可加性
  • 绝对一次齐次性

范数是范数的一种对应明可夫斯基距离(Minkowski Distance)定义如下 单位向量(Unit Vector)是具有单位范数(Unit Norm)的向量具有如下性质 范数对应欧几里得距离平方范数可简单地通过点积计算范数本身更方便经常用于衡量向量的大小

平方范数在原点附近增长缓慢有时转而使用范数对应曼哈顿距离(Manhattan Distance)

最大范数(Maximum Norm)表示向量中具有最大幅值的元素的绝对值对应切比雪夫距离(Chebyshev Distance)定义如下 相对的有最小范数(Minimum Norm)定义如下

矩阵范数

衡量矩阵的大小通常使用弗罗贝尼乌斯范数(Frobenius Norm)定义如下

诱导的矩阵范数定义如下 求矩阵最大绝对值列和称为矩阵的列范数即下式 求矩阵最大绝对值行和称为矩阵的行范数即下式 称为矩阵的谱范数(Spectral Norm)即下式

其中计算矩阵特征值绝对值的最大值

常用的矩阵范数还有范数定义如下 矩阵的核范数(Nuclear Norm)定义如下

点积(Dot Product)

又称内积(Inner Product)数量积(Scalar Product)其数学定义和几何定义如下

其中为两向量的夹角即点积可使用投影的方式理解

向量可视为只有一列的矩阵则向量的转置即只有一行的矩阵两个向量的可使用矩阵乘积的形式表示即点积的代数定义如下 两个向量点积的结果是标量而标量的转置即自身可知点积满足交换律即下式

若两向量点积为0则称这两个向量垂直(Perpendicular)正交(Orthogonal)若两向量正交且范数都为1则称标准正交(Orthonormal)

两个同型矩阵的内积又称弗罗贝尼乌斯内积(Frobenius Inner Product)定义如下

叉积(Cross Product)

又称向量积(Vector Product)

二维空间向量的叉积数学形式如下 三维空间向量的叉积数学形式如下 三维空间向量叉积的结果垂直于两向量确定的平面方向可使用右手法则确定长度为两向量确定的平行四边形面积

外积(Outer Product)

又称张量积(Tensor Product)数学定义如下

线性变换(Linear Transformation)

变换(Transformation)可理解为函数即接收向量作为输入并输出向量使用变换而非函数暗示以运动的方式理解直线在变换后仍为直线且原点保持固定的变换称为线性变换亦可视为保持网格线平行且等距分布的变换线性变换的的严格定义为满足如下性质的函数

  • 可加性
  • 齐次性

假设为线性变换的二维空间的一组基基变换矩阵(可被视为一种描述线性变换的语言)构成记为方阵的线性变换可记为

基变换矩阵亦可视为由变换后的基表示的坐标转换至由变换前的基表示的坐标此时称基变换或坐标变换由基变换的基表示的向量经过由基变换的基表示的线性变换则得到由基变换的基表示的向量该过程首先应用基变换而后应用线性变换最后应用基变换的逆

线性变换后成为零向量的向量的集合称为该线性变换或该方阵的零空间(Null Space)或核(Kernel)

仿射变换(Affine Transformation)又称仿射映射(Affine Mapping)在线性变换的基础上进行平移即改变了原点的位置

柯西-施瓦兹不等式(Cauchy-Schwarz Inequality)

赫尔曼·阿曼杜斯·施瓦茨(Hermann Amandus Schwarz)

德国数学家

奥古斯丁-路易·柯西和赫尔曼·阿曼杜斯·施瓦茨命名是最重要的数学不等式之一根据余弦函数的性质可知同时乘以得下式

格拉姆-施密特正交化(Gram–Schmidt Orthogonalisation)

格拉姆-施密特正交化利用投影原理在已有正交基的基础上构造新的正交基

假设为一组标准正交基与其于子空间上的投影之差如下

标准化即下式

格拉姆-施密特正交化反复执行上述计算过程

矩阵(Matrix)

向量并排构成矩阵又称向量的向量矩阵用粗体字母表示一个的矩阵记为如下数学形式

下式又可简记为

所有元素全为0的矩阵称为零矩阵记为

矩阵的运算

两个矩阵都为矩阵时称为同型矩阵矩阵的加减法即两个矩阵对应位置的元素相加减只适用于同型矩阵

是一个矩阵是一个矩阵定义矩阵矩阵乘积(Matrix Product)矩阵且满足下式

其中

可知只有当左矩阵的列数等于右矩阵的行数时两个矩阵才能相乘同时还可知矩阵又可理解为对向量的一种操作即将一个向量组变为另一向量组

矩阵乘积服从分配律和结合律而不一定满足交换律满足交换律的两矩阵称为可交换矩阵(Commuting Matrices)

同型矩阵的元素对应乘积称为哈达玛乘积(Hadamard Product)记为

矩阵的内积又称弗洛贝尼乌斯内积

矩阵克罗内克乘积(Kronecker Product)记为可定义为如下的分块矩阵

将矩阵的行换成同序数的列得到的新矩阵称为转置(Transpose)记为矩阵的转置是以从左上角到右下角的主对角线(Main Diagonal)为轴的镜像

矩阵乘积的转置如下式

矩阵的秩即对应向量组的秩即矩阵包含线性无关列(行)向量的最大数目亦可用于描述线性变换后空间的维度的秩记为秩达到最大值即与矩阵的列(行)数相等满秩(Full Rank)矩阵的(Trace)是行号列号相同元素之和的迹记为

迹运算的常见性质

迹运算的常见性质如下

多个矩阵相乘得到的矩阵的迹和将这些矩阵中的最后一个挪到最前面之后相乘的迹是相同的(即使这般循环置换后矩阵乘积得到的矩阵形状有变前提是矩阵乘积依然定义良好)即下式

迹运算的导数公式

迹运算的导数公式如下

记复数域矩阵的元素的共轭复数为元素的矩阵为称为的共轭转置(Conjugate Transpose)

共轭转置的性质

共轭转置的一些性质如下

  • 如果可逆

则称为正规矩阵(Normal Matrix)

对矩阵进行的如下三种操作称为初等行变换(Elementary Row Operation)

  • 对换两行记为
  • 行乘以记为
  • 行加上第行乘以记为

上述定义若对列进行操作则称为初等列变换(Elementary Column Operation)记号替换为矩阵经过有限次初等变换变成矩阵记为初等行变换记为初等列变换记为

方阵可逆的充分必要条件为

若矩阵可以经过一系列初等行变换和初等列变换变成矩阵即如下数学形式则两个矩阵等价(Equivalent)或称相抵

经过一次初等变换得到的矩阵称为初等矩阵(Elementary Matrix)进行一次初等行变换相当于在的左边乘对应的初等矩阵初等列变换则相当于右乘对应的初等矩阵更一般形式的初等矩阵具有如下数学形式

其中为复数

三类初等行变换用表示的方式如下

则称如下数学形式的矩阵为初等下三角矩阵(Elementary Lower Triangular Matrix)

为列的矩阵称为阶排列矩阵(Permutation Matrix)可知排列矩阵的转置是排列矩阵排列矩阵是正交矩阵排列矩阵的逆是排列矩阵

多项式矩阵(Polynomial Matrix)

又称-矩阵(-Matrix)

为未知元符号的一元多项式定义如下

以上式形式的一元多项式为元素的矩阵即-矩阵多项式中的最高次数称为该矩阵的次数显然数字矩阵是-矩阵的特例数字矩阵的特征矩阵就是一次-矩阵

-矩阵的初等变换

-矩阵进行的如下三种操作称为-矩阵的初等行变换

  • 对换两行记为
  • 行乘以记为
  • 行加上第行的其中的多项式记为

上述定义若对列进行操作则称为-矩阵的初等列变换记号替换为变换的记法与矩阵的初等变换类似

-方阵可逆的充分必要条件为与单位矩阵相抵

-矩阵相抵的充分必要条件是存在两个可逆-方阵使得成立

两个相抵的-方阵的行列式只能相差一个非零常数

秩为-矩阵可相抵于如下矩阵称为-矩阵在相抵下的标准形或史密斯标准形(SNF; Smith Normal Form)

其中称为不变因子(Invariant Factor)是首项系数为1的多项式能被整除

秩为-矩阵的全部阶子式的最大公因式称为阶行列式因子(Determinant Factor)记为相抵的-矩阵具有相同的秩和相同的各行列式因子因此易得行列式因子与不变因子的关系如下

从而可知-矩阵的史密斯标准形是惟一的

-矩阵的不变因子在复数域分解为一次因式的幂的乘积即下式 > 其中是互异的复数是非负整数

所有不变因子的分解中所有指数大于零的因子称为-矩阵初等因子(Elementary Divisor)由不变因子间的整除关系满足如下关系

同一个一次因式的幂作成的初等因子中方次最高的必在的分解中方次次高的必在的分解中因此由-矩阵的初等因子可惟一确定其不变因子

两行列式矩阵相抵的充分必要条件如下它们有相同的行列式因子它们有相同的不变因子它们有相同的秩和相同的初等因子

块对角矩阵的初等因子的全体是的全部初等因子但是不能从的不变因子求得的不变因子

的特征矩阵的行列式因子不变因子和初等因子分别称为的行列式因子不变因子和初等因子相似的充分必要条件如下它们有相同的行列式因子它们有相同的不变因子它们有相同的初等因子

如下数学形式称为若尔当块(Jordan Block)

其中为复数

阶若尔当块具有一个重特征值对应于特征值仅有一个线性无关的特征向量的不变因子具有如下特性

由若干个若尔当块组成的块对角矩阵称为若尔当矩阵(Jordan Matrix)通常记为复数域方阵与一个若尔当矩阵相似并且若尔当矩阵除去其中若尔当块的排列次序外是被惟一确定的该若尔当矩阵称为的若尔当标准形(Jordan Normal Form)且存在阶可逆矩阵使得

阶方阵的特征多项式(Characteristic Polynomial)数学形式如下

凯莱-哈密尔顿定理(Cayley-Hamilton Theorem)指出

若存在多项式使得则称的化零多项式(Annihilating Polynomial)的化零多项式有无穷多个其中次数最低且首项系数为1的称为的最小多项式(Minimal Polynomial)记为最小多项式惟一且能整除的任一化零多项式相似的矩阵有相同的最小多项式且化零多项式的集合相同

块对角矩阵的最小多项式等于其诸对角块的最小多项式的最小公倍式若尔当块的最小多项式为因此阶复数域方阵的最小多项式为的第个不变因子

阶方阵相似于对角矩阵的充分必要条件是的最小多项式没有重零点没有重根

满秩分解(Full Rank Decomposition)

的秩则存在使得这称为矩阵的满秩分解

矩阵的满秩分解是不唯一的

QR分解(QR Decomposition)

阶可逆矩阵则存在酉矩阵和可逆上三角矩阵使得这称为矩阵的QR分解

应用格拉姆-施密特正交化可将线性无关向量组化为标准正交向量组其中具有如下数学形式的关系

此时矩阵的QR分解如下

奇异值分解(SVD; Singular Value Decomposition)

奇异值分解将矩阵分解为奇异向量(Singular Vector)奇异值(Singular Value)

若存在非负实数和非零向量使得则称的奇异值分别称为对应奇异值的右奇异向量(Right-Singular Vector)和左奇异向量(Left-Singular Vector)

易得

奇异值分解的数学形式如下

其中满足且其他位置的元素均为0即奇异值为非负实数且满足

摩尔-彭若斯广义逆(Moore-Penrose Pseudoinverse)

又称摩尔-彭若斯伪逆定义如下 实际计算方式使用下式

其中的非零元素取倒数再经转置得到的

若矩阵的满秩分解计算方式又可使用下式

方阵(Square Matrix)

方阵即长宽相等的矩阵或称阶矩阵对角线下方元素全为0的方阵称为上三角方阵对角线上方元素全为0的方阵称为下三角方阵

非对角线的元素全为零的矩阵称为对角矩阵(Diagonal Matrix)即如下数学形式

下式又可简记为

对角线上的元素全为1的对角矩阵称为单位矩阵(Identity Matrix)记为单位矩阵作为线性变换是恒等变换

对称矩阵(Symmetric Matrix)即满足的方阵每一个元素都为实数的对称矩阵称为实对称矩阵(Real Symmetric Matrix)

正交矩阵(Orthogonal Matrix)即行(列)向量皆互为正交的单位向量的方阵因而满足每一个元素都为实数的正交矩阵称为实正交矩阵(Real Orthogonal Matrix)

酉矩阵(Unitary Matrix)或称幺正矩阵是正交矩阵在复数的推广即满足

正定矩阵(Positive Definite Matrix)即对所有非零向量都有的方阵等价于所有特征值都是正数的方阵记为半正定矩阵(PSD Matrix; Positive Semi-Definite Matrix)即对所有非零向量都有的方阵等价于所有特征值都是非负数的方阵记为

逆矩阵(Inverse Matrix)

阶矩阵若存在阶矩阵使那么称的逆矩阵记为矩阵的逆亦可理解为对矩阵所作的线性变换的还原

阶矩阵可逆的充分必要条件为

阶矩阵伴随矩阵(Adjugate Matrix)定义为如下数学形式

其中个元素的代数余子式

阶矩阵与其伴随矩阵满足下式 由上式可得逆矩阵的计算公式如下

矩阵乘积的逆如下式

可得下式即逆运算和转置的可交换性

相似矩阵(Similar Matrix)

都是阶矩阵若有可逆矩阵使下式成立则称的相似矩阵而称为相似变换矩阵

相似的充分必要条件是它们的特征矩阵相抵

若两矩阵相似则它们的特征值相同

若相似变换将矩阵变为对角矩阵则称这一过程为对角化(Diagonalization)即如下数学形式 能对角化能对角化且有下式 阶矩阵能对角化的充分必要条件是其有个线性无关的特征向量

对于实对称矩阵必有实正交矩阵使下式成立

厄米特矩阵(Hermite Matrix)

则称为厄米特矩阵则称为厄米特矩阵

厄米特矩阵的简单性质

厄米特矩阵的简单性质如下

  • 是厄米特矩阵则对正整数也是厄米特矩阵
  • 是可逆厄米特矩阵也是厄米特矩阵
  • 是厄米特矩阵则对实数也是厄米特矩阵
  • 是厄米特矩阵是厄米特矩阵的充分必要条件是
  • 是厄米特矩阵的充分必要条件是对任意方阵是厄米特矩阵

矩阵是厄米特矩阵的等价命题

矩阵是厄米特矩阵的等价命题如下

  • 是正定矩阵
  • 对任意阶可逆矩阵都是厄米特矩阵
  • 个特征值均为正数
  • 存在阶可逆矩阵使
  • 存在阶可逆矩阵使
  • 存在阶可逆厄米特矩阵使
  • 存在阶正定厄米特矩阵使
  • 存在阶非奇异下三角矩阵使

阶厄米特矩阵则存在阶酉矩阵使得其中是由的实特征值组成的对角矩阵即厄米特矩阵的特征分解

三角分解(Triangular Decomposition)

阶下三角矩阵阶上三角矩阵阶方阵的三角分解即如下数学形式

主对角线元素全为1的三角矩阵称为单位三角矩阵(Unitriangular Matrix)阶方阵可逆且所有顺序主子式均非零存在惟一的阶单位下三角矩阵阶上三角矩阵使得与此同时存在惟一的阶单位下三角矩阵阶对角矩阵阶单位上三角矩阵使得

阶方阵可逆则存在排列矩阵使得下式成立

特征分解(Eigendecomposition)

又称谱分解(Spectral Decomposition)阶方阵如果数维非零列向量使下式成立则称特征值(Eigenvalue)或本征值而称的对应于特征值特征向量(Eigenvector)或本征向量 由上式可知特征向量即不受矩阵变换改变方向的向量特征值即特征向量在变换中缩放的比例求解即所谓特征方程可得特征值代入上式可得特征向量阶矩阵在复数范围内有个特征值奇异矩阵(Singular Matrix)满足即含零特征值对角矩阵的特征值即

特征分解是使用最广的矩阵分解之一即将矩阵分解为一组特征向量和特征值记为如下形式

其中每一列都是一个特征向量是特征值连接成的向量

方阵中互不相等的特征值对应的特征向量线性无关对应于两个不同特征值的线性无关特征向量组合起来仍是线性无关的阶矩阵的特征方程有重根就不一定有个线性无关的特征向量

可将视作基变换矩阵则将线性变换应用于由基变换的基表示的向量即的结果为对角矩阵可大幅简化计算量

由实对称矩阵的性质可知每个实对称矩阵都可分解为实特征向量和实特征值但特征分解可能并不唯一实对称矩阵的分解可视作沿方向延展倍的空间

阶矩阵的特征值为则有如下结论

易知对于二阶方阵若存在特征值则可通过下式求解

行列式(Determinant)

行列式即在方阵上计算得到的标量计算式如下

其中的一个排列规定由小至大为标准次序前比大的数有则称的逆序数为排列中所有逆序数的总数称为这个排列的逆序数记为

行列式亦可表示线性变换改变有向面积或体积的缩放比例行列式为零即线性变换将空间压缩至更低的维度

行列式的性质

行列式的一些性质如下

  • 对换行列式的两行(列)行列式变号推论为若有两行(列)完全相同
  • 行列式中某一行(列)有公因子可提取至行列式之外
  • 中有不同的两行(列)成比例
  • 行列式可按某一行(列)进行拆解即设若某一行(列)而其他行(列)
  • 将行列式第(列)倍加到第(列)行列式的值不变
  • 但未必有
  • 可逆

余子式(Minor)

行列式的余子式定义为中除去第行和第列后剩余元素按照相对位置排成的新矩阵的行列式代数余子式(Cofactor)定义为如下数学形式 阶行列式的展开法则即下式利用这一法则并结合行列式的性质可简化行列式的计算

其中

克拉默法则(Cramer's Rule)

加百列·克拉默(Gabriel Cramer)

瑞士数学家克拉默法则因他的卓越使用而命名

设含个未知数的个线性方程的方程组如下 即线性变换降低了空间维度而形成子空间处于子空间则线性方程组一定有无穷多解否则无解易得齐次线性方程即时一定有无穷多解则方程组的解为或如下数学形式的唯一解

其中是将中第列的元素用方程组右端的常数项代替后得到的阶矩阵

张量(Tensor)

张量是向量的推广来源于物理学中的张力(Tension)向固体施加张力时会在固体的截面产生力的作用称为应力(Stress)张量使用基和分量的组合表示物理量且其所描述的物理量不随参考系而变化

0阶张量为标量1阶张量为向量2阶张量为矩阵

微积分(Calculus)

微积分又称初等数学分析(Elementary Mathematical Analysis)是研究极限微分积分和无穷级数等的数学分支

戈特弗里德·莱布尼兹(Gottfried Leibniz)

德国哲学家兼数学家艾萨克·牛顿先后独立发明微积分

牛顿最先将微积分应用到普通物理当中莱布尼兹则从几何出发引进微积分概念他所创设的微积分符号远远优于牛顿的符号

然而由于过去英国学者对牛顿的盲目崇拜英国皇家学会认定牛顿是微积分的第一发明人以致莱布尼兹直至去世后的几年都受到了冷遇目前微积分领域使用的符号仍是莱布尼兹所提出的

极限(Limit)

数列极限(Limit of a Sequence)

数列极限的定义数列的柯西收敛准则为如下数学形式 不是所有的数列都有极限如果一个数列有极限则称这个数列收敛(Convergent)否则称其为发散(Divergent)

数列极限的性质如下

  • 唯一性如果一个数列收敛那么它有且仅有一个极限
  • 有界性
  • 保序性

如果数列单调且有界则数列收敛称为单调收敛定理(MCT; Monotone Convergence Theorem)

数列极限的基本定理

数列极限的一些运算法则如下

满足下式的称为柯西数列(Cauchy Sequence)或基本列(Fundamental Sequence) 收敛数列一定是柯西数列且在上有极限上的柯西数列一定收敛

若空间中的任何柯西数列都收敛至该空间之内则称该空间为完备度量空间(Complete Metric Space)或柯西空间(Cauchy Space)具有完备性则不具有完备性

函数极限(Limit of a Function)

函数极限的定义函数的柯西收敛准则为如下数学形式即使点没有定义下式仍然成立

函数极限的性质如下

  • 唯一性如果一个函数收敛那么它有且仅有一个极限
  • 局部有界性
  • 局部保序性

对于满足下式则称函数在连续(Continuous)记为 若函数在的每个点都连续则称函数在连续

对于满足下式则称函数在上一致连续(Uniformly Continuous) 一致连续中的选择只依赖于而不依赖于定义域上点的位置开区间上的连续函数不一定一致连续而闭区间上的连续函数是一致连续的

常用极限

常用的极限如下

左极限定义为右极限定义为若考虑分段函数在分界点处的极限需要分左右求极限由函数极限的唯一性有如下定理 对于分子和分母为多项式的分式其极限的求解如下式

海涅定理(Heine's Definition of Limit)

爱德华·海涅(Eduard Heine)

德国数学家

又称海涅的极限定义归结原则数学形式如下 海涅定理将函数极限和数列极限相联系

无穷小(Infinitesimal)

对函数则称为当趋近于时的无穷小

相反的概念是无穷大一般又称无穷(Infinity)趋近于时无穷大的函数的极限是存在的但为了便于叙述一般也称函数的极限是无穷大

在自变量的同一变化过程中如果无穷大那么无穷小反之亦然

有限个无穷小之和也是无穷小有界函数与无穷小的乘积时无穷小各类无穷小的定义如下

  • 高阶无穷小如果的高阶无穷小记为
  • 低阶无穷小如果的低阶无穷小
  • 同阶无穷小如果的同阶无穷小
  • 阶无穷小如果是关于阶无穷小
  • 等价无穷小如果的等价无穷小记作

存在则有下式 上式表明求两个无穷小的极限时分子和分母都可用等价无穷小来替代使用得当可简化计算

常用等价无穷小

常用的等价无穷小如下

夹逼定理(Squeeze Theorem)

又称夹挤定理是求解极限的常用方法找到两个简单易求的极限将复杂难求的极限夹住两边极限相同就可以推得中间表达式的极限也和两边极限相同

对于数列极限的情况有如下数学表示 对于函数极限的情况有如下数学表示

导数(Derivative)

又称导函数描述函数在某点附近的变化率数学形式可如下

其中形如的为拉格朗日的记法形如的为莱布尼兹的记法

记法符号作为微分算子(Differential Operator)即以一个函数为输入以这个函数的导数为输出

若极限不存在则说明处不可导通常也称函数在处的导数无穷大函数在某点可导则一定在该点连续但连续不一定意味着可导

当函数定义域和值域都在实数域中导数可以表示函数曲线上某点切线的斜率(Slope)这称为导数的几何意义

常用导数公式

常数的导数公式如下 多项式的导数公式如下 指数函数和对数函数的导数公式如下 三角函数的导数公式如下 反三角函数的导数公式如下

函数的求导法则

都在某点具有导数对于四则运算有如下求导法则

对于复合函数有如下的链式法则(Chain Rule) 反函数(Inverse Function)即能实现逆运算的函数存在反函数

在区间单调可导且那么它的反函数也可导且有下式

高阶导数(Higher Order Derivatives)

如果函数的导数处可导则称二阶导数(Second Derivative)数学形式可如下 类似地有三阶导数等二阶及二阶以上的导数统称为高阶导数阶导数记为

偏导数(Partial Derivative)

偏导数指对一个多元函数的其中一个变量求导而保持其他变量恒定多元函数处对的偏导数定义如下

其中偏导数符号是导数符号的变体

类似导数如果偏导数的偏导数也存在则称之为二阶偏导数按照对变量求导次序的不同有如下的四个二阶偏导数

其中第二三两个偏导数称为混合偏导数

亚历克西·克莱罗(Alexis Clairault)

法国数学家兼天文学家

如果的两个二阶混合偏导数连续那么这两个二阶混合偏导数必然相等即与求导的次序无关这称为二阶导数的对称性又称克莱罗定理(Clairaut's Theorem)

二阶及二阶以上的偏导数统称为高阶偏导数

多元复合函数的求导法则

多元复合函数的求导即将计算分解并表示为一个无环图

均在可导多元函数处有连续偏导数则复合函数可导其导数又称全导数(Total Derivative)数学形式如下 若多元函数均在具有对以及对的偏导数多元函数具有连续偏导数则复合函数的两个偏导数均存在且其数学形式如下

上述公式均可推广至三个及以上变量的多元函数的情形

显函数(Explicit Function)即等号左端是因变量符号的形式不采用这种形式的称隐函数(Implicit Function)将一个隐函数化成显函数称为隐函数的显化隐函数的显化有时是困难的甚至是不可能的

对隐函数有如下求导公式

海森矩阵(Hessian Matrix)

奥托·海森(Otto Hesse)

德国数学家

多元函数的所有二阶偏导数都存在并在定义域内连续则其海森矩阵定义如下 次连续性的海森矩阵是对称矩阵

微分(Differential)

若函数的增量可表示为是不依赖于的常数则称函数是可微的关于自变量增量的微分记作

多元函数全微分(Total Differential)定义如下

近似计算

由导数的定义式可得如下约等式 如果都容易计算不然可以考虑用上式求近似值实际上上式也就是泰勒展开式的前两项

多元函数的近似计算式如下 如果都容易计算不然可以考虑用上式求近似值实际上上式也就是多元函数泰勒展开式的前三项

牛顿-拉弗森方法(Newton-Raphson Method)

艾萨克·牛顿(Isaac Newton)

英国物理学家兼数学家阐述了万有引力和三大运动定律

又称牛顿迭代法若求的根首先选择接近零点的并计算以求过点的切线再计算该切线与横轴交点的横坐标利用开始下一轮迭代整个过程即如下迭代公式 牛顿法也被用于求函数的极值由于函数取极值的点处的导数值为零故可用牛顿法求导函数的零点即如下迭代公式

多元函数的情况则使用海森矩阵求多元函数极值的迭代公式如下

拟牛顿法(Quasi-Newton Method)

多元函数的情况下的牛顿-拉弗森方法中求海森矩阵的逆是复杂的拟牛顿法应运而生在第次迭代下邻域的二阶泰勒展开得到下式

上式对求偏导得到下式

上式即的一阶偏导数近似代入得到下式

并改写为如下的等式

上式称为拟牛顿条件(Quasi-Newton Condition)拟牛顿法即寻找或寻找

DFP算法(Davidon-Fletcher-Powell Algorithm)假设是由加上两个附加项构成的该式两端同时乘以即下式

为使满足拟牛顿条件为如下数学形式

可知DFP算法的迭代公式如下

BFGS算法(Broyden-Fletcher-Goldfarb-Shanno Algorithm)是最流行的拟牛顿算法其假设该式两端同时乘以即下式

为使满足拟牛顿条件为如下数学形式

可知BFGS算法的迭代公式如下

洛必达法则(L'Hôpital's Rule)

纪尧姆··洛必达(Guillaume de L'Hôpital)

法国数学家导师为约翰·伯努利

洛必达法则以纪尧姆··洛必达的名字命名但实际上由约翰·伯努利发现

约翰·伯努利(Johann Bernoulli)

瑞士数学家雅各布·伯努利的弟弟

皆为为洛必达法则能够直接处理的未定式

未定式的转换

其他未定式如可转化为洛必达法则能够直接处理的未定式

则可通过下式转换 则可通过下式转换 则可通过下式转换 则可通过下式转换

洛必达法则表明对于未定式而言有下式成立

泰勒展开式(Taylor's Expansion)

布鲁克·泰勒(Brook Taylor)

英国数学家主要以泰勒展开式和泰勒级数闻名

泰勒展开式构建多项式以近似函数在某点领域中的值其数学形式如下

其中为泰勒展开式的余项(Remainder)即这个多项式和实际的函数值之间的偏差

称为麦克劳林展开式(Maclaurin's Expansion)

余项的表达形式有如下几种

  • 皮亚诺型余项(Peano Form of the Remainder)
  • 拉格朗日型余项(Lagrange Form of the Remainder)其中的增大的值会越来越接近带有拉格朗日型余项的泰勒展开式可以视为拉格朗日中值定理的推广

常见函数的带皮亚诺余项的麦克劳林展开式

泰勒展开式的证明

如下式 可知由罗尔定理可知存在使

求导得如下结果 代入上式可求得余项如下 由余项可间接证明泰勒展开式的模式

二元函数的泰勒展开式如下

其中引入记号为二元函数泰勒展开式的余项

多元函数的泰勒展开式如下

拉格朗日乘数法(The Method of Lagrange Multipliers)

拉格朗日乘数法以约瑟夫·拉格朗日命名是一种寻找多元函数在其变量受到一个或多个条件的约束时的极值的方法如求在等式约束(Equality Constraint)时的极值的问题可通过引入拉格朗日乘数(Lagrange Multiplier)或称对偶变量(Dual Variable)转换为求如下拉格朗日函数(Lagrangian)的极值的问题 更一般地对含个变量和个等式约束的情况如下

其中

对其各参数的偏导皆为零解出其各参数的值代入原方程即可求函数极值

定义增广拉格朗日函数(Augmented Lagrangian)如下

其中

增广拉格朗日函数即在拉格朗日函数的基础上增加等式约束的二次惩罚函数

现引入个不等式约束(Inequality Constraint)相应的广义拉格朗日函数定义为如下数学形式 设问题的定义域非空拉格朗日对偶函数(Lagrange Dual Function)定义如下 拉格朗日对偶函数是凹函数即使优化非凸也是如此令优化问题的最优值为称为优化问题的拉格朗日对偶问题(Lagrange Dual Problem)

令拉格朗日对偶问题的最优值为被称为优化问题的弱对偶性(Weak Duality)即弱对偶性对任何优化问题都成立则强对偶性(Strong Duality)成立

使用广义拉格朗日函数的结果是引入KKT条件(Karush-Kuhn-Tucker Conditions)其数学形式如下

对于关于矩阵的等式约束可引入拉格朗日乘数矩阵对应的拉格朗日函数如下

罗尔定理(Rolle's Theorem)

米歇尔·罗尔(Michel Rolle)

法国数学家以罗尔定理闻名

罗尔是微积分的早期批评者认为它基于不稳固的推论但后来改变立场罗尔定理的内容如下

在闭区间上连续在开区间内可微分那么内至少存在一点使下式成立

拉格朗日中值定理(Lagrange's Mean Value Theorem)

约瑟夫·拉格朗日(Joseph Lagrange)

法国籍意大利裔数学家和天文学家

拉格朗日中值定理又称有限增量定理在闭区间上连续在开区间内可微分那么内至少存在一点使下式成立 拉格朗日中值定理是罗尔定理的推广同时也是柯西中值定理的特殊情形当提到中值定理(MVT; Mean Value Theorem)时在没有特别说明下一般指拉格朗日中值定理

柯西中值定理(Cauchy's Mean Value Theorem)

奥古斯丁-路易·柯西(Augustin-Louis Cauchy)

法国数学家对同时代人和后世产生巨大影响

柯西中值定理又称扩展中值定理在闭区间上连续在开区间内可微分对任意内至少存在一点使下式成立

罗尔定理拉格朗日中值定理和柯西中值定理合称三大微分中值定理

不定积分(Indefinite Integral)

可导函数的导数为则称的一个反导数(Antiderivative)或原函数则称为的不定积分又称为积分常数不定积分记为下式可表示的任意一个反导数 微分运算与积分运算是互逆的即有下式

不定积分技巧

第一类换元法如下式 第二类换元法如下式 第二类换元法的常见情况如下

  • 被积函数中含有可令
  • 被积函数中含有可令
  • 被积函数中含有可令

分部积分法(Integration by Parts)将不易求得结果的积分式转化为等价的且易于求出结果的积分式其公式如下

常用不定积分公式

含指数函数和对数函数的常用积分公式如下 含三角函数的常用积分公式如下 含反三角函数的常用积分公式如下 其他常用积分公式如下

定积分(Definite Integral)

伯恩哈德·黎曼(Bernhard Riemann)

德国数学家首次对函数在给定区间上的积分提出精确定义

上有界中任意插入若干分点即如下描述 分点将区间分成如下的个小区间 各小区间的长度如下 在每个小区间上任取一点作函数值与小区间长度的乘积并求总和这个总和又称黎曼和(Riemann Sum)数学形式如下 如果当趋近于的极限总存在且与闭区间的分法与的取法无关那么称这个极限为函数上的黎曼积分(Riemann Integral)数学形式如下 达布大和(Upper Darboux Sum)定义如下 达布小和(Lower Darboux Sum)定义如下 达布积分(Darboux Integral)可记作如下数学形式 黎曼积分和达布积分是等价的

定积分在数值上可以理解为曲线直线直线和坐标轴横轴围成的图形的面积值是一种确定的实数值这称之为定积分的几何意义的取值有正也有负则定积分的值为坐标轴横轴上方图形的面积减去下方图形面积的差

对定积分的两则补充规定如下

定积分中值定理(Mean Value Theorem for Definite Integral)表明如果上连续那么在上至少存在一点使下式成立

定积分技巧

的积分区间为可通过下式利用函数的奇偶性求解定积分 是以为周期的连续函数则对任意数都有下式

定积分的几何应用

曲线以小区间的窄曲边梯形绕坐标轴横轴旋转而成的薄片体积即体积元素如下 进而可求曲线在闭区间上的旋转体体积如下 曲线在小区间上的小弧段长度即弧长元素如下 进而可求曲线在闭区间上的弧长如下

牛顿-莱布尼兹公式(Newton-Leibniz Formula)

积分上限的函数表示为如下数学形式 并且上可导其导数如下 由此可知积分上限函数就是的一个原函数又称微积分第一基本定理(The First Fundamental Theorem of Calculus)已知也是的一个原函数那么这两个原函数之差必定是某一个常数即下式 易知将其带入上式又将式代入上式可得下式 且更换记号得牛顿-莱布尼兹公式如下又称微积分第二基本定理(The Second Fundamental Theorem of Calculus)

多重积分(Multiple Integral)

二重积分的定义可由定积分的定义推广其数学形式如下

其中闭区域任意分成个面积分别记为的小闭区域各小闭区域任取一点记为各小闭区域的直径中的最大值记为

二重积分在数值上可以理解为以闭区域为底以曲面为顶的曲顶柱体的体积值是一种确定的实数值这称之为二重积分的几何意义

二重积分的计算法

若积分区域X型区域即可以用下式表示 则二重积分可转化为先对后对的二次积分数学形式如下 若积分区域Y型区域即可以用下式表示 则二重积分可转化为先对后对的二次积分数学形式如下

曲面表面积的计算法

设有曲面在需要求表面积的曲面上取面积为的小片曲面其在闭区域的投影为小闭区域记夹角为的法向量如下 的法向量如下 的计算式如下 进而可求小片曲面的面积即曲面的面积元素如下 进而可求曲面表面积如下

同理可推广概念至三重积分又称体积分即如下数学形式

其中空间有界闭区域任意分成个体积分别记为的小闭区域各小闭区域任取一点记为各小闭区域的直径中的最大值记为

二重及二重以上的积分即扩展到多元函数的积分统称为多重积分

反常积分(Improper Integral)

又称广义积分是对普通定积分的推广反常积分可分为如下两类

  • 第一类反常积分(Improper Integral of Type 1)

    又称无穷积分指区间的上限或下限中含无穷的积分如上限含无穷的积分为如下数学形式 第一类反常积分的定义可推广至上限及下限皆为无穷的积分即如下数学形式

  • 第二类反常积分(Improper Integral of Type 2)

    又称瑕积分指积分区间的上限或下限是被积函数的不连续点又称瑕点上连续且可积但在点上不连续定义第二类反常积分如下 第二类反常积分的定义可推广至上限及下限皆为不连续点或上限及下限之间含有不连续点的积分上连续且可积但在点上不连续推广的第二类反常积分如下

上述反常积分的定义式中若等号右端的极限皆存在则称该积分收敛若极限至少有一个不存在则称积分发散

托里拆利小号(Torricelli's Trumpet)

又称加百利号角(Gabriel's Horn)一个表面积无限大但体积有限的三维形状

埃万杰利斯塔·托里切利(Evangelista Torricelli)

意大利物理学家兼数学家以发明气压计而闻名

托里拆利小号由的曲线沿坐标轴横轴旋转而成其表面积和体积的计算如下

Γ函数(Gamma Function)

函数是阶乘在实数域上的扩展的定义如下 函数的重要性质如下

  • 递推公式

    递归出口如下

  • 余元公式

    可得特殊值如下

B函数(Beta Function)

的定义如下 函数具有对称性质等式成立

函数与函数的关系如下

微分方程(Differential Equation)

微分方程即描述函数与其导数关系的方程在物理学等交叉学科应用广泛

若微分方程中没有出现应变量及其微分的乘积则此微分方程为线性(Linear)微分方程否则即为非线性微分方程若线性微分方程的系数均为常数则为常系数线性微分方程

一阶微分方程的解法

一阶微分方程可记为如下形式 若一阶微分方程可化为如下形式则称为可分离变量的微分方程将下式两端积分即得通解 若一阶微分方程可化为如下形式则称为齐次(Homogeneous)微分方程

将其代入上式后分离变量并对等式两端积分可得下式求出下式的积分后再以代替即得通解 下式称为一阶线性微分方程 上式对应的齐次方程如下 分离变量并对等式两端积分得到对应的齐次方程的通解如下 使用所谓常数变易法可求一阶非齐次线性微分方程的通解即将上式的常数换为关于的未知函数并代入非齐次方程原式求得从而得到通解如下 上式等号右端的第一项为对应的齐次线性方程的通解第二项为非齐次线性方程在时的一个特解由此可知一阶非齐次线性方程的通解等于对应的齐次方程的通解与非齐次方程的一个特解之和

二阶常系数微分方程的解法

下式称为二阶常系数齐次线性微分方程 使用尝试是否满足方程得下式 由于可得下式又称微分方程的特征方程(Characteristic Equation) 根据特征方程的根的不同情形可得出微分方程的通解其对应关系如下

  • 若是共轭复数根的情况即

下式称为二阶常系数非齐次线性微分方程

根据的不同情况有不同的特解形式

  • (为多项式的最高次数)则其特解形式如下

    其中根据是方程对应的齐次方程的特征方程的重根这一规则取值

  • 则其特解形式如下

    其中注意为两个不同多项式且是方程对应的齐次方程的特征方程的根否则

代回原方程可求出多项式系数即得方程的特解方程的通解即其特解加上对应的齐次方程的通解

对于某些高阶微分方程可通过令的方式降阶以求解

无穷级数(Infinite Series)

数列的和称为无穷级数简称级数(Series)记为如下数学形式 上式中若等号右端的极限存在则称该级数收敛反之则称级数发散

级数收敛的必要条件如下

注意下式不是级数收敛的充分条件如调和级数的一般项趋于零但仍然发散

比较审敛法(Comparison Test)

有如下推理成立收敛收敛发散发散

比较审敛法的极限形式为若有下式 则有如下推理成立敛散相同收敛收敛若极限趋于无穷发散发散

比值审敛法(Ratio Test)

·勒朗·达朗贝尔(Jean le Rond D'Alembert)

法国物理学家兼数学家

又称达朗贝尔判别法(D'Alembert's Test)若有下式 则有如下推理成立收敛发散的敛散性无法通过该方法判断

积分审敛法(Integral Test)

为正项非递增函数连续则级数的敛散性与下式相同

向量分析(Vector Analysis)

关注向量场的微分和积分又称向量微积分(Vector Calculus)是微积分的分支学科

标量场(Scalar Field)

三维空间上各点对应具体的值而没有方向即各点的属性都可以用一个标量代表这样的多元函数称为标量函数(Scalar Function)又称标量场

标量场如温度场密度场等可以通过等值曲面(Isotimic Surface)来描述

方向导数(Directional Derivative)

多元函数沿单位向量的方向导数定义为如下数学形式 如果函数在点可微分那么函数沿单位向量的方向导数如下

梯度(Gradient)

引入向量微分算子或称Nabla算子记为读作/del/其数学形式如下 则梯度可定义为如下数学形式 前述方向导数的数学形式可如下表示

其中即梯度与单位向量的夹角

上式表明了函数在某点的梯度与函数在该点的方向导数间的关系

  • 函数在这个方向的方向导数达到最大值同时可得函数在该点的梯度的方向是函数在该点的方向导数取得最大值时的方向
  • 函数在这个方向的方向导数有最小值
  • 函数的变化率为零

可见梯度即标量场于场中某点增加率最大的速率与方向

标量场的曲线积分(Line Integral of Scalar Field)

又称对弧长的曲线积分第一类曲线积分定义如下

其中光滑曲线弧任意分成分成个长度分别为的小弧段各小弧段任取一点记为各小弧段的长度中的最大值记为

曲线积分计算公式如下

其中定积分的下限一定要小于上限因为长度总是正的

若积分路径为封闭曲线曲线积分可记为如下数学形式

标量场的曲面积分(Surface Integral of Scalar Field)

又称对面积的曲面积分第一类曲面积分定义如下

其中光滑曲面任意分成分成个面积分别为的小曲面各小曲面任取一点记为各小曲面的面积中的最大值记为

设积分曲面由方程确定曲面积分转换为二重积分的计算公式如下

其中闭区域的投影区域

若积分曲面为封闭曲面曲面积分可记为如下数学形式

向量场(Vector Field)

有别于标量场三维空间上各点对应的是由向量值函数(Vector-Valued Function)确定的向量则称之为向量场可记为如下数学形式

其中称为分量函数(Component Function)是关于点标量函数

若向量场是某个标量函数的梯度则称的一个势函数(Potential Function)并称向量场势场(Potential Field)任意一个向量场并不一定都是势场因为它不一定是某个标量函数的梯度

散度(Divergence)

三维空间中散度的定义如下 散度描述向量场的点是宿点(Sink)还是源点(Source)即单位体积流出量的程度

皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace)

法国天文学家兼数学家对天体力学和统计学的发展举足轻重

对标量场作梯度运算后再作散度运算的算子称为拉普拉斯算子(Laplace Operator)即如下数学形式

旋度(Curl)

三维空间中旋度的定义如下 旋度描述此向量场在点的旋转程度

向量场的曲线积分(Line Integral of a Vector Field)

又称对坐标的曲线积分第二类曲线积分记为如下数学形式

其中为一条光滑曲线

曲线积分计算公式如下

其中下限对应的起点上限对应的终点不要求小于

保守向量场(Conservative Vector Field)

简称保守场指曲线积分与路径无关仅与积分的起点与终点有关

梯度定理(Gradient Theorem)或称曲线积分基本定理表明若向量场为势场则下式成立

其中是区域内起点为终点为的一条光滑曲线

上式表明势场属于保守场若积分路径为封闭曲线易得下式成立 此外任意保守场都是无旋场即旋度为零

格林定理(Green's Theorem)

乔治·格林(George Green)

英国数学家兼物理学家格林定理以其命名

二维空间上的平滑封闭曲线围成闭区域若函数上且具有一阶连续偏导数则下式成立

向量场的曲面积分(Surface Integral of Vector Field)

向量场的曲面积分的几何意义为单位时间内流向曲面一侧的流量即通量(Flux)只有平行于曲面法向量的分量会对通量作出贡献要计算通量则需要取向量与曲面上每点单位法向量的点积即投影通常约定法向量是从里朝外的

向量场的曲面积分又称对坐标的曲面积分第二类曲面积分记为如下数学形式

卡尔·高斯(Carl Gauss)

德国数学家兼物理学家享有数学王子的美誉

高斯通量定理(Gauss's Flux Theorem)又称高斯散度定理(Gauss's Divergence Theorem)若闭区域由光滑闭曲面围成且向量场上具有一阶连续偏导数则下式成立

矩阵微积分(Matrix Calculus)

矩阵微积分是多元微积分的特殊表达

向量求导(Derivatives with Vectors)

向量关于标量的导数称为向量切向量(Tangent Vector)数学形式如下 标量关于向量的导数如下

标量对向量的求导法则

其中都不是关于的函数

卡尔·雅可比(Carl Jacobi)

普鲁士数学家

向量关于向量的导数称为雅可比矩阵(Jacobian Matrix)数学形式如下

对于标量函数其梯度的雅可比矩阵等于它的海森矩阵即下式 当雅可比矩阵为方阵其行列式称为雅可比行列式(Jacobi Determinant)

矩阵求导(Derivatives with Matrices)

矩阵对标量的导数称为切矩阵(Tangent Matrix)数学形式如下 标量函数对矩阵的导数如下

矩阵梯度运算的性质

矩阵梯度运算具有如下性质

统计学(Statistics)

统计学杂记

测度论(Measure Theory)

设集合为有界集下式为的外测度(Outer Measure) 若外测度满足可加性使得为可测集(Measurable Set)并记勒贝格测度(Lebesgue Measure)简称测度(Measure)

对于无界集都有可测为可测集其测度为如下数学形式 实数集的开集和闭集都是可测集可数个可测集的交集和并集都是可测集

设集合使得是零测集(Null Set)记为可数集是零测集但测度为零并不一定可数

若可测集上的广义实值函数对于都有为可测集上的可测函数(Measurable Function)

是可测集上的可测函数的值域为中任意插入若干分点即如下描述 分点将区间分成如下的个小区间 其中显然有

勒贝格大和(Upper Lebesgue Sum)定义如下 勒贝格小和(Lower Lebesgue Sum)定义如下 勒贝格积分(Lebesgue Integral)可记作如下数学形式

泛函分析(Functional Analysis)

泛函分析的研究对象是函数构成的函数空间