漫步凸分析一——仿射集

来源:互联网 发布:摄像头扫描软件 编辑:程序博客网 时间:2024/06/11 05:08

本文中,用R表示实数,Rn表示实nx=(ξ1,,ξn)的向量空间,除非特别指明,否则都是在Rn中讨论。在Rn中两个向量x,x的内积表示成

x,x=ξ1ξ1++ξnξn

符号A既可以表示m×n的实矩阵A,也可以表示从RnRm相应的线性变换xAx。转置矩阵以及从RmRn相应的伴随线性变换都用A表示,所以大家需要知道下式的含义

Ax,y=x,Ay

(在表示向量的符号中,*不进行任何操作;考虑到矩阵乘法,所有向量都看做列向量。我们不断的使用向量符号是为了让大家熟悉它的二元性,也就说说,既可以将向量看做点,也可以将向量看成线性函数的n元系数)所有证明过程都会用符号|| 表示证明结束。

如果x,yRn中不同的点,那么形如下面的点集就叫做通过x,y的直线

(1λ)x+λy=x+λ(yx),λR

MRn的一个子集,如果对于每一个xM,yM,λR,可得(1λ)x+λyM,那么我们称这个子集为仿射集(affine set)。

空集和空间Rn本身就是仿射集的极端例子,另外M仅有一个孤立点的情况也满足定义。一般来讲,仿射集必须包含通过任意两个点的整条直线,直观印象是不存在弯曲的部分,就像空间中的一条直线或者一个平面。

仿射集正式的几何意义可能是从线性代数中Rn子空间的定理发展来的,仿射集和子空间之间准确的对应关系可以用下面两个定理描述。

定理1.1 Rn的子空间是包含原点的仿射集。

证明:每个子空间包含0并且对于加法和标量乘法封闭,所以它是一个仿射集。

反过来,假设M是一个包含0的仿射集。对于所有的xM,λR,我们有

λx=(1λ)0+λxM

所以M对标量乘法封闭。接下来,如果xM,yM,我们有

12(x+y)=12x+(112)yM

因此

x+y=2(12(x+y))M

所以M也对加法封闭,故它是一个子空间。||

对于MRn,aRn,将M平移a定义为集合

M+a={x+a|xM}

仿射集平移后依然是仿射集,很容易验证这个结论。

对于仿射集M,如果对于某个a,M=L+a,那么我们说M平行于仿射集L。很明显,“ML平行”是Rn中仿射子集集类的一个等价关系,需要注意的是,这个平行定义和我们平常的平行定义是不同的,例如我们不能说一条线平行于一个平面,但可以说一条线平行于给定平面中的一条线,反之亦然。

定理1.2 每个非空仿射集M平行于唯一的子空间LL由下式给出

L=MM={xy|xM,yM}

证明:我们首先说明M不能与两个不同的子空间平行。平行于M的子空间L1,L2互相是平行的,那么存在某个a使得L2=L1+a。因为0L2,所以aL1,因此aL1。但是这样的话L1L1+a=L2,同理我们可以得到L2L1,所以L1=L2,这就建立了唯一性。接下来通过观察得到,对于所有yM,My=M+(y)M的一个平移操作,并且包含0,根据定理1.1以及刚刚的证明,这个仿射集肯定有唯一一个平行于M的子空间L,因为无论选择哪个yML=My恒成立,所以我们得出L=MM||

我们将非空仿射集的维数定义为与它平行的子空间的维数,(按照惯例,将空集的维数定义为-1)那么维数为0,1 和2的仿射集自然就称为点,线和面。Rn(n1)维的仿射集叫做超平面,超平面非常重要,因为他们不仅表示n维几何中的点,还具有其他含义。

超平面和其他仿射集也许能用线性函数和线性方程表示,我们可以从Rn的正交理论来推断这种形式。回忆一下,根据定义,xy意味着x,y=0,给定Rn的一个子空间L,使得xL(即对于每一个yLxy恒成立)的向量x 的集合叫做L的正交补,用L 表示。当然,这是另一个子空间,并且

dimL+dimL=n

L的正交补(L)L。如果b1,,bmL的一个基,那么xL等价于xb1,,xbm。特别地,Rn(n1) 维子空间是一维子空间的正交补,一维子空间的基由一个非零向量b构成,因此(n1)维子空间就是形如{x|xb} 的集合,其中b0。超平面就是集合平移后的结果。但是

{x|xb}+a={x+a|x,b=0}={y|ya,b=0}={y|y,b=β}

其中β=a,b,由此得到超平面的一个特征,即定理1.3。

定理1.3 给定βR和一个非零向量bRn,集合

H={x|x,b=β}

Rn中的一个超平面,而且每个超平面可能用这种方式表示。

在定理1.3中,向量b叫做超平面H的法向量,H的每个法向量要么是b的正倍数,要么是负倍数。也就是说每个超平面有两边,就像R2中的一条直线或者R3中的一个平面,注意R4中的一个平面没有两边。

下一个定理将Rn的仿射子集表示为含有n个变量的联立线性方程组的解集。

定理1.4 给定bRmm×n的实矩阵B,集合

M={xRn|Bx=b}

Rn中的仿射集,而且每个仿射集可能用这种方式表示。

证明:如果xM,yM,λR,那么对z=(1λ)x+λy,我们有

Bz=(1λ)Bx+λBy=(1λ)b+λb=b

所以zM,因此给定的M是仿射集。

另一方面,考虑任意一个非空仿射集M而不是Rn本身,让L是平行于M的子空间,令b1,,bmL的一组基,那么

L=(L)={x|xb1,,xbm}={x|x,bi=0,i=1,,m}={x|Bx=0}

其中Bm×n矩阵,它的行是b1,,bm。因为M平行于L,所以存在一个aRn使得

M=L+a={x|B(xa)=0}={x|Bx=b}

其中b=Ba。(仿射集Rn可以用定理中的形式表示,都令Bm×n的零矩阵,在Rn的情况下b=0,在的情况下b0)||

观察定理1.4我们还可以得出

M={x|x,bi=βi,i=1,,m}=mi=1Hi

其中biB的第i行,βib的第i个元素,

Hi={x|x,bi=βi}

每个Hi都是一个超平面(bi0),或者空集(bi=0,βi0),或者Rn(bi=0,βi=0)。 空集本身可能是两个不同平行超平面的交集,而Rn可能是Rn中空个超平面的交集,因此:

推论1.4.1 Rn中每个仿射子集是有限个超平面的交集。

定理1.4中的仿射集M可以用向量b1,,bn(他们组成B的列) 表示,

M={x=(ξ1,,ξn)|ξ1b1++ξnbn=b}

很明显,任意个仿射集的交集依然是仿射集,因此,给定任意SRn,存在一个唯一的包含S的最小仿射集(即,仿射集M的交集,其满足MS),这个集合叫做S 的仿射包并用aff S表示。通过证明可以得出aff S由所有形如λ1x1++λmxm的向量组成,其中xiS,λ1++λm=1

对于m+1个点b0,b1,,bm的集合,如果aff {b0,b1,,bm}m维的,那么这些点就是仿射无关(affinely independent)。当然

aff{b0,b1,,bm}=L+b0

其中

L=aff{0,b1b0,,bmb0}

利用定理1.1,L与包含b1b0,,bmb0的子空间是一样的,当且仅当这些向量是线性无关时它的维数是m,所以当且仅当b1b0,,bmb0线性无关时b0,b1,,bm是仿射无关。

所有关于线性无关的事实都可以应用到仿射无关上。例如,Rnm+1个点仿射无关可以扩充到n+1个点,一个m维仿射集M可以表示成m+1个点的仿射包(将平行于M子空间的基相应的点进行平移)

注意,如果M=aff{b0,b1,,bm},与M 平行的子空间L中的向量是b1b0,,bmb0的线性组合,因此M中的向量可以表示成如下形式

x=λ1(b1b0)++λm(bmb0)+b0


x=λ0b0+λ1b1++λmbm,λ0+λ1++λm=1

上面的表达式中,当且仅当b0,b1,,bm仿射无关时,x的系数是唯一的。这时候,作为参数的λ0,λ1,,λmM的重心坐标。

RnRm的单值映射T:xTx,如果对于Rn中的每一个x,yλR,下式成立

T((1λ)x+λy)=(1λ)Tx+λTy

那么这个映射就称为仿射变换。

定理1.5 从RnRm的仿射变换就是形如Tx=Ax+a的映射T,其中A是一个线性变换并且aRm

证明:如果T是仿射的,令a=T0,Ax=Txa,那么A是一个仿射变换,并且A0=0。类似于定理1.1,这个简单的论据说明A实际是线性的。

反过来,如果Tx=Ax+a,其中A是线性的,我们可以得出

T((1λ)x+λy)=(1λ)Ax+λAy+a=(1λ)Tx+λTy

因此T是仿射的。||

仿射变换的逆(如果存在的话)还是仿射的。

如果从RnRm的映射T是一个仿射变换,那么对于Rn中的每个仿射集M,像集TM={Tx|xM}Rm 中是仿射的。特别地,仿射变换保留仿射包:

aff(TS)=T(aff S)

定理1.6 令{b0,b1,,bm}{b0,b1,,bm}Rn中仿射无关集,那么存在一个Rn到自身的一一对应仿射变换T,使得对于i=0,,m,Tbi=bi。如果m=n,那么T是唯一的。

证明:如果需要的话,扩展给定的仿射无关集,我们可以将问题简化为m=n的情况,然后,正如线性代数中的那样,存在一个Rn到自身的一对一线性变换A,将Rn中的基b1b0,,bnb0变成另一组基b1b0,,bnb0,这就得到了我们需要的仿射变换Tx=Ax+a,其中a=b0Ab0||

推论 1.6.1 令M1,M2Rn中任意两个维数相同的仿射集,那么存在一个Rn到自身的一一对应的仿射变换T,使得TM1=M2

证明:任何m维仿射集可以表示成m+1个仿射无关集的仿射包,并且在仿射变换下保留仿射包。||

RnRm的仿射变换T的图像是Rn+m中的一个仿射子集,因为根据定理1.4,如果Tx=Ax+aT的图像由向量z=(x,y)组成,其中xRn,yRm,使得Bz=b,其中b=aB是从Rn+mRm的线性变换(x,y)Axy

特别地,从RnRm的仿射变换xAx图像时包含Rn+m原点的仿射集,因此它是Rn+m的某个子空间L(定理1.1),L的正交补如下

L={(x,y)|xRn,yRm,x=Ay}

LA的图像。事实上,当且仅当对每个z=(x,y),y=Ax,下式

0=z,z=x,x+y,y

成立,那么z=(x,y)属于L。换句话说,当且仅当对于每个xRn,下式

0=x,x+Ax,y=x,x+x,Ay=x,x+Ay

成立,(x,y)L。这就意味着x+Ay=0,即x=Ay

任何非平凡仿射集可以用多种方式表示成仿射变换的图像,令MRNn维仿射集,其中0<n<N。首先,我们可以将M表示成向量x=(ξ1,,ξN)的集合,并且坐标满足某个线性方程组

βi1ξ1++βiNξN=βi,i=1,,k.

根据定理1.4可知,这总是可能的。M的维度为n意味着系数矩阵B=(βij)零度为n并且秩为m=Nn,因此我们可以用ξ1¯,,ξn¯的形式求出ξn+1¯¯¯¯¯,,ξN¯的线性方程组,其中1¯,,N¯1,,N的某个排列,接下来就得到特定形式的方程组

ξn+i¯¯¯¯=αi1ξ1¯++αinξn¯+αi,i=1,,m.

再次给出了向量x=(ξ1,,ξN)属于M的充分必要条件,这个方程组称为给定仿射集的Tucker表示。它将M 表示成某个从RnRm仿射变换的图像,对于某个M,只有有限多个Tucker表示(最多N!个,低于M 中向量的m 个坐标变量ξi可以用另外n个坐标向量按某种顺序进行表示)。

涉及到仿射集的定理通常可以解释成线性方程的定理,这时候,可能给出仿射集的一个Tucker表示,这种表示非常重要,例如线性不等式中的某些结论(定理22.6,22.7)和Fenchel’s对偶定理的某些应用(推论31.4.2)

当然,子空间L的Tucker表示齐次形式为

ξn+i¯¯¯¯=αi1ξ1¯++αinξn¯,i=1,,m.

给定L的这种表示作为线性变换的图像,那么正如上面提到的,L对应于负伴随变换的图像,因此,当且仅当

ξj¯=ξn+i¯¯¯¯α1j++ξn+m¯¯¯¯¯αmj,j=1,,n

时,x=(ξ1,,ξN)属于L。这就给出了L的Tucker表示,因此给定一个子空间,它的Tucker表示与其正交补的Tucker表示之间有一个简单且有用的一一对应关系。

1 0
原创粉丝点击