-
Notifications
You must be signed in to change notification settings - Fork 30
/
Copy pathChap1.tex
2254 lines (2170 loc) · 88.2 KB
/
Chap1.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
%!TEX root = ../main.tex
\chapter{数学知识复习}
\label{ch:1}
本章提供了阅读本书所需要的数学背景知识。
量子化学中最重要的数学工具是矩阵代数。
我们将本章设计为针对这样一类读者:
他们对矩阵有一些认识,但已经很长时间没有接触过,
而又希望能得到一些线性代数的知识和应用经验。
对于具有较强数学背景的读者,
可以快速浏览本章,
以便熟悉本书使用的符号和记号。
简单起见,我们牺牲了数学严格性,
采用了一种非正式的方式来讲述这部分内容。
为了帮助读者掌握这些非常重要但又经常被忽视的数学技巧,
我们在知识点讲述过程中插入了许多认真选择的习题。
完成这些简单的习题对于掌握本章内容来说是一个必要的过程。
第一节中,我们逐步将三维矢量代数中遇到的概念和结论推广到线性代数的基本概念,
包括:矩阵、行列式、线性算符及其矩阵表示、以及计算矩阵本征值和本征矢量的方法,
后者在量子化学中尤其重要。
我们介绍了 Dirac 符号,
这使得我们可以将这些结论表述为一种简洁、优美的形式。
更为有用的是,
我们可以利用 Dirac 符号操作矩阵,
并更容易的推导各种定理。
此外,这种符号体系还突显出线性代数和完备正交函数集理论的内在联系,
这一部分我们将在第二节中涉及到。
第三节介绍了变分原理,这是量子化学理论的基石之一。
\section{线性代数}
\label{sec:1.1}
我们通过复习三维空间的矢量代数来开启关于线性代数的讨论。
在本节以及本书其它部分中用到的教学技巧是,
以最简单的情形为例展示最基本的概念和思路,
然后将这些结果推广到更为复杂的情景中去。
\subsection{三维矢量代数}
\label{sec:1.1.1}
一个三维矢量可以通过指定它的分量 $a_i,\; i = 1, 2, 3$ 来描述,
这三个分量分别对应于三个互相垂直的单位矢量 $\{\vec{e}_i\}$:
\begin{equation}
\vec{a} = \vec{e}_1 a_1 + \vec{e}_2 a_2 + \vec{e}_3 a_3 = \sum_i \vec{e}_i a_i
\label{eq:1.1}
\end{equation}
这三个矢量组成一组\emph{基}\index{基},
而它们本身则被称为\emph{基矢}。
如果任意一个三维矢量都可以写成这组基的线性组合,
则称这组基是完备的。
然而,基的选择不是唯一的;
我们可以选择其它三个互相垂直的单位矢量,
如 $\vec{\varepsilon}_i,\; i = 1, 2, 3$,
并将矢量 $\vec{a}$写作:
\begin{equation}
\vec{a} = \vec{\varepsilon}_1 a^\prime_1 + \vec{\varepsilon}_2 a_2^\prime + \vec{\varepsilon}_3 a_3^\prime = \sum_i \vec{\varepsilon}_i a_i^\prime
\label{eq:1.2}
\end{equation}
给定一组基,
一个矢量可以通过指定它在该组基内的三个分量完全确定。
如,利用基组 $\{\vec{e}_i\}$,
我们可以将矢量 $\vec{a}$ 写作一个\emph{列矩阵}的形式:
\begin{subequations}
\begin{equation}
{\mbf a} = \left(
\begin{array}{c} a_1 \\ a_2 \\ a_3 \end{array}
\right)
\label{eq:1.3a}
\end{equation}
或者利用基组 $\{\vec{\varepsilon}_i\}$ 写成
\begin{equation}
{\mbf a}^\prime = \left(
\begin{array}{c}a_1^\prime \\ a_2^\prime \\ a_3^\prime\end{array}
\right)
\label{eq:1.3b}
\end{equation}
\end{subequations}
两个矢量 $\vec{a}$ 和 $\vec{b}$ 的\emph{标积}或\emph{点积}定义为:
\begin{equation}
\vec{a}\cdot\vec{b} = a_1 b_1 + a_2 b_2 + a_3 b_3 = \sum_i a_i b_i
\label{eq:1.4}
\end{equation}
同时我们还注意到
\begin{equation}
\vec{a}\cdot\vec{a} = a_1^2 + a_2^2 + a_3^2 \equiv \vert a\vert^2
\label{eq:1.5}
\end{equation}
是矢量 $\vec{a}$ 的长度($\vert \vec{a}\vert$)的平方。
现在我们来看一下怎么利用\autoref{eq:1.1}计算标积 $\vec{a}\cdot\vec{b}$:
\begin{equation}
\vec{a}\cdot\vec{b} = \sum_i\sum_j \vec{e}_i\cdot\vec{e}_j\, a_i b_j
\label{eq:1.6}
\end{equation}
上式必须与\autoref{eq:1.4}相等,
因此,我们得到如下关系:
\begin{equation}
\vec{e}_i \cdot \vec{e}_j = \delta_{ij} = \delta_{ji} =
\begin{cases}
1 \quad \text{如果$i=j$} \\
0 \quad \text{其他情况}
\end{cases}
\label{eq:1.7}
\end{equation}
其中 $\delta_{ij}$ 为 Kronecker delta 函数。
上式是基矢\emph{正交归一}性质的数学描述:
基矢之间互相垂直(正交),
并且具有单位长度(归一)。
给定一个矢量 $\vec{a}$,
我们利用正交归一关系\autoref{eq:1.7},
通过求算公\autoref{eq:1.1}与基矢 $\vec{e}_j$ 之间的标量积来得到它的三个分量:
\begin{equation}
\vec{e}_j \cdot \vec{a} = \sum_i \vec{e}_j \cdot \vec{e}_i\, a_i = \sum_i \delta_{ji} a_i = a_j
\label{eq:1.8}
\end{equation}
这样我们又可以将公\autoref{eq:1.1}写成如下形式:
\begin{equation}
\vec{a} = \sum_i \vec{e}_i\vec{e}_i \cdot \vec{a} = \vec{1}\cdot\vec{a}
\label{eq:1.9}
\end{equation}
其中
\begin{equation}
\vec{1} = \sum_i \vec{e}_i \vec{e}_i
\label{eq:1.10}
\end{equation}
为单位\emph{并矢}。
当一个并矢与一个矢量进行点乘操作时,
会得到一个新的矢量。
而单位并矢与矢量点乘则会得到原来的矢量。公\autoref{eq:1.10}被称作基组 $\{\vec{e}_i\}$ 的\emph{完备性关系}。
它其实是公\autoref{eq:1.1}的变形,
说明了任意矢量 $\vec{a}$ 都可以写作基矢
$\{\vec{e}_i\}$ 的线性组合这一事实。
现在我们对\emph{算符}进行定义:
算符 $\mcr{O}$ 可以作用在一个矢量 $\vec{a}$ 上,
将之转变成另一个矢量 $\vec{b}$:
\begin{equation}
\mcr{O}\vec{a} = \vec{b}
\label{eq:1.11}
\end{equation}
对于任意的数 $x$ 和 $y$,如果一个算符满足下述关系:
\begin{equation}
\mcr{O}\left(x\vec{a} + y\vec{b}\right) = x\op{O}\vec{a} + y\op{O}\vec{b}
\label{eq:1.12}
\end{equation}
则$\op{O}$为\emph{线性}算符。
我们可以通过检查线性算符作用在每个可能矢量上的结果来确定这个算符本身。
由于任意矢量都可以写成基组 $\{\vec{e}_i\}$ 的线性组合,
只需要知道 $\op{O}$ 作用在基矢上的效果就足以确定该算符。
我们知道 $\op{O}\vec{e}_i$ 是一个矢量,
它可以写作基矢 $\bs{e}{i}$ 的线性组合:
\begin{equation}
\op{O}\vec{e}_i = \sum_{j=1}^3 \vec{e}_j O_{ji}, \quad i = 1, 2, 3
\label{eq:1.13}
\end{equation}
$O_{ji}$是一个数,它是矢量$\op{O}\vec{e}_i$沿基矢$\vec{e}_j$的分量。
这九个分量可以写成一个\emph{矩阵}:
\begin{equation}
\mbf{O} = \left(
\begin{array}{ccc}
O_{11} &O_{12} &O_{13} \\
O_{21} &O_{22} &O_{23} \\
O_{31} &O_{32} &O_{33} \\
\end{array}
\right)
\label{eq:1.14}
\end{equation}
这里,$\mbf{O}$被称作算符$\op{O}$在基组$\bs{e}{i}$的\emph{矩阵表示}。
矩阵$\mbf{O}$完全确定了算符$\op{O}$的效果,
这是因为:
任一矢量都可以写成基矢$\bs{e}{i}$的线性组合的形式,
而算符$\op{O}$作用在每个基矢上的效果又为已知。
\exercise{
a) 证明 $O_{ij} = \vec{e}_i \cdot \op{O}\vec{e}_j$。
b) 若$\op{O}\vec{a} = \vec{b}$,证明$b_i = \sum_j O_{ij}a_j$。
}
如果矩阵$\mbf{A}$ 和$\mbf{B}$分别为算符$\op{A}$和$\op{B}$的矩阵表示,
若算符$\op{C}$为$\op{A}$与$\op{B}$的乘积($\op{C} = \op{A}\op{B}$),
则$\op{C}$的矩阵表示可以通过如下方法得到:
\begin{equation}
\begin{split}
\op{C}\vec{e}_j &= \sum_i \vec{e}_i C_{ij} \\
&= \op{A}\op{B} \vec{e}_j \\
&= \op{A}\sum_k \vec{e}_k B_{kj} \\
&= \sum_{ik} \vec{e}_i A_{ik}B_{kj}
\end{split}
\label{eq:1.15}
\end{equation}
由此,我们得出:
\begin{equation}
C_{ij} = \sum_k A_{ik}B_{kj}
\label{eq:1.16}
\end{equation}
上式即为矩阵乘法的定义,因此,我们有:
\begin{equation}
\mathbf{C} = \mathbf{A}\mathbf{B}
\label{eq:1.17}
\end{equation}
这样,如果我们通过公\autoref{eq:1.16}定义矩阵的乘法,
则两个算符的乘积的矩阵表示即为这两个算符的矩阵表示的乘积。
在矩阵的乘法中,两个相乘算符的顺序非常重要。
通常情况下我们有 $\op{A}\op{B} \neq \op{B}\op{A}$,
或者 $\mathbf{A}\mathbf{B} \neq \mathbf{B}\mathbf{A}$,
即两个算符或两个矩阵并不一定是\emph{对易}的。
我们在此定义两个算符或矩阵的\emph{对易式},以供后面章节参考:
\begin{subequations}
\begin{align}
\left[\op{A}, \op{B}\right] &= \op{A}\op{B} - \op{B}\op{A} \\
\left[{\mbf A}{\mbf B}\right] &= {\mbf A}{\mbf B} - {\mbf B}{\mbf A}
\end{align}
\label{eq:1.18}
\end{subequations}
此外,两个算符或矩阵的\emph{反对易式}为:
\begin{subequations}
\begin{align}
\left\{\op{A},\op{B}\right\} &= \op{A}\op{B} + \op{B}\op{A}\label{eq:1.19a} \\
\left\{{\mbf A}{\mbf B}\right\} &= {\mbf A}{\mbf B} + {\mbf B}{\mbf A}\label{eq:1.19b}
\end{align}\label{eq:1.19}
\end{subequations}
\exercise{
已知:
\[
{\mbf A} =
\begin{pmatrix*}[r]
1 &1 &0 \\ 1 &\ \ 2 &2 \\ 0 &2 &-1
\end{pmatrix*}
\qquad
{\mbf B} =
\begin{pmatrix*}[r]
1 & -1 & \ \ 1 \\ -1 & 0 & 0 \\ 1 & 0 & 1
\end{pmatrix*}
\]
计算$\left[{\mbf A}, {\mbf B}\right]$ 和 $\left\{{\mbf A}, {\mbf B}\right\}$。
}
\subsection{矩阵}
\label{sec:1.1.2}
我们已经看到了$3\times 3$的矩阵是怎样从三维矢量代数中衍生出来,
并了解了怎样做矩阵之间的乘法,
本小节中我们会将把这些结论推广到更多维度的情形。
若有一系列复数$\left\{A_{ij}\right\}$,
具有有序的下标 $i = 1, 2, \dots, N$ 和 $j = 1, 2, \dots, M$,
则这些数可以看做一个矩阵 $\mbf A$的元素,
此矩阵有$N$行$M$列:
\begin{equation}
\mbf{A} =
\begin{pmatrix*}[c]
A_{11} &A_{12} &\dots &A_{1M} \\
A_{21} &A_{22} &\dots &A_{2M} \\
\vdots &\vdots & &\vdots \\
A_{N1} &A_{N2} &\dots &A_{NM}
\end{pmatrix*}
\label{eq:1.20}
\end{equation}
如果 $N=M$,则此矩阵为方阵。
如果$N\times M$的矩阵$\mbf A$的列数与$M\times P$的矩阵$\mbf B$的行数相等,
则矩阵 $\mathbf{A}$和$\mbf B$可以相乘,
其结果为$N\times P$的矩阵$\mbf C$:
\begin{equation}
\mbf{C} = \mbf{A}\mbf{B}
\label{eq:1.21}
\end{equation}
其中$\mbf C$的元素由矩阵乘法法则确定:
\begin{equation}
C_{ij} = \sum_{k=1}^M A_{ik}B_{kj}\qquad
\begin{array}{c}
i = 1, \dots, N \\
j = 1, \dots, M
\end{array}
\label{eq:1.22}
\end{equation}
$M$个数的集合$\left\{a_i\right\}, i = 1, 2, \dots, M$可以类似地看做一个列矩阵的元素:
\begin{equation}
\mbf a =
\begin{pmatrix*}[c]
a_1 \\ a_2 \\ \vdots \\ a_M
\end{pmatrix*}
\label{eq:1.23}
\end{equation}
对于一个$N\times M$的矩阵$\mbf A$,我们有:
\begin{equation}
\mbf A \mbf a = \mbf b
\label{eq:1.24}
\end{equation}
此处 $\mbf b$为一个具有$N$个元素的列矩阵,其元素为:
\begin{equation}
b_i = \sum_{j=1}^M A_{ij}a_j \qquad i = 1, 2, \dots, N
\label{eq:1.25}
\end{equation}
下面我们将介绍一些重要的定义。
一个$N\times M$矩阵 $\mbf A$的\emph{伴随矩阵},
记为$\mbf{A}^\dagger$,是一个$M \times N$的矩阵,其元素为:
\begin{equation}
\left(\mbf{A}^\dagger\right)_{ij} = A_{ji}^{\ast}
\label{eq:1.26}
\end{equation}
即对矩阵$\mbf A$的每个元素取复共轭,
并交换矩阵的行和列。
如果$\mbf A$为实矩阵,
则其伴随矩阵称为$\mbf A$的\emph{转置}。
\exercise{
若$\mbf A$为维度$N \times M$的矩阵,$\mbf B$为$M \times K$矩阵,证明$\left( \mbf{A} \mbf{B} \right)^{\dagger} = \mbf{B}^\dagger \mbf{A}^\dagger$。
}
一个列矩阵的伴随矩阵为一个\emph{行矩阵},
其元素为原矩阵元素的复共轭:
\begin{equation}
{\mbf a}^{\dagger} =
\begin{pmatrix*}[c]
a_1^\ast & a_2^\ast &\dots &a_M^\ast
\end{pmatrix*}
\label{eq:1.27}
\end{equation}
如果${\mbf a}$和$\mbf b$均为含有$M$个元素的列矩阵,则有:
\begin{equation}
{\mbf a}^{\dagger}{\mbf b} =
\begin{pmatrix*}[c]
a_1^\ast & a_2^\ast &\dots &a_M^\ast
\end{pmatrix*}
\begin{pmatrix*}[c]
b_1 \\ b_2 \\ \vdots \\ b_M
\end{pmatrix*}
= \sum_{i=1}^M a_i^{\ast} b_i
\label{eq:1.28}
\end{equation}
通过与\autoref{eq:1.4}相比,
我们注意到,如果$\mbf a$和$\mbf b$均为实矩阵且$M$值为3时,
上式即为两个三维矢量的标量积。
对\autoref{eq:1.24}两边分别取其伴随矩阵,
并引用\autoref{ex:1.3} 的结论,
我们得到如下关系:
\begin{equation}
{\mbf b}^\dagger = {\mbf a}^\dagger {\mbf A}^\dagger
\end{equation}
此处$\madj{b}$是一个具有 $N$ 个元素的行矩阵:
\begin{equation}
b_i^\ast = \sum_{j=1}^M a_j^\ast \left(\madj{A}\right)_{ji} = \left(
\sum_{j=1}^M a_j A_{ij}
\right)^\ast
\label{eq:1.30}
\end{equation}
我们看到\autoref{eq:1.30}和\autoref{eq:1.25}互为复共轭。
下面我们直接给出关于\emph{方阵}的一些定义和性质:
\begin{enumerate}
\item 若矩阵$\mbf A$的非对角元全为零,则称$\mbf A$为\emph{对角}阵:
\begin{equation}
A_{ij} = A_{ii}\delta_{ij}
\label{eq:1.31}
\end{equation}
\item 矩阵$\mbf A$的\emph{迹}是其全部对角元的加和:
\begin{equation}
\tr{\mbf A} = \sum_i A_{ii}
\label{eq:1.32}
\end{equation}
\item \emph{单位}矩阵的定义为,对任意矩阵$\mbf A$,如下关系成立:
\begin{equation}
{\mbf 1} {\mbf A} = {\mbf A}{\mbf 1} = {\mbf A}
\label{eq:1.33}
\end{equation}
单位阵的元素为:
\begin{equation}
\left(\mbf 1\right)_{ij} = \delta_{ij}
\label{eq:1.34}
\end{equation}
\item 矩阵$\mbf A$的\emph{逆矩阵}记为${\mbf A}^{-1}$,满足如下关系:
\begin{equation}
{\mbf A}^{-1}{\mbf A} = {\mbf A}{\mbf A}^{-1} = {\mbf 1}
\label{eq:1.35}
\end{equation}
\item 若矩阵$\mbf A$的逆矩阵与其伴随矩阵相等,则$\mbf A$为\emph{幺正}矩阵:
\begin{equation}
{\mbf A}^{-1} = \madj{A}
\label{eq:1.36}
\end{equation}
一个实幺正矩阵被称为\emph{正交}阵。
\item 自伴随矩阵称为\emph{Hermitian}矩阵,即:
\begin{subequations}
\begin{equation}
\madj{A} = {\mbf A} \\
\label{eq:1.37a}
\end{equation}
或者
\begin{equation}
A_{ji}^\ast = A_{ij}
\label{eq:1.37b}
\end{equation}
\end{subequations}
实Hermitian矩阵被称为\emph{对称}矩阵。
\end{enumerate}
\exercise{
证明下述关系:
\begin{enumerate}[1.]
\item $\tr{\mbf{AB}} = \tr{\mbf{BA}}$
\item $\left(\mbf{AB}\right)^{-1} = {\mbf B}^{-1}{\mbf A}^{-1}$
\item 设$\mbf B$为幺正,且有关系${\mbf B} = \madj{U}{\mbf A}{\mbf U}$,则有${\mbf A} = {\mbf U}{\mbf B}{\madj U}$。
\item 若两个Hermitian矩阵${\mbf A}$和${\mbf B}$的乘积${\mbf C} = \mbf{AB}$也是Hermitian矩阵,则${\mbf A}$和${\mbf B}$对易。
\item 设${\mbf A}$为Hermitian矩阵,如果它的逆${\mbf A}^{-1}$存在,则逆矩阵也是Hermitian矩阵。
\item 如果
\[ {\mbf A} =
\begin{pmatrix}
A_{11} & A_{12} \\ A_{21} & A_{22}
\end{pmatrix} \]
则有
\[ {\mbf A}^{-1} = \frac{1}{\left(A_{11}A_{22} - A_{12}A_{21}\right)}
\begin{pmatrix*}[r]
A_{22} & -A_{12} \\ -A_{21} & A_{11}
\end{pmatrix*} \]
\end{enumerate}
}
\subsection{行列式}
\label{sec:1.1.3}
本小节中,我们将介绍方阵的行列式的性质。
我们知道关于$1, 2, 3, \dots, N$这$N$个数的一个\emph{排列},
就是将这些数排序的一种方式,
而这些数共有 $N!$种不同的排列方式。
一个$N\times N$的矩阵 $\mbf A$ 的\emph{行列式}是一个数,
它的值通过下式求得:
\begin{equation}
\det{\mbf A} = \vert {\mbf A} \vert = \begin{vmatrix}
A_{11} &\dots &A_{1N} \\ \vdots & &\vdots \\ A_{N1} &\vdots &A_{NN}
\end{vmatrix} = \sum_{i=1}^{N!} \left(-1\right)^{p_i}\op{P}_iA_{11}A_{22}\cdots A_{NN}
\label{eq:1.38}
\end{equation}
其中$\op{P}_i$是排列算符,
它的作用是对连乘中各元素列下标进行排列,
上式的加和共有$N!$项;
$p_i$为由标准排列 $1, 2, 3, \dots, N$ 到一个给定的排列 $i_1, i_2, \dots, i_N$ 所需要的交换次数。
需要注意的是,
我们仅关心$p_i$是奇数还是偶数。
下面我们通过一个$2 \times 2$的矩阵来演示行列式的计算。
\[{\mbf A} = \begin{pmatrix}
A_{11} & A_{12} \\ A_{21} & A_{22}
\end{pmatrix}\]
对于列下标$1$和$2$,我们有两种排列方式,即:
\[
1 \quad 2 \quad \left(p_1 = 0\right)\]\[
2 \quad 1 \quad \left(p_2 = 1\right)\]
因此,
\begin{equation}
\begin{vmatrix}
A_{11} & A_{12} \\ A_{21} &A_{22}
\end{vmatrix} = \left(-1\right)^0 A_{11}A_{12} + \left(-1\right)^1 A_{12}A_{21} = A_{11}A_{12} - A_{12}A_{21}
\label{eq:1.39}
\end{equation}
由这些定义,我们可以得出以下关于行列式的重要性质:
\begin{enumerate}
\item 如果一个行列式的一行或一列全为零,则行列式的值为零。
\item 如果${\mbf A}_{ij} = A_{ii}\delta_{ij}$,则$\vert A\vert = \prod_i A_{ii} = A_{11}A_{22}\cdots A_{NN}$。
\item 交换行列式的两行或两列,行列式的值变号。
\item $\vert \mbf{A} \vert = \left(\vert\madj{A}\vert\right)^\ast$ .
\item $\vert {\mbf{AB}}\vert = \vert{\mbf A}\vert\vert\mbf{B}\vert$ .
\end{enumerate}
\exercise{
用一个$2\times 2$的行列式做例子,验证上述行列式的性质。
\Next
应用上述行列式性质,证明以下关系成立:
\begin{enumerate}
\item 如果行列式的两行或两列相等,则行列式的值为零。
\item $\vert\mbf{A}^{-1}\vert = \left(\vert\mbf{A}\vert\right)^{-1}$
\item 如果${\mbf A}{\madj A} = {\mbf 1}$,则$\vert{\mbf A}\vert\left(\vert\mbf{A}\vert\right)^{\ast} = \mbf{1}$。
\item 如果 $\madj{U}{\mbf O}{\mbf U} = \boldsymbol{\Omega}$和$\madj{U}{\mbf U} = \mbf{U}\madj{U} = \mbf 1$,则有 $\vert \mbf{O}\vert = \vert\mathbf{\Omega}\vert$。
\end{enumerate}
\Next
对照\autoref{eq:1.39},
我们发现在\autoref{ex:1.4}f 中得到的$2\times 2$矩阵 $\mbf A$的逆可以写作:
\[{\mbf A}^{-1} = \frac{1}{\vert\mbf{A}\vert}
\begin{vmatrix*}[r]
A_{22} & -A_{12} \\ -A_{21} & A_{11}
\end{vmatrix*}
\]
由此看到,如果$\vert\mbf{A}\vert = 0$,
则$\vert\mbf{A}\vert^{-1}$不存在。
这个结论对于$N\times N$维的矩阵也成立。
验证如下方程:
\[{\mbf A}{\mbf c} = 0\]
有非平凡解($\mbf{c}\neq 0$)的必要条件是 $\vert\mbf{A}\vert = 0$。
其中,$\mbf A$为$N\times N$矩阵,
$\mbf c$为列矩阵,
其元素为$c_i,\; i = 1, 2, \dots, N$。
}
对于$2\times 2$行列式,很容易通过直接求算来验证如下关系:
\[
\begin{vmatrix}
c_1B_{11} + c_2B_{12} & A_{12} \\ c_1B_{21} + c_2B_{22} & A_{22}
\end{vmatrix} =
c_1 \begin{vmatrix}
B_{11} & A_{12} \\ B_{21} & A_{22}
\end{vmatrix} +
c_2 \begin{vmatrix}
B_{12} & A_{12} \\ B_{22} & A_{22}
\end{vmatrix}
\]
这是 N 维行列式性质的一个特殊情形,
本书后面内容将多次用到行列式的这个性质:
\begin{equation}
\begin{split}
\begin{vmatrix}
A_{11} & A_{12} &\cdots &\displaystyle\sum_{k=1}^M c_kB_{1k} &\cdots &A_{1N} \\
A_{11} & A_{22} &\cdots &\displaystyle\sum_{k=1}^M c_kB_{2k} &\cdots &A_{2N} \\
\vdots &\ &\ &\ &\vdots \\
A_{11} & A_{N2} &\cdots &\displaystyle\sum_{k=1}^M c_kB_{Nk} &\cdots &A_{NN}
\end{vmatrix}\qquad \\
\qquad = \sum_{k=1}^{M} c_k \begin{vmatrix}
A_{11} & A_{12} &\cdots &B_{1k} & \cdots & A_{1N} \\
A_{21} & A_{22} &\cdots &B_{2k} & \cdots & A_{2N} \\
\vdots &\vdots &\ &\vdots &\ &\vdots \\
A_{N1} & A_{N2} &\cdots &B_{Nk} & \cdots & A_{NN} \\
\end{vmatrix}
\end{split}
\label{eq:1.40}
\end{equation}
对于行存在加和的情形,也有一个类似的结论。
\subsection{N 维复矢量空间}
\label{sec:1.1.4}
下面我们将在三维矢量代数中用到的方法和得到的结论推广到$N$维空间,
并且此时矢量可以为复数。
我们将开始使用 Dirac 符号,
这是一套强有力的符号体系,
可以简洁地表述我们得到的结论。
与三维空间的基组$\bs{e}{i}$类似,
在$N$维空间中,
我们把$N$个基矢量标记为 $\ket{i},\; i = 1, 2, \dots, N$。
这些基矢被称为\emph{右矢量}或\emph{右矢}。我
们总是可以选择一套完备的基矢,
从而可以将 $N$维空间中的任意右矢 $\ket{a}$写为如下形式:
\begin{equation}
\ket{a} = \sum_{i=1}^{N} \ket{i} a_i
\label{eq:1.41}
\end{equation}
上式是\autoref{eq:1.1}的简单推广,
不过这里我们用到了新引入的 Dirac 符号。
指定基组以后,
我们可以通过给出矢量沿$N$个基矢$\left\{\ket{i}\right\}$的组份$a_i$来完全描述这个矢量,
其中$i = 1, 2, \dots, N$。
同样,我们还可以将这些分量写到列矩阵里面:
\begin{equation}
{\mbf a} = \begin{pmatrix}
a_1 \\ a_2 \\ \vdots \\ a_N
\end{pmatrix}
\label{eq:1.42}
\end{equation}
这里 $\mbf a$是抽象的矢量 $\ket{a}$在基组 $\left\{\ket{i}\right\}$ 中的矩阵表示。
\autoref{eq:1.27}提到,
一个列矩阵$\mbf a$的伴随矩阵$\madj{a}$是一个行矩阵:
\begin{equation}
\madj{a} = \begin{pmatrix}
a_1^\ast & a_2^\ast &\cdots &a_N^\ast
\end{pmatrix}
\label{eq:1.43}
\end{equation}
这里我们引入另一个抽象的矢量\emph{左矢} $\bra{a}$,
它的矩阵表示为 $\madj{a}$。
左矢$\bra{a}$和右矢$\ket{b}$之间的标量积定义为:
\begin{equation}
\bra{a}\ket{b} \equiv \olp{a}{b} = \madj{a}\mbf{b} = \begin{pmatrix}
a_1^\ast & a_2^\ast &\cdots &a_N^\ast
\end{pmatrix} \begin{pmatrix}
b_1 \\ b_2 \\ \vdots \\ b_N
\end{pmatrix} = \sum_{i=1}^N a_i^\ast b_i
\label{eq:1.44}
\end{equation}
上式同样是\autoref{eq:1.4}的简单推广。
左矢和右矢的英文名分别为 bra ($\bra{\ }$) 和 ket($\ket{\ }$),
来自于它们的标量积表达式($\olp{\ }{\ }$)形似括号(bra-c-ket)。
我们还注意到
\begin{equation}
\olp{a}{a} = \sum_{i=1}^N a_i^\ast a_i = \sum_{i=1}^N \vert a_i\vert^2
\label{eq:1.45}
\end{equation}
只能取正实数值,是三维矢量的长度平方的一个推广。
类似于\autoref{eq:1.41},
我们还可以引入一套完备的左基组$\bbs{i}$,
这样可以将任意的左矢 $\bra{a}$写为左基矢的线性组合:
\begin{equation}
\bra{a} = \sum_i a_i^\ast \bra{i}
\label{eq:1.46}
\end{equation}
这时矢量$\bra{a}$ 和$\ket{b}$的标量积可以表述为:
\[
\olp{a}{b} = \sum_{ij}a_i^\ast \olp{i}{j} b_j
\]
上式应与\autoref{eq:1.44}中关于标量积的定义等同,因此,我们有:
\begin{equation}
\olp{i}{j} = \delta_{ij}
\label{eq:1.47}
\end{equation}
此式是\autoref{eq:1.7}在$N$维空间的推广,
描述了基矢的正交归一性。
总之,我们可以将右矢$\ket{a}$写为列矩阵$\mbf a$的形式,
可以将左矢$\bra{b}$写为行矩阵$\madj{b}$的形式,
它们的标量积则可以写成各自矩阵表示的矩阵乘积。
现在想一下,给定一个右矢 $\ket{a}$或一个左矢$\bra{a}$,
怎样才能得到它在基组$\kbs{i}$或$\bbs{i}$中的各个分量呢?
下面我们将完全参照三维情形[\autoref{eq:1.8}]来完成这一步:
把\autoref{eq:1.41}从左边乘$\bra{j}$,
\autoref{eq:1.46}从右边乘$\ket{j}$,
这样我们有:
\begin{subequations}
\begin{equation}
\olp{j}{a} = \sum_i\olp{j}{i}a_i = \sum_i \delta_{ji}a_i = a_j
\label{eq:1.48a}
\end{equation}
以及
\begin{equation}
\olp{a}{j} = \sum_i a_i^\ast \olp{i}{j} = \sum_i a_i^\ast\delta_{ij} = a_j^\ast
\label{eq:1.48b}
\end{equation}
\end{subequations}
这里我们提到的``方程两边从左边乘$\bra{j}$''是``分别求取方程两边与$\bra{j}$的标量积''的简便说法。
我们还注意到
\begin{equation}
\olp{j}{a} = \left(\olp{a}{j}\right)^\ast = \olp{a}{j}^\ast
\label{eq:1.49}
\end{equation}
利用这个结果可以将\autoref{eq:1.41}和\autoref{eq:1.46}写成如下形式:
\begin{subequations}
\begin{equation}
\ket{a} = \sum_i \ket{i}a_i = \sum_i \ket{i}\olp{i}{a}
\label{eq:1.50a}
\end{equation}
以及
\begin{equation}
\bra{a} = \sum_i a_i^\ast\bra{i} = \sum_i \olp{a}{i}\bra{i}
\label{eq:1.50b}
\end{equation}
\end{subequations}
从上面两式可以得到:
\begin{equation}
\mbf{1} = \sum_i \ket{i}\bra{i}
\label{eq:1.51}
\end{equation}
即为$N$维空间基组的完备性关系,
是\autoref{eq:1.10}的推广。
我们将会发现,
在很多公式推导中插入完备性关系是一个非常有用的方法。
与公\autoref{eq:1.11}类似,
我们通过作用在右矢上的效果来定义算符:
算符$\op{O}$作用在右矢$\ket{a}$上,
将之转变成右矢$\ket{b}$
\begin{equation}
\op{O}\ket{a} = \ket{b}
\label{eq:1.52}
\end{equation}
与三维情形相同,
一旦能够确定算符作用在基组上的效果,
这个算符就完全确定了,
\begin{equation}
\op{O}\ket{i} = \sum_j\ket{j}O_{ji} = \sum_j\ket{j}\left(\mbf{O}\right)_{ji}
\label{eq:1.53}
\end{equation}
这里$\mbf O$是算符$\op{O}$在基组$\kbs{i}$内的矩阵表示。
将\autoref{eq:1.53}式从左边乘$\bra{k}$,我们得到:
\begin{equation}
\Mele{k}{O}{i} = \sum_j\olp{k}{j}\left(\mbf O\right)_{ji} = \sum_j\delta_{kj} \left(\mbf O\right)_{ji} = \left(\mbf O\right)_{ki}
\label{eq:1.54}
\end{equation}
上式即为$\mbf O$的矩阵元的表达式。
需要注意的是,借助完备性关系\autoref{eq:1.51},
我们也可以容易地通过以下方法得到算符$\op{O}$的矩阵表示:
\begin{equation}
\op{O}\ket{i} = {\mbf 1}\op{O}\ket{i} = \sum_j\ket{j}\Mele{j}{O}{i}
\label{eq:1.55}
\end{equation}
上式与\autoref{eq:1.53}相比,我们有:
\begin{equation}
\Mele{j}{O}{i} = \left(\mbf O\right)_{ji} = O_{ji}
\label{eq:1.56}
\end{equation}
下面我们通过另一个例子来展示完备性关系以及 Dirac 符号内禀的简明和一致性的应用:
已知算符$\op{A}$和$\op{B}$的矩阵表示,推导他们的乘积$\op{C} = \op{A}\op{B}$的矩阵表示。
\[
\begin{split}
\Mele{i}{C}{j} = \left(\mbf C\right)_{ij} = \Mele{i}{AB}{j} &= \left\langle i\middle\vert\op{A}\mbf{1}\op{B}\middle\vert j\right\rangle \\
&= \sum_k \Mele{i}{A}{k} \Mele{k}{B}{j} \\
&= \sum_k \left(\mbf A\right)_{ik} \left(\mbf B\right)_{kj}
\end{split}
\]
算符$\op{O}$的\emph{伴随}算符标记为$\oadj{O}$。
如果算符$\op{O}$作用在右矢$\ket{a}$上将之转变成$\ket{b}$,
则其伴随算符将左矢$\bra{a}$转变成$\bra{b}$:
\begin{equation}
\bra{a}\oadj{O} = \bra{b}
\label{eq:1.57}
\end{equation}
上式与\autoref{eq:1.52}互为伴随。
在\autoref{eq:1.52}两边同左乘$\bra{c}$,
\autoref{eq:1.57}两边同右乘$\ket{c}$,我们得到:
\[
\Mele{c}{O}{a} = \olp{c}{b}
\]
以及
\[
\left\langle a\middle\vert \oadj{O}\middle\vert c\right\rangle = \olp{b}{c}
\]
由于$\olp{b}{c} = {\olp{c}{b}}^\ast$,如下关系成立:
\begin{equation}
\left\langle a\middle\vert \oadj{O}\middle\vert c\right\rangle = {\Mele{c}{O}{a}}^\ast
\label{eq:1.58}
\end{equation}
由于$a, b$和$c$为任意矢量,
这样我们就证明了算符$\oadj{O}$的矩阵表示与算符$\op{O}$的矩阵表示的伴随矩阵相等:
\begin{equation}
\left\langle i\middle\vert \oadj{O}\middle\vert j\right\rangle \equiv \left(\mbf{O}^\dagger\right)_{ij} = {\Mele{j}{O}{i}}^\ast \equiv O_{ji}^\ast
\label{eq:1.59}
\end{equation}
在本小节最后,我们介绍一下Hermitian算符,即自伴算符:
\begin{equation}
\op{O} = \oadj{O}
\label{eq:1.60}
\end{equation}
Hermitian算符矩阵表示的矩阵元满足如下关系:
\begin{equation}
\Mele{a}{O}{b} = \left\langle a\middle\vert \oadj{O}\middle\vert b\right\rangle = {\Mele{b}{O}{a}}^\ast
\label{eq:1.61}
\end{equation}
\subsection{基组变换}
\label{sec:1.1.5}
在\autoref{sec:1.1.1}中,
我们知道了基组的选择不是唯一的。
给定两个完备的正交归一基组$\kbs{i}$和$\kbs{\alpha}$,
本小节中我们将找出他们之间的关系。
我们把第一个基组下左矢和右矢用拉丁字母$i, j, k, \dots$标记;
第二个基组下的矢量用希腊字母$\alpha, \beta, \gamma, \dots$标记。
这样,我们有:
\begin{subequations}
\begin{equation}
\olp{i}{j} = \delta_{ij}, \qquad\sum_i \oup{i}{i} = \mbf{1}
\label{eq:1.62a}
\end{equation}
以及
\begin{equation}
\olp{\alpha}{\beta} = \delta_{\alpha\beta}, \qquad \sum_{\alpha}\oup{\alpha}{\alpha} = \mbf{1}
\label{eq:1.62b}
\end{equation}
\end{subequations}
由于基组$\kbs{i}$是完备的,
我们可以将基组$\kbs{\alpha}$中的任一基矢$\ket{\alpha}$展开为基组$\kbs{i}$中基矢的线性组合,
反之亦然。即:
\begin{equation}
\ket{\alpha} = \mbf{1}\ket{\alpha} = \sum_i\ket{i}\olp{i}{\alpha} = \sum_i \ket{i}U_{i\alpha} = \sum_i \ket{i}\left(\mbf U\right)_{i\alpha}
\label{eq:1.63}
\end{equation}
其中,变换矩阵$\mbf U$的矩阵元定义为:
\begin{equation}
\olp{i}{\alpha} = U_{i\alpha} = \left(\mbf U\right)_{i\alpha}
\label{eq:1.64}
\end{equation}
对于反向的变换,我们有:
\begin{equation}
\ket{i} = \mbf{1}\ket{i} = \sum_{\alpha}\ket{\alpha}\olp{\alpha}{i} = \sum_{\alpha} \ket{\alpha}U_{i\alpha}^\ast = \sum_{\alpha} \ket{\alpha}\left(\madj{U}\right)_{\alpha i}
\label{eq:1.65}
\end{equation}
上式中我们用到了\autoref{eq:1.49}和伴随矩阵的定义,
从而得到如下关系:
\begin{equation}
\olp{\alpha}{i} = {\olp{i}{\alpha}}^\ast = U_{i\alpha}^\ast = \left(\madj{U}\right)_{\alpha i}
\label{eq:1.66}
\end{equation}
此处有一个要点需要记住,
由于我们用\autoref{eq:1.64}定义了变换矩阵$\mbf U$,则$\olp{\alpha}{i} \neq U_{\alpha i}$,
而要用\autoref{eq:1.66}计算。
下面我们证明$\mbf U$是一个幺正矩阵,
这是基组的正交归一性导致的:
\[
\begin{split}
\delta_{ij} &= \olp{i}{j} \\
&= \sum_{\alpha}\olp{i}{\alpha}\olp{\alpha}{j} \\
&= \sum_{\alpha}\left(\mbf U\right)_{i\alpha}\left(\mbf U\right)_{\alpha j} \\
&= \left(\mbf{U}\madj{U}\right)_{ij}
\end{split}
\]
如果采用矩阵符号,上式可以写为:
\begin{subequations}
\begin{equation}
\mbf 1 = \mbf{U} \madj{U}
\label{eq:1.67a}
\end{equation}
类似的,还可以从$\olp{\alpha}{\beta} = \delta_{\alpha\beta}$出发,得到:
\begin{equation}
\mbf 1 = \madj{U}\mbf{U}
\label{eq:1.67b}
\end{equation}
\end{subequations}
由此我们证明了$\mbf U$是一个幺正矩阵。
这样,我们得到了一个重要结论:
两个正交归一基组之间通过一个幺正矩阵相关,
可以通过该矩阵由一个基组变换至另一基组,
如\autoref{eq:1.63},
或者通过\autoref{eq:1.65}变换回至原基组;
这个幺正变换矩阵的矩阵元即为两个基组中基矢的标量积,
可通过\autoref{eq:1.64}计算。
下面我们考虑在不同的基组下,
算符 $\op{O}$ 的矩阵表示具有什么样的联系。
下一步我们得到的结果将在下一小节关于本征值问题的讨论中占据着中心地位。
假设$\mbf O$是算符$\op{O}$在基组$\kbs{i}$中的矩阵表示,
而$\boldsymbol{\Omega}$是该算符在基组$\kbs{\alpha}$中的矩阵表示,
则有:
\begin{subequations}
\begin{equation}
\op{O}\ket{i} = \sum_j \ket{j}\Mele{j}{O}{i} = \sum_j\ket{j}O_{ji}
\label{eq:1.68a}
\end{equation}
\begin{equation}
\op{O}\ket{\alpha} = \sum_{\beta} \ket{\beta}\Mele{\beta}{O}{\alpha} = \sum_{\beta} \ket{\beta}\Omega_{\beta\alpha}
\label{eq:1.68b}
\end{equation}
\end{subequations}
为了得到$\mbf O$和$\boldsymbol\Omega$之间的关系,
我们可以使用已经熟悉的技巧,
即在合适的位置插入单位算符:
\begin{equation}
\begin{split}
\Omega_{\alpha\beta} = \Mele{\alpha}{O}{\beta} &= \left\langle\alpha\middle\vert 1\op{O}1\middle\vert\beta\right\rangle \\
&= \sum_{ij}\olp{\alpha}{i}\Mele{i}{O}{j}\olp{j}{\beta} \\
&= \sum_{ij}\left(\madj{U}\right)_{\alpha i}\left(\mbf O\right)_{ij}\left(\mbf{U}\right)_{j\beta}
\end{split}
\label{eq:1.69}
\end{equation}
即为:
\begin{subequations}
\begin{equation}
\boldsymbol\Omega = \madj{U}\mbf{O}\mbf{U}
\label{eq:1.70a}
\end{equation}
或者在上式两边左乘$\mbf U$,右乘$\madj{U}$,得到:
\begin{equation}
\mbf O = \mbf{U}\boldsymbol\Omega\madj{U}
\label{eq:1.70b}
\end{equation}
\end{subequations}
上述方程说明,
矩阵$\mbf{O}$和$\boldsymbol\Omega$可以通过一个\emph{幺正变换}联系起来。
幺正变换的重要性在于:对于任意的Hermitian算符,
若它在基组$\kbs{i}$中的矩阵表示不是对角的,
则总能找到一个基组$\kbs{\alpha}$,
使得在新基组中其矩阵表示为对角阵。即:
\begin{equation}
\Omega_{\alpha\beta} = \omega_{\alpha}\delta_{\alpha\beta}
\label{eq:1.71}
\end{equation}
在下一小节中,我们将要考虑怎样通过幺正变换将Hermitian矩阵对角化。
\exercise{
证明:幺正变换后,矩阵的迹不变。
即,若
\[\boldsymbol\Omega = \madj{U}\mbf{O}\mbf{U}\]
则有 $\tr{\boldsymbol\Omega} = \tr{\mbf O}$
}
\subsection{本征值问题}
\label{sec:1.1.6}
算符$\op{O}$作用在一个矢量$\ket{a}$上,
会得到一个新的矢量$\op{O}\ket{a}$。
通常情况下,这个新的矢量与原矢量不同。
如果$\op{O}\ket{a}$与$\ket{a}$只差一个常数,即:
\begin{equation}
\op{O}\ket{a} = \omega_{\alpha}\ket{a}
\label{eq:1.72}
\end{equation}
这时,我们可以称$\ket{a}$为算符$\op{O}$关于\emph{本征值} $\omega_{\alpha}$ 的\emph{本征矢量}。将本征矢归一化并不失普遍性:
\begin{equation}
\olp{\alpha}{\alpha} = 1
\label{eq:1.73}
\end{equation}
在本书中,我们关心的是Hermitian算符($\op{O}=\oadj{O}$)的本征矢和本征值。它们具有如下性质:
\begin{enumerate}[]
\item {\bfseries Hermitian算符的本征值为实数。} 这个结论可以从\autoref{eq:1.61}直接得到:
\begin{equation}
\Mele{\alpha}{O}{\alpha} = \left\langle\alpha\middle\vert\op{O}^\dagger\middle\vert\alpha\right\rangle = {\Mele{\alpha}{O}{\alpha}}^\ast
\label{eq:1.74}
\end{equation}
在\autoref{eq:1.72}两边左乘$\bra{a}$,并带入\autoref{eq:1.74},我们得到:
\begin{equation}
\omega_\alpha = \omega_\alpha^\ast
\label{eq:1.75}
\end{equation}
即本征值$\omega_\alpha$为实数。
\item {\bfseries Hermitian算符的本征矢量正交} 证明:对 Hermitian算符,我们有:
\[\op{O}\ket{\beta} = \omega_\beta \ket{\beta}\]
其伴随式为:
\[\bra{\beta}\oadj{O} = \bra{\beta}\omega_\beta^\ast\]
在前面的推导中,
我们用到了\autoref{eq:1.57},
以及一个数的伴随为其复共轭。
由于$\op{O}$是 Hermitian算符,
$\omega_\beta$为实数,我们有:
\begin{equation}
\bra{\beta}\op{O} = \bra{\beta}\omega_\beta
\label{eq:1.76}
\end{equation}
将\autoref{eq:1.72}两边左乘$\bra{\beta}$,
\autoref{eq:1.76}右乘$\ket{\alpha}$,
并将结果相减,可以得到:
\begin{equation}
\left(\omega_\beta - \omega_\alpha\right)\olp{\beta}{\alpha} = 0
\label{eq:1.77}
\end{equation}
因此,对于不同的本征值$\omega_\alpha \neq \omega_\beta$,$\olp{\beta}{\alpha} = 0$,
即本征矢正交。
此处的正交性来自于本征矢对应的本征值不同,即非简并的情形。
如果两个本征矢$\ket{1}$和$\ket{2}$具有相同的本征值,
\begin{equation}
\op{O}\ket{1} = \omega\ket{1} \qquad \op{O}\ket{2} = \omega\ket{2}
\label{eq:1.78}
\end{equation}
则称这两个本征矢是简并的。
下面我们将证明简并本征矢可以正交化。
首先,简并的本征矢的任意线性组合也是算符关于同一个本征值的本征矢,
\begin{equation}
\op{O}\left(x\ket{1}+y\ket{2}\right) = x\op{O}\ket{1} + y\op{O}\ket{2} = \omega\left(x\ket{1}+y\ket{2}\right)
\label{eq:1.79}
\end{equation}
有多种方法可以通过对$\ket{1}$和$\ket{2}$进行线性组合,
得到两个正交矢量,此处我们介绍 Schmidt 正交化。
假设本征矢$\ket{1}$和$\ket{2}$已经归一化,
并有$\olp{1}{2} = S \neq 0$。
可以选择$\ket{1}$为新的正交本征矢的第一个矢量,
记为$\ket{I} = \ket{1}$,
这时,我们有$\olp{I}{I} = 1$。
设正交本征矢的第二个矢量为$\ket{II^\prime} = \ket{1} + c\ket{2}$,
其中$c$是一个常数,
满足条件$\olp{I}{II^\prime} = 0 = 1+cS$。
最后将$\ket{II^\prime}$归一化,得到:
\begin{equation}
\ket{II} = \left(S^{-2}-1\right)^{-1/2}\left(\ket{1}-S^{-1}\ket{2}\right)
\label{eq:1.80}
\end{equation}
至此我们证明了可以将 Hermitian算符的本征矢选为一套正交归一的矢量$\kbs{\alpha}$;
\begin{equation}
\olp{\alpha}{\beta} = \delta_{\alpha\beta}
\label{eq:1.81}
\end{equation}
\end{enumerate}
通常情况下,
Hermitian算符在一个任意基组$\kbs{i}$下的矩阵表示并不是对角化的,
但它在其本征矢构成的基组内的矩阵表示是对角的。
这可以通过将\autoref{eq:1.72}两边左乘$\bra{\beta}$,
并应用正交归一性关系\autoref{eq:1.81}来得到:
\begin{equation}
\Mele{\beta}{O}{\alpha} = \omega_\alpha\delta_{\alpha\beta}
\label{eq:1.82}
\end{equation}
关于本征值问题,我们可以这样理解:
给定一个 Hermitian算符$\op{O}$在一个正交归一基组$\left\{\ket{i},\; i = 1, 2, \dots, N\right\}$ 的矩阵表示$\mbf O$,
我们需要找到一个新的基组 $\left\{\ket{\alpha},\; \alpha = 1, 2, \dots, N\right\}$,
并要求在此基组下,
算符$\op{O}$的矩阵表示 $\boldsymbol\Omega$为对角阵,
即$\Omega_{\alpha\beta} = \omega_\alpha\delta_{\alpha\beta}$。
简单地说,
我们需要将矩阵$\mbf O$对角化。上一小节介绍了算符$\op{O}$的两种表象通过一个幺正变换相关(\autoref{eq:1.70a}:
\[\boldsymbol\Omega = \madj{U}\mbf{O}\mbf{U}\]
因此,
对角化 Hermitian矩阵$\mbf O$的问题就转化成了\emph{寻找}能够将$\mbf O$变换成对角阵的那个幺正矩阵$\mathbf{U}$:
\begin{equation}
\madj{U}\mbf{O}\mbf{U} = \boldsymbol\omega = \begin{pmatrix}
\omega_1 & & & &\\
&\omega_2 & &\mathbf{0} &\\
& &\omega_3 & &\\
&\mathbf{0} & & \ddots & \\
& & & &\omega_N
\end{pmatrix}
\label{eq:1.83}
\end{equation}
从上式中看出,
一个$N\times N$的 Hermitian矩阵具有$N$个本征值。
对角化 Hermitian矩阵有种类繁多的高效算法\footnote{
如 J. H. Wilkinson.
\textit{The Algebraic Eigenvalue Problem.} Oxford University Press.
New York, 1965. 这是本领域的一本经典参考书。