0%

PHYS 5120 - Computational Energy Materials and Electronic Structure Simulations-W8

PHYS 5120 - 计算能源材料和电子结构模拟 Lecture

1 Møller-Plesset (MP) 微扰理论:

  • 内容:

量子化学中关于 Møller-Plesset (MP) 微扰理论 的推导过程。这是一种在 Hartree-Fock (HF) 方法基础上引入电子相关效应(electron correlation)的后-HF方法。

标准微扰理论公式

这部分列出的是通用的 Rayleigh-Schrödinger 微扰理论 (RSPT) 的基本公式:

  1. 哈密顿算符 (Hamiltonian) 拆分:
    • \(\hat{H} = \hat{H}_0 + \hat{H}'\)
    • 将体系的总哈密顿算符 \(\hat{H}\) 拆分为一个可以精确求解的零阶哈密顿算符 \(\hat{H}_0\) 和一个微扰项 \(\hat{H}'\)
  2. 能量和波函数的展开:
    • \(E_n = E_n^{(0)} + E_n^{(1)} + E_n^{(2)} + \dots\)
    • \(|n\rangle = |n^{(0)}\rangle + |n^{(1)}\rangle + |n^{(2)}\rangle + \dots\)
    • 体系的真实能量 \(E_n\) 和波函数 \(|n\rangle\) 可以展开为零阶、一阶、二阶等各级修正项的总和。
  3. 一阶能量修正 (First-order energy correction):
    • \(E_n^{(1)} = \langle n^{(0)} | \hat{H}' | n^{(0)} \rangle\)
    • 一阶能量修正是微扰算符 \(\hat{H}'\) 在零阶波函数 \(|n^{(0)}\rangle\) 下的期望值。
  4. 二阶能量修正 (Second-order energy correction):
    • \(E_n^{(2)} = \sum_{k \neq n} \frac{|\langle k^{(0)} | \hat{H}' | n^{(0)} \rangle|^2}{E_n^{(0)} - E_k^{(0)}}\)
    • 二阶能量修正涉及所有其他零阶本征态 \(|k^{(0)}\rangle\)

Møller-Plesset 理论的定义

这部分将上述通用公式应用到 MP 理论中,定义了 \(\hat{H}_0\)\(\hat{H}'\)

  1. MP 理论的哈密顿算符定义:
    • 零阶哈密顿 \(\hat{H}_0\):
      • \(\hat{H}_0 = \hat{F} = \sum_{i=1}^N \hat{f}(i)\) (注:\(\hat{F}\) 是 Fock 算符,\(\hat{H}_0\) 被定义为 \(N\) 个电子的 Fock 算符之和)
    • 微扰项 \(\hat{H}'\):
      • \(\hat{H}' = \hat{H} - \hat{F}\) (即 \(\hat{H} - \hat{H}_0\))
      • 微扰项是真实的哈密顿算符 \(\hat{H}\) (包含完整的电子-电子排斥) 与 Fock 算符 \(\hat{F}\) (只包含平均化的电子排斥) 之间的差值。这个差值就是 HF 理论所忽略的“电子相关”。
  2. 零阶波函数和能量:
    • $|_0= $ HF Slater determinant
    • 零阶波函数(即 \(\hat{H}_0\) 的本征函数)被选为 Hartree-Fock (HF) 斯莱特行列式
    • \(\hat{H}_0 |\Phi_0\rangle = (\sum_{i=1}^N \varepsilon_i) |\Phi_0\rangle\)
    • 零阶能量 \(E^{(0)}\) (即 \(E_{MP0}\)) 是所有被占据分子轨道 \(\varepsilon_i\) 的能量总和。
    • \(E_{MP0} = \langle \Phi_0 | \hat{H}_0 | \Phi_0 \rangle = \sum_{i=1}^N \varepsilon_i\)
  3. MP1 能量 (一阶能量修正):
    • \(E_{MP1} = \langle \Phi_0 | \hat{H}' | \Phi_0 \rangle = \langle \Phi_0 | \hat{H} - \hat{F} | \Phi_0 \rangle\)
    • \(E_{MP1} = \langle \Phi_0 | \hat{H} | \Phi_0 \rangle - \langle \Phi_0 | \hat{F} | \Phi_0 \rangle\)
    • 由于 \(\langle \Phi_0 | \hat{H} | \Phi_0 \rangle\) 正是 Hartree-Fock 能量 \(E_{HF}\),而 \(\langle \Phi_0 | \hat{F} | \Phi_0 \rangle = E_{MP0} = \sum \varepsilon_i\)
    • 因此:\(E_{MP1} = E_{HF} - \sum_{i=1}^N \varepsilon_i\)

重要结论: 零阶能量 (\(E_{MP0}\)) 和一阶能量 (\(E_{MP1}\)) 的总和恰好等于 Hartree-Fock 能量: \(E_{MP0} + E_{MP1} = (\sum \varepsilon_i) + (E_{HF} - \sum \varepsilon_i) = E_{HF}\) 这意味着 MP1 理论得到的总能量就是 HF 能量。要获得对 HF 能量的第一个修正(即电子相关能),我们必须计算到二阶,即 MP2

2. MP2 能量推导

这部分是 MP 理论的核心,推导了 MP2 能量(二阶能量修正)

  1. MP2 通用公式:
    • \(E_{MP2} = \sum_{k \neq 0} \frac{|\langle k | \hat{H}' | 0 \rangle|^2}{E_0 - E_k}\)
    • 这是将左侧的 \(E_n^{(2)}\) 公式应用于基态 (\(n=0\))。
  2. 关键简化 (Brillouin 定理):
    • 根据 Brillouin 定理,对于所有单激发行列式 \(|\Phi_i^a\rangle\) (即一个电子从占据轨道 \(i\) 跃迁到空轨道 \(a\)),矩阵元 \(\langle \Phi_i^a | \hat{H}' | \Phi_0 \rangle = 0\)
    • 这意味着在求和 \(\sum_{k \neq 0}\) 时,所有单激发的项都为零。
    • 因此,对 MP2 能量有贡献的第一类非零项来自双激发行列式 (Doubly-excited determinants),记为 \(|\Phi_{ij}^{ab}\rangle\)(即电子 \(i, j\) 激发到空轨道 \(a, b\))。
    • 白板中间的图示 || -> # (两条线变到两条更高阶的线) 正是形象地表示了这种双激发。
  3. MP2 最终公式:
    • \(E_{MP2} = \sum_{i<j}^{occ} \sum_{a<b}^{vir} \frac{|\langle \Phi_{ij}^{ab} | \hat{H}' | \Phi_0 \rangle|^2}{\varepsilon_i + \varepsilon_j - \varepsilon_a - \varepsilon_b}\)
    • 求和: 遍历所有占据轨道对 (\(i, j\)) 和所有空轨道(虚拟轨道)对 (\(a, b\))。
    • 分母: \(E_0 - E_k = (\sum \varepsilon) - (\sum \varepsilon - \varepsilon_i - \varepsilon_j + \varepsilon_a + \varepsilon_b) = \varepsilon_i + \varepsilon_j - \varepsilon_a - \varepsilon_b\)。这是零阶能量差,即激发所消耗的轨道能量。
    • 分子: \(\langle \Phi_{ij}^{ab} | \hat{H}' | \Phi_0 \rangle\) 可以被简化为一个关于分子轨道的双电子积分 \(\langle ij || ab \rangle\)

总结: Møller-Plesset 微扰理论的标准推导,核心思想是将 HF 解作为零阶近似,并将电子相关的“剩余部分”作为微扰。推导表明,MP1 能量只是重现了 HF 能量,而 MP2 能量是第一个真正包含电子相关效应的修正项,它通过计算所有可能的双激发对总能量的贡献来实现。

从 Møller-Plesset (MP) 理论过渡到了另一种更高级的量子化学方法:耦合簇理论 (Coupled Cluster Theory)

MP2 能量的深入探讨

这部分继续讨论 MP2 能量(二阶能量修正):

  1. MP2 能量公式 (重复):
    • \(E_{MP2} = \sum_{k \neq 0} \frac{|\langle \Phi_0 | \hat{H}' | \Phi_k \rangle|^2}{E_{MP0} - E_k^{(0)}}\)
    • 这是 MP2 能量的通用形式。
  2. 微扰的来源:
    • \(\frac{e^2}{|r_i - r_j|}\) (被圈出)
    • 这是电子-电子间的库仑排斥算符。这个项是 \(\hat{H}\)(真实哈密顿算符)和 \(\hat{H}_0\)(Fock 算符,仅包含平均场排斥)之间差异的核心。正是这个“瞬时相关”的相互作用导致了 \(\hat{H}'\)(微扰)的存在,也是 MP 理论试图修正的能量来源。
  3. Brillouin 定理的应用:
    • \(\langle \Phi_0 | \hat{H}' | \Phi_i^a \rangle = 0\)
    • 这再次强调了上一张白板的结论:微扰算符 \(\hat{H}'\) 在基态 \(\Phi_0\) 和任何单激发行列式 \(\Phi_i^a\) 之间的矩阵元为零。
    • \(\langle \Phi_0 | \hat{H} - \hat{F} | \Phi_i^a \rangle = 0\) (这是 \(\hat{H}'\) 的展开)
    • \(\langle \Phi_a | \hat{f} | \Phi_i \rangle = 0\) (注:\(\Phi_i\)\(\Phi_a\) 应为轨道 \(\phi_i\)\(\phi_a\))
    • 这一行解释了为什么 Brillouin 定理在 MP 理论中成立:因为在标准的 Hartree-Fock (HF) 方法中,占据轨道 (\(\phi_i\)) 和空轨道 (\(\phi_a\)) 之间的 Fock 矩阵元(即 \(\langle \phi_a | \hat{f} | \phi_i \rangle\))被设为零。
  4. MP2 最终实用公式:
    • \(E_{MP2} = \sum_{i<j}^{occ} \sum_{a<b}^{vir} \frac{|\langle \Phi_0 | \hat{H}' | \Phi_{ij}^{ab} \rangle|^2}{E_{MP0} - E_{ij}^{ab}}\)
    • 由于单激发项为零,求和 \(k \neq 0\) 中幸存下来的第一类项就是双激发\(\Phi_{ij}^{ab}\)(电子从 \(i,j\) 轨道激发到 \(a,b\) 轨道)。
    • \(E_{ij}^{ab}\) 是双激发组态的零阶能量。
  5. MP2 能量的性质:
    • \(< 0\): MP2 修正能量总是负值。这意味着 MP2 能量总是在 HF 能量(\(E_{MP0} + E_{MP1}\))的基础上进一步降低总能量。这是符合物理直觉的,因为电子相关效应允许电子更好地相互“躲避”,从而降低体系的总能量。
    • “80%” (大约): 这是一个常见的经验之谈,即对于许多小分子,MP2 方法大约能“恢复”80% 到 90% 的电子相关能。

3. 耦合簇理论 (Coupled Cluster Theory)

这部分介绍了一种更强大、更准确(也更昂贵)的后-HF方法。

  1. 标题: Coupled Cluster Theory

  2. CC 波函数拟设 (Ansatz):

    • \(\Psi_{CC} = e^{\hat{T}} \Phi_{HF}\) (这里 \(\Phi_{HF}\)\(\Phi_0\))
    • 这是 CC 理论的核心!它假设真实的波函数 \(\Psi_{CC}\) 可以通过一个“指数算符” \(e^{\hat{T}}\) 作用在 HF 参考波函数 \(\Phi_0\) 上得到。
  3. 指数算符 \(e^{\hat{T}}\):

    • \(e^{\hat{T}} = \hat{1} + \hat{T} + \frac{1}{2!} \hat{T}^2 + \frac{1}{3!} \hat{T}^3 + \dots\)
    • 指数算符通过泰勒级数展开。这种指数形式具有非常重要的特性,即它能自动包含“非关联”的高阶激发(例如,两次独立的双激发 \(\hat{T}_2^2\) 会产生四激发),这使得 CC 方法具有大小一致性 (size-consistency),这是 MP 理论(在某些阶数上)所缺乏的重要特性。
  4. 簇算符 (Cluster Operator) \(\hat{T}\):

    • \(\hat{T} = \hat{T}_1 + \hat{T}_2 + \hat{T}_3 + \dots\)
    • 簇算符 \(\hat{T}\) 本身是所有可能的激发算符的总和。
  5. 激发算符的定义:

    • \(\hat{T}_1\) (单激发):
      • \(\hat{T}_1 \Phi_0 = \sum_{i}^{occ} \sum_{a}^{vir} t_i^a \Phi_i^a\)
      • \(\hat{T}_1\) 产生所有可能的单激发态的线性组合。\(t_i^a\) 是未知的“振幅 (amplitudes)”,即激发的重要性权重,需要通过求解 CC 方程得到。
    • \(\hat{T}_2\) (双激发):
      • \(\hat{T}_2 \Phi_0 = \sum_{i<j}^{occ} \sum_{a<b}^{vir} t_{ij}^{ab} \Phi_{ij}^{ab}\)
      • \(\hat{T}_2\) 产生所有可能的双激发态的线性组合。\(t_{ij}^{ab}\) 是双激发的振幅。

总结: 这张白板从 MP2 理论(一种基于微扰的方法)过渡到了耦合簇理论(一种基于指数拟设的非微扰方法)。

  • MP2 通过二阶微扰,只显式地考虑了双激发对能量的贡献。
  • Coupled Cluster (例如 CCSD,即 \(\hat{T} = \hat{T}_1 + \hat{T}_2\)) 则系统地包含了 \(\hat{T}_1\) (单激发) 和 \(\hat{T}_2\) (双激发) 及其所有乘积(如 \(\hat{T}_1^2, \hat{T}_1 \hat{T}_2, \hat{T}_2^2\) 等),因此它隐式地包含了某些更高阶的激发(如四激发),使其成为比 MP2 更准确、更鲁棒的方法。

当然可以。这是一个非常核心的量子化学概念。

简单来说:双激发 (Double Excitations) 是描述电子“躲避”彼此这一行为的最主要最基本的数学方式。

MP2 和 CCSD 都高度关注双激发,因为它们是捕获“电子相关能” (Electron Correlation Energy) 的关键。

问题的根源:HF 理论错过了什么?

在白板的 MP 理论推导中,我们从 Hartree-Fock (HF) 波函数 (\(\Phi_0\)) 开始。

  • HF 的问题: HF 是一种“平均场”理论。它假设一个电子(例如电子 \(i\))只感受到所有其他电子(例如电子 \(j\))的平均电荷分布,而不是它们在某一瞬时的真实位置。
  • 物理现实: 电子是带负电的粒子,它们会瞬时地相互排斥。如果电子 \(i\) 在分子的 A 点,电子 \(j\) 会倾向于避开 A 点,跑到 B 点去。这种为了“躲避”对方而调整自己行为的现象,就叫做 电子相关 (Electron Correlation)

HF 理论忽略了这种瞬时躲避,因此 HF 能量总是高于真实的基态能量。我们所说的“电子相关能”,就是这个能量差。

解决方案:双激发(\(\Phi_{ij}^{ab}\)

我们如何用数学来描述“电子 \(i\)\(j\) 相互躲避”?

想象一下,在 HF 基态 (\(\Phi_0\)) 中,电子 \(i\)\(j\) 在它们各自的轨道里。

  • 为了描述它们“躲开”彼此,我们需要在波函数中“混入”一个新的组态 (configuration)。
  • 在这个新组态中,电子 \(i\)\(j\) 同时从它们原来的轨道(占据轨道 \(i, j\))“跳”到了两个新的、能量更高的空轨道(虚拟轨道 \(a, b\))。
  • 这个“双重跳跃”的态,就是白板上的 双激发态 \(\Phi_{ij}^{ab}\)

通过将这个双激发态 \(\Phi_{ij}^{ab}\) 线性叠加到基态 \(\Phi_0\) 中,我们的总波函数就能描述这样一种情形:电子 \(i\)\(j\) 有一定概率不在它们“应该”在的地方,而是跑到了别处——这就是它们相互躲避的数学表达。

为什么单激发 (\(\Phi_i^a\)) 不行? 如白板所示,Brillouin 定理(\(\langle \Phi_0 | \hat{H}' | \Phi_i^a \rangle = 0\))告诉我们,在 MP 理论框架下,HF 基态和单激发态之间没有直接的相互作用。单激发主要描述的是轨道本身的形状调整(轨道弛豫),而不是电子之间的相关。

MP2 和 CCSD 的联系与区别

MP2 和 CCSD 都是基于这个核心思想,但实现方式的复杂程度和准确性完全不同。

🔹 MP2 (Møller-Plesset 2nd Order)

  • 它做了什么: MP2 是一种微扰方法。它把双激发当作一种“微小的扰动”。
  • 如何工作: 它使用二阶微扰公式(白板上的 \(E_{MP2}\))来计算:“如果我允许体系中的每一对电子 (i, j) 发生一次双激发 (到 a, b),这会使体系的总能量降低多少?”
  • 局限性:
    1. 它只计算一次激发的影响。
    2. 它只考虑了双激发。
    3. 它假设这种扰动很“小”。

MP2 是最简单、计算最便宜的包含电子相关的方法,它抓住了相关能的“大头”( ~80%)。

🔹 CCSD (Coupled Cluster Singles and Doubles)

  • 它做了什么: CCSD 是一种非微扰方法。它不认为相关是“小扰动”,而是从根本上重新构建波函数。
  • 如何工作: 它使用指数拟设 \(\Psi_{CC} = e^{\hat{T}_1 + \hat{T}_2} \Phi_0\)
    • \(\hat{T}_2\) 算符(白板上有写)就是用来产生所有双激发的。
    • \(\hat{T}_1\) 算符(白板上有写)用来产生所有单激发(用于轨道弛豫)。
  • 关键区别(指数的魔力):
    • 当指数 \(e^{\hat{T}}\) 展开时 (\(e^{\hat{T}} = 1 + \hat{T} + \frac{1}{2}\hat{T}^2 + \dots\)),你会得到像 \(\frac{1}{2}(\hat{T}_2)^2\) 这样的项。
    • \(\frac{1}{2}(\hat{T}_2)^2\) 意味着两次独立的双激发。这在物理上代表了四激发(例如,分子中两对互不相干的电子同时在各自“躲避”)。
    • 这就是 CCSD 远比 MP2 准确的原因:它不仅包含了 \(\hat{T}_2\)(双激发),还通过指数形式自动包含了由 \(\hat{T}_2\) 组合产生的高阶激发(如四激发、六激发等)。它正确地描述了多个电子对同时发生相关行为的情况。

总结对比

特性 MP2 CCSD ( \(\hat{T} = \hat{T}_1 + \hat{T}_2\) )
方法类型 微扰理论 (Perturbative) 非微扰 (Non-perturbative)
核心思想 计算双激发对能量的二阶修正。 用指数算符包含所有单、双激发
包含的激发 仅显式包含双激发 显式包含单、双激发
隐式包含高阶激发(四、六等)。
准确性 良好(约 80-90% 相关能) 优秀(“黄金标准”之一)
数学联系 MP2 的能量公式可以被证明是 CCSD 方程的最低阶近似 更完整、更高级的理论。

总结:

双激发是描述电子相关(相互躲避)的物理核心。MP2 用最简单的方式估算了它的能量贡献,而 CCSD 则用一种更完备、更强大的数学(指数)形式将其及组合效应系统地包含了进来。

4. 量子蒙特卡洛 (Quantum Monte Carlo)

耦合簇理论 (Coupled Cluster)

1. CCSD(T):“(T)” 的含义

  • 回顾 CCSD 正如标题 Coupled Cluster Singles and Doubles (CCSD) 所示,CCSD 方法只完整地包含了单激发算符 (\(\hat{T}_1\)) 和双激发算符 (\(\hat{T}_2\))。它通过指数形式 \(e^{(\hat{T}_1 + \hat{T}_2)}\),已经能间接地包含一些高阶激发(如四激发 \(\hat{T}_2^2\))。
  • 缺失的项: CCSD 没有 显式地包含 “连通”(connected) 三激发算符 \(\hat{T}_3\)\(\hat{T}_3\) 描述的是三个电子同时相互关联并激发到三个空轨道。
  • (T) 的含义: (T) 代表 “微扰三激发” (perturbative Triples)
    • 为什么不直接用 CCSDT 完整地求解包含 \(\hat{T}_3\) 的方程(即 CCSDT 方法)在计算上极其昂贵(计算量随体系大小的 \(N^8\) 增长)。
    • (T) 的解决之道: CCSD(T) 是一种巧妙的折中。它首先执行一个完整的、较便宜的 CCSD 计算(求解 \(\hat{T}_1\)\(\hat{T}_2\))。然后,它使用这些已知的 \(\hat{T}_1\)\(\hat{T}_2\) 振幅,通过微扰理论(就像第一张白板上的 MP 理论一样!)来估算 \(\hat{T}_3\) 会对总能量产生的修正
  • “黄金标准” (Gold Standard): CCSD(T) 方法被广泛认为是量子化学的“黄金标准”。它以可承受的计算成本(\(N^7\) 增长)提供了接近“完美”的能量,是绝大多数高精度计算的基准。
  • “95%” 注释: 白板上的 95% 注释很可能是讲师的一个经验之谈,即 CCSD 大约能恢复 95% 的电子相关能(相比 MP2 的 ~80%),而 (T) 修正则能将这个数字推向 99% 甚至更高。

2. 耦合簇方程 (CC Equations)

白板的中间部分展示了如何求解 CCSD 方程以获得能量 \(E\) 和振幅 \(t_i^a, t_{ij}^{ab}\)

  • 总薛定谔方程:

    • \(H e^{\hat{T}} | \Phi_0 \rangle = E e^{\hat{T}} | \Phi_0 \rangle\)
    • 这是 CC 理论要解的薛定谔方程 (\(\hat{H} |\Psi_{CC}\rangle = E |\Psi_{CC}\rangle\))。
  • 求解方法(投影法): 为了解出未知的 \(E\), \(\hat{T}_1\), \(\hat{T}_2\),我们将这个总方程“投影”到不同的激发空间上:

    1. 能量 \(E\)
      • \(\langle \Phi_0 | e^{-(\hat{T}_1+\hat{T}_2)} \hat{H} e^{(\hat{T}_1+\hat{T}_2)} | \Phi_0 \rangle = E\)
      • 将总方程左乘 \(\langle \Phi_0 |\)(HF 基态)并积分,可以直接得到总能量 \(E\)
    2. 求解 \(\hat{T}_1\)(方程 ①):
      • \(\langle \Phi_i^a | e^{-(\hat{T}_1+\hat{T}_2)} \hat{H} e^{(\hat{T}_1+\hat{T}_2)} | \Phi_0 \rangle = 0\)
      • 将总方程左乘 \(\langle \Phi_i^a |\)(所有单激发态)。这会产生一系列方程,求解它们可以得到所有 \(\hat{T}_1\) 的振幅 \(t_i^a\)
    3. 求解 \(\hat{T}_2\)(方程 ②):
      • \(\langle \Phi_{ij}^{ab} | e^{-(\hat{T}_1+\hat{T}_2)} \hat{H} e^{(\hat{T}_1+\hat{T}_2)} | \Phi_0 \rangle = 0\)
      • 将总方程左乘 \(\langle \Phi_{ij}^{ab} |\)(所有双激发态)。这会产生另一系列方程,求解它们可以得到所有 \(\hat{T}_2\) 的振幅 \(t_{ij}^{ab}\)

总结: CCSD 是一个复杂的非线性方程组。我们通过求解方程 ① 和 ② 得到所有激发振幅,然后将这些振幅代入能量方程,得到最终的 CCSD 能量。

量子蒙特卡洛 (Quantum Monte Carlo, QMC)

这部分介绍了一种完全不同的、不依赖于轨道和激发的方法。

  • 标题: Quantum Monte Carlo
  • 子标题: Variational / Diffusion MC (变分蒙特卡洛 / 扩散蒙特卡洛)

变分蒙特卡洛 (VMC)

VMC 的核心思想,基于变分原理

  1. 能量期望值:
    • \(E(\theta) = \frac{\langle \Psi(\theta) | \hat{H} | \Psi(\theta) \rangle}{\langle \Psi(\theta) | \Psi(\theta) \rangle}\)
    • 任何一个“试验波函数” \(\Psi(\theta)\)\(\theta\) 是函数中的可调参数)所计算出的能量 \(E(\theta)\) 永远大于或等于真实的基态能量 \(E_{\text{ground}}\)
    • 目标: min $E(\theta)$ = $E_{\text{ground}}$ (更准确地说是 \(E_{\text{approx}}\))
    • 通过调整参数 \(\theta\) 来最小化 \(E(\theta)\),我们可以获得对基态能量的最佳近似。
  2. 蒙特卡洛方法如何计算?
    • 上述能量公式是一个极其复杂的高维积分(积分维度 = 3 \(\times\) 电子数)。
    • QMC 它不直接计算这个积分,而是使用随机抽样(“蒙特卡洛”方法)来估算它。
  3. VMC 计算步骤(如白板所示):
    • a. 重写积分: \(E = \frac{\int |\Psi(\vec{x}, \theta)|^2 \left[ \frac{\hat{H} \Psi(\vec{x}, \theta)}{\Psi(\vec{x}, \theta)} \right] d\vec{x}}{\int |\Psi(\vec{x}, \theta)|^2 d\vec{x}}\)
      • \(\vec{x}\) 代表所有电子的坐标 (\(r_1, r_2, \dots\))。
      • \(\frac{|\Psi(\vec{x})|^2}{\int |\Psi(\vec{x})|^2 d\vec{x}}\) 是电子在 \(\vec{x}\) 处被发现的概率密度 \(P(\vec{x})\)
      • \(E_L(\vec{x}) = \frac{\hat{H} \Psi(\vec{x}, \theta)}{\Psi(\vec{x}, \theta)}\) 被称为 “局域能量” (Local Energy)
    • b. 抽样:
      • 整个积分就变成了在 \(P(\vec{x})\) 概率分布下,对 \(E_L(\vec{x})\) 求平均值。
      • VMC 方法通过一种算法(如 Metropolis 算法)产生大量的、符合 \(|\Psi|^2\) 分布的随机电子构型(“walkers”)。
    • c. 求平均:
      • \(E \approx \frac{1}{N} \sum_{\text{samples } \vec{x}} E_L(\vec{x})\)
      • 最终的能量就是所有采样点上“局域能量”的简单平均值。

总结: VMC 通过在“真实空间”中随机移动电子来直接估算能量,完全绕过了 MP 或 CC 理论中复杂的轨道和激发概念。Diffusion MC (DMC) 是其更高级的变体,原则上可以找到精确的基态能量。

这张白板标志着一个重大的理论转变:从前面讨论的“波函数方法”(Wavefunction Methods, 如 MP2, CCSD)转向了一种完全不同的、在计算化学和物理中占主导地位的方法——密度泛函理论 (Density Functional Theory, DFT)

5. 波函数方法的“维度灾难”

一个生动的例子,说明了为什么基于波函数的方法(如 CCSD)在计算上极其昂贵,甚至是不可能的。

  1. “wavefunction method” (波函数方法):
    • 这类方法(如 HF, MP2, CCSD)的中心目标是求解体系的 \(N\) 电子波函数 \(\Psi(\vec{r}_1, \vec{r}_2, \dots, \vec{r}_N)\)
    • 这个波函数 \(\Psi\) 是一个极其复杂的对象,它是一个 \(3N\) 维度的函数(每个电子有 3 个空间坐标 \(x, y, z\))。
  2. 计算成本的“立方体”比喻:
    • 假设我们想在一个 3D 空间中存储一个电子的波函数。
    • 如果我们在每个维度(x, y, z)上只使用 10 个网格点,我们就需要 \(10 \times 10 \times 10 = 10^3\) 个点来描述这一个电子。
    • 现在,考虑一个有 30 个电子的体系(一个中等大小的分子)。
    • 由于总波函数 \(\Psi\)\(3 \times 30 = 90\) 维的,我们需要 \((10^3)^{30} = 10^{90}\) 个网格点来存储这个波函数。
    • \(10^{90}\) 是一个天文数字! 白板上的 \(10^{77}\)\(10^{80}\) 可能是用来比较的数字(例如,可观测宇宙中的原子总数约 \(10^{80}\))。这个数字 (\(10^{90}\)) 意味着直接存储或计算 N 电子波函数在计算上是绝对不可能的。
    • 这就是所谓的“维度灾难 (Curse of Dimensionality)”。
  3. DFT:解决方案登场
    • 在指出了波函数方法的根本困难后,白板上写下了 DFT,预示着它是一种解决方案。
  4. 体系的哈密顿算符 (\(\hat{H}\)):
    • \(\hat{H} = \underbrace{-\sum_i \frac{\hbar^2}{2m} \nabla_i^2}_{\text{电子动能}} + \underbrace{\sum_i V_{\text{ext}}(\vec{r}_i)}_{\text{电子-原子核吸引}} + \underbrace{\frac{1}{2} \sum_{i \neq j} \frac{e^2}{|\vec{r}_i - \vec{r}_j|}}_{\text{电子-电子排斥}}\)
    • 这是任何分子体系的完整(非相对论)哈密顿算符。
  5. 关键的简化:
    • \(\langle \Psi | \sum_i V_{\text{ext}}(\vec{r}_i) | \Psi \rangle = \int V_{\text{ext}}(\vec{r}) \rho(\vec{r}) d\vec{r}\)
    • 这一行展示了一个至关重要的简化:\(N\) 电子的“电子-原子核吸引能”的期望值(一个 \(3N\) 维积分),可以被精确地重写为一个只涉及电子密度 \(\rho(\vec{r})\) 的** 3 维积分**。
    • 这就引出了一个问题:我们是否能用这个简单的 \(\rho(\vec{r})\) 来代替 \(\Psi\) 呢?

DFT 的理论基石

这部分介绍了 DFT 的核心定理

  1. 电子密度 (Electron Density, \(\rho(\vec{r})\)):
    • \(\int \rho(\vec{r}) d\vec{r} = N\)
    • 电子密度 \(\rho(\vec{r})\) 是一个在 3D 空间中的函数。它描述了在任意空间点 \(\vec{r}\) 处找到一个电子的概率。
    • 无论体系有多少电子(\(N=30\)\(N=1000\)),\(\rho(\vec{r})\) 始终是一个简单的 3 维函数。这与 \(3N\) 维的波函数 \(\Psi\) 形成了鲜明对比。
  2. Hohenberg-Kohn (H-K) 定理:
    • 这是 DFT 的全部理论基础。白板上的图示完美地总结了第一个 H-K 定理:
    • 标准路径(上 \(\rightarrow\) 下): \(V_{\text{ext}}(\vec{r})\)(外势,即原子核的位置和电荷)\(\implies \Psi(\vec{r})\)(基态波函数)\(\implies \rho(\vec{r})\)(基态密度)。
      • 解释: 原子核的位置决定了 \(\hat{H}\),求解 \(\hat{H}\) 得到 \(\Psi\),由 \(\Psi\) 可以计算出 \(\rho\)
    • H-K 革命性路径(下 \(\leftrightarrow\) 上): \(V_{\text{ext}}(\vec{r}) \Longleftrightarrow \rho(\vec{r})\)
      • 第一 H-K 定理证明:体系的基态电子密度 \(\rho(\vec{r})\) 唯一地决定了外势 \(V_{\text{ext}}(\vec{r})\)(因此也唯一决定了 \(\hat{H}\)\(\Psi\) 和总能量 \(E\))。
  3. H-K 定理的重大意义:
    • 所有信息都在 \(\rho(\vec{r})\) 中! 体系的基态总能量 \(E\) 是基态密度 \(\rho\) 的一个泛函 (Functional),记为 \(E[\rho]\)
    • 目标转变: 我们不再需要去求解那个 \(10^{90}\) 维的波函数 \(\Psi\)!我们只需要找到那个能使总能量 \(E[\rho]\) 最小的 3 维密度 \(\rho(\vec{r})\)

总结: 首先论证了“波函数方法”在计算上的不可能性(维度灾难),然后引入了 DFT 作为解决方案,其理论依据是 H-K 定理——即体系的所有信息都包含在简单的 3 维电子密度 \(\rho(\vec{r})\) 中。

6:证明 第一 Hohenberg-Kohn (H-K) 定理的经典证明。这个定理是密度泛函理论 (DFT) 的基石。

这个证明使用的是 “Proof by contradiction” (反证法)

定理内容: 体系的基态电子密度 \(\rho_0(\vec{r})\) 唯一地决定了其外势 \(V_{ext}(\vec{r})\)(即原子核的位置和电荷),并因此唯一地决定了体系的哈密顿算符 \(\hat{H}\) 和波函数 \(\Psi\)

证明步骤详解

1. 假设 (为反证法设置)

我们假设 H-K 定理是的。

这意味着我们假设存在两个不同 (different) 的外势 \(V_{ext}^{(1)}\)\(V_{ext}^{(2)}\),它们分别对应各自的哈密顿算符 \(\hat{H}^{(1)}\)\(\hat{H}^{(2)}\) 和基态波函数 \(\Psi^{(1)}\)\(\Psi^{(2)}\)

但我们假设,这两个完全不同的体系却碰巧产生了完全相同 (same) 的基态电子密度 \(\rho_0(\vec{r})\)

假设总结: * \(V_{ext}^{(1)} \neq V_{ext}^{(2)}\) (因此 \(\hat{H}^{(1)} \neq \hat{H}^{(2)}\)\(\Psi^{(1)} \neq \Psi^{(2)}\)) * 但是 \(\rho^{(1)}(\vec{r}) = \rho^{(2)}(\vec{r}) = \rho_0(\vec{r})\) * \(E^{(1)}\) 是体系1的基态能量。 * \(E^{(2)}\) 是体系2的基态能量。

2. 应用变分原理 (第 1 步)

变分原理指出:任何一个“试验波函数” \(\Psi_{\text{trial}}\) 对某个哈密顿算符 \(\hat{H}\) 的能量期望值,永远高于或等于该 \(\hat{H}\) 的真实基态能量 \(E_{GS}\)

  • 我们将 \(\Psi^{(2)}\) (体系2的基态波函数) 作为体系1的试验波函数
  • 根据变分原理,\(\Psi^{(2)}\) 计算出的 \(\hat{H}^{(1)}\) 的能量必定高于 \(\hat{H}^{(1)}\) 的真实基态能量 \(E^{(1)}\)(因为我们假设了 \(\Psi^{(1)} \neq \Psi^{(2)}\))。
  • \(E^{(1)} < \langle \Psi^{(2)} | \hat{H}^{(1)} | \Psi^{(2)} \rangle\) (白板上的第3行)

3. 展开能量 (第 2 步)

我们来展开 \(\langle \Psi^{(2)} | \hat{H}^{(1)} | \Psi^{(2)} \rangle\) 这一项。

  • 我们知道 \(\hat{H}^{(1)} = \hat{H}^{(2)} + (V_{ext}^{(1)} - V_{ext}^{(2)})\)

  • 代入上式: \(\langle \Psi^{(2)} | \hat{H}^{(1)} | \Psi^{(2)} \rangle = \langle \Psi^{(2)} | \hat{H}^{(2)} + V_{ext}^{(1)} - V_{ext}^{(2)} | \Psi^{(2)} \rangle\)

  • 拆分它: \(= \langle \Psi^{(2)} | \hat{H}^{(2)} | \Psi^{(2)} \rangle + \langle \Psi^{(2)} | V_{ext}^{(1)} - V_{ext}^{(2)} | \Psi^{(2)} \rangle\)

  • 第一项 \(\langle \Psi^{(2)} | \hat{H}^{(2)} | \Psi^{(2)} \rangle\) 正是体系2的基态能量 \(E^{(2)}\)

  • 第二项(如上一张白板所示)可以写成关于密度的积分: \(\int (V_{ext}^{(1)} - V_{ext}^{(2)}) \rho^{(2)}(\vec{r}) d\vec{r}\)

  • 根据我们的初始假设,\(\rho^{(2)}(\vec{r}) = \rho_0(\vec{r})\)

  • 将这些组合起来,第1步的变分不等式 \(E^{(1)} < \dots\) 就变成了: \(E^{(1)} < E^{(2)} + \int (V_{ext}^{(1)} - V_{ext}^{(2)}) \rho_0(\vec{r}) d\vec{r}\) (白板上的第5行)

4. 对称地应用变分原理 (第 3 步)

现在我们反过来,将 \(\Psi^{(1)}\) 作为体系2的试验波函数

  • 根据变分原理: \(E^{(2)} < \langle \Psi^{(1)} | \hat{H}^{(2)} | \Psi^{(1)} \rangle\)

  • 我们用同样的方法展开 \(\hat{H}^{(2)} = \hat{H}^{(1)} + (V_{ext}^{(2)} - V_{ext}^{(1)})\)\(\langle \Psi^{(1)} | \hat{H}^{(2)} | \Psi^{(1)} \rangle = \langle \Psi^{(1)} | \hat{H}^{(1)} | \Psi^{(1)} \rangle + \langle \Psi^{(1)} | V_{ext}^{(2)} - V_{ext}^{(1)} | \Psi^{(1)} \rangle\)

  • 这等于: \(= E^{(1)} + \int (V_{ext}^{(2)} - V_{ext}^{(1)}) \rho^{(1)}(\vec{r}) d\vec{r}\)

  • 再次使用我们的假设 \(\rho^{(1)}(\vec{r}) = \rho_0(\vec{r})\)

  • 因此,我们得到了第二个不等式: \(E^{(2)} < E^{(1)} + \int (V_{ext}^{(2)} - V_{ext}^{(1)}) \rho_0(\vec{r}) d\vec{r}\) (白板上的第6行)

5. 导出矛盾 (第 4 步)

现在我们把两个不等式(第5行和第6行)相加:

\(E^{(1)} + E^{(2)} < \left[ E^{(2)} + \int (V_{ext}^{(1)} - V_{ext}^{(2)}) \rho_0 d\vec{r} \right] + \left[ E^{(1)} + \int (V_{ext}^{(2)} - V_{ext}^{(1)}) \rho_0 d\vec{r} \right]\)

我们来合并右侧的项:

\(E^{(1)} + E^{(2)} < (E^{(1)} + E^{(2)}) + \int \underbrace{[(V_{ext}^{(1)} - V_{ext}^{(2)}) + (V_{ext}^{(2)} - V_{ext}^{(1)})]}_{= 0} \rho_0 d\vec{r}\)

右侧的两个积分项完全抵消,变成了 0。

  • 于是我们得到了最终的荒谬结论: \(E^{(1)} + E^{(2)} < E^{(1)} + E^{(2)}\) (白板上的最后一行)

6. 结论

“一个数严格小于它自己” (\(A < A\)) 是一个数学上不可能的悖论。

这个悖论证明了我们的初始假设一定是错误的

因此,两个不同的外势 \(V_{ext}^{(1)}\)\(V_{ext}^{(2)}\) 不可能 产生相同的基态密度 \(\rho_0\)

证明完毕: 体系的基态电子密度 \(\rho_0(\vec{r})\) 唯一地决定了其外势 \(V_{ext}(\vec{r})\),并因此决定了体系的所有基态性质。

7. 更多

Hohenberg-Kohn (H-K) 定理证明了 \(E[\rho]\)(能量是密度的泛函)的存在性,但它没有告诉我们这个泛函到底长什么样。

问题在于: 我们不知道电子动能 \(T[\rho]\) 和电子-电子排斥能 \(V_{ee}[\rho]\) 的精确泛函形式。

Kohn-Sham (KS) 理论 就是为了解决这个问题而提出的。

这个理论的核心思想是:“我们假装在解一个简单问题,然后把所有的复杂性都藏在一个我们去近似的项里。”

以下是这个实践过程的分解:

1. 引入一个“虚拟”的无相互作用体系

Kohn 和 Sham 假设存在一个虚拟的无相互作用(non-interacting)的电子体系。

这个虚拟体系有一个关键的约束:它被设计为与真实的、有相互作用的体系具有完全相同的基态电子密度 \(\rho(\vec{r})\)

这为什么有帮助? 因为对于一个无相互作用的体系,我们精确地知道它的动能泛函 \(T_s[\rho]\)!它就是所有单电子轨道 \(\phi_i\) 的动能之和。(\(s\) 代表 “single-particle” 或 “non-interacting”)。

2. 重写总能量泛函 \(E[\rho]\)

现在,Kohn-Sham 将真实体系的总能量 \(E[\rho]\) 重新组织为以下四项:

\(E[\rho] = T_s[\rho] + \int V_{ext}(\vec{r}) \rho(\vec{r}) d\vec{r} + E_H[\rho] + E_{xc}[\rho]\)

我们来逐项分析:

  1. \(T_s[\rho]\):无相互作用动能
    • 这是我们刚刚引入的虚拟体系的动能。我们可以精确计算它(通过求解轨道 \(\phi_i\))。
    • (注:这不是真实体系的动能 \(T[\rho]\),但它通常是 \(T[\rho]\) 的一个很好的近似。)
  2. \(\int V_{ext}(\vec{r}) \rho(\vec{r}) d\vec{r}\):外势能
    • 这是电子-原子核的吸引能。这个泛函是精确已知的(就像上一张白板展示的)。
  3. \(E_H[\rho]\):哈特里 (Hartree) 能量
    • \(E_H[\rho] = \frac{1}{2} \iint \frac{\rho(\vec{r})\rho(\vec{r}')}{|\vec{r}-\vec{r}'|} d\vec{r}d\vec{r}'\)
    • 这是电子密度与其自身相互作用的经典库仑排斥能。这个泛函也是精确已知的。
  4. \(E_{xc}[\rho]\):交换-相关 (Exchange-Correlation) 泛函
    • 这是 DFT 实践的核心!
    • \(E_{xc}[\rho]\) 被定义为一个“垃圾桶”,它包含了所有我们不知道的、以及我们故意用近似替换掉的所有复杂物理:
      • (\(T[\rho] - T_s[\rho]\)):真实动能与无相互作用动能之间的差值(即动能的相关部分)。
      • (\(V_{ee}[\rho] - E_H[\rho]\)):总电子排斥能与经典库仑排斥能之间的差值(即所有非经典的交换效应和相关效应)。

3. Kohn-Sham 方程:实践的工具

现在我们有了能量表达式。根据变分原理(Hohenberg-Kohn 第二定理),我们通过最小化 \(E[\rho]\) 来寻找基态密度 \(\rho(\vec{r})\)

对这个能量泛函 \(E[\rho]\) 应用变分法,最终会得到一组类似于薛定谔方程的单电子方程,这就是著名的 Kohn-Sham (KS) 方程

\(\left( -\frac{\hbar^2}{2m} \nabla^2 + V_{eff}(\vec{r}) \right) \phi_i(\vec{r}) = \varepsilon_i \phi_i(\vec{r})\)

  • \(\phi_i(\vec{r})\) 就是“Kohn-Sham 轨道”,电子密度由它们构成:\(\rho(\vec{r}) = \sum_i |\phi_i(\vec{r})|^2\)
  • \(V_{eff}(\vec{r})\) 是一个“有效势”,无相互作用的电子在这个势场中运动: \(V_{eff}(\vec{r}) = V_{ext}(\vec{r}) + V_H(\vec{r}) + V_{xc}(\vec{r})\)
    • \(V_{ext}\):原子核的势。
    • \(V_H\):电子间的经典库仑势(来自 \(E_H\))。
    • \(V_{xc}\)交换-相关势(来自 \(E_{xc}\))。

4. 唯一的近似:“泛函动物园”

Kohn-Sham 理论在形式上是精确的。 如果我们知道了精确的 \(E_{xc}[\rho]\) 泛函,我们将得到体系的精确基态能量和密度。

但在实践中,我们不知道精确的 \(E_{xc}[\rho]\)

因此,所有实用的 DFT 计算都变成了对 \(E_{xc}[\rho]\) 的近似。

这就是您可能听说过的所有“泛函”(functionals)的来源,它们是对 \(E_{xc}[\rho]\) 的不同近似,构成了所谓的“泛函动物园”(Functional Zoo):

  • LDA (局域密度近似): 最简单的近似,只依赖于 \(\rho\)
  • GGA (广义梯度近似): 依赖于 \(\rho\) 和它的梯度 \(\nabla\rho\) (例如 PBE, BLYP)。
  • Hybrid (杂化) 泛函: 混合了一部分 Hartree-Fock 的精确交换(例如 B3LYP, PBE0)。

总结:实践中的 DFT

  1. 选择一个近似的 \(E_{xc}[\rho]\) 泛函(例如 B3LYP)。
  2. 猜测一个初始的电子密度 \(\rho_{guess}\)
  3. 根据 \(\rho_{guess}\) 计算出有效势 \(V_{eff}\)
  4. 求解 Kohn-Sham 方程,得到一组新的轨道 \(\phi_i\)
  5. 根据新的 \(\phi_i\) 计算出一个新的电子密度 \(\rho_{new}\)
  6. 比较 \(\rho_{new}\)\(\rho_{guess}\)。如果它们足够接近,计算完成(“自洽”)。
  7. 如果不同,则混合新旧密度,返回第 3 步,循环迭代直到收敛。

Kohn-Sham 理论的伟大之处在于,它将一个极其复杂的 \(N\) 电子问题(如 \(10^{90}\) 维度),在数学上等价地转化为了一个(原则上精确的)求解 \(N\) 个电子在有效势场中运动的 3 维问题。