深入探索:参数平移法则 (PSR) 的证明与适用范围
我们在前面介绍了参数平移法则(Parameter-Shift Rule, PSR)这个神奇的工具,它能精确计算量子电路中参数的梯度。现在,让我们揭开它的神秘面纱,看看它背后的数学原理。
1. 核心洞察:期望值的正弦响应
让我们考虑一个最简单的含参数量子电路。假设它只包含一个由参数 θ 控制的旋转门 U(θ),作用于初态 $|ψ_0\rangle$ 上。最终我们测量一个可观测量 M。
这个参数化的门 U(θ) 通常具有一种特殊的形式:
$$ U(\theta) = e^{-i\frac{\theta}{2} G} $$
其中 G 是一个生成元 (Generator)。对于我们常用的旋转门 $R_x, R_y, R_z$,它们的生成元就是对应的泡利矩阵 X, Y, Z。这些生成元 G 有一个共同的关键性质:$G^2 = I$(单位矩阵)。
现在,我们来计算最终的期望值 $E(\theta) = \langle M \rangle_\theta$:
$$ E(\theta) = \langle\psi_0| U^\dagger(\theta) M U(\theta) |\psi_0\rangle $$
将 $U(\theta) = e^{-i\frac{\theta}{2} G}$ 代入,并利用 $e^{iA} = \cos(A) + i\sin(A)$ 的欧拉公式(对于矩阵也成立):
$$ U(\theta) = \cos(\frac{\theta}{2})I - i\sin(\frac{\theta}{2})G $$
代入 $E(\theta)$ 的表达式中,我们会得到一个包含 $\cos^2(\theta/2)$, $\sin^2(\theta/2)$, $\sin(\theta/2)\cos(\theta/2)$ 的复杂式子。经过一番代数化简和三角函数变换(例如 $\sin(\theta) = 2\sin(\theta/2)\cos(\theta/2)$),我们可以证明,最终的期望值函数 $E(\theta)$ 必然可以被写成一个简单的正弦函数形式:
$$ E(\theta) = A \sin(\theta + \phi) + C $$
其中 A (振幅), φ (相位), C (垂直偏移) 是由初态 $|ψ_0\rangle$、生成元 G 和可观测量 M 共同决定的常数,但它们与 θ 无关。
这就是PSR的本质! 只要参数门的形式是 $e^{-i\frac{\theta}{2} G}$ 且 $G^2=I$,那么最终的期望值对参数 θ 的响应就是一个完美的正弦波。
2. 证明PSR
既然我们知道了 $E(\theta)$ 是一个正弦函数,求它的导数就变得非常简单了。
- 求导:
$$ \frac{dE(\theta)}{d\theta} = \frac{d}{d\theta} [A \sin(\theta + \phi) + C] = A \cos(\theta + \phi) $$ 构造表达式:现在我们来看PSR公式的右边是什么。
- $E(\theta + \frac{\pi}{2}) = A \sin(\theta + \frac{\pi}{2} + \phi) + C = A \cos(\theta + \phi) + C$
- $E(\theta - \frac{\pi}{2}) = A \sin(\theta - \frac{\pi}{2} + \phi) + C = -A \cos(\theta + \phi) + C$
- 计算差值:
$$ \frac{1}{2} [E(\theta + \frac{\pi}{2}) - E(\theta - \frac{\pi}{2})] = \frac{1}{2} [(A \cos(\theta + \phi) + C) - (-A \cos(\theta + \phi) + C)] $$
$$ = \frac{1}{2} [2A \cos(\theta + \phi)] = A \cos(\theta + \phi) $$ - 结论:我们发现,公式的左边(导数)和右边(平移后的差值)完全相等!
$$ \frac{dE(\theta)}{d\theta} = \frac{1}{2} [E(\theta + \frac{\pi}{2}) - E(\theta - \frac{\pi}{2})] $$
证明完毕! 这个法则之所以精确,是因为我们利用了函数是正弦波这一先验知识。对于任意正弦函数,其在某点的导数值,确实等于其向前和向后平移90度后的函数值之差的一半。
3. PSR的适用范围:哪些门可以用?
🔹 参数偏移规则(PSR)适用的条件
参数偏移规则可直接应用于这样的参数化量子门:
[
U(\theta) = e^{-i \theta G / 2}
]
其中 ( G ) 是一个厄米算符,并且 G 的本征值差满足固定比例关系(通常为 ±1,或更一般的固定常数),例如:
- ( G = \sigma_x, \sigma_y, \sigma_z )(Pauli 矩阵)
- 或者是 ( G ) 的本征值为 ( {±r} ) 的情况。这种情况下,PSR 的偏移量为 ( \pm \frac{\pi}{4r} )。
这种门包括常见的单量子比特旋转门:
Rx(θ) = e^{-i θ X / 2}Ry(θ) = e^{-i θ Y / 2}Rz(θ) = e^{-i θ Z / 2}
这些都可以直接用标准的 PSR 计算梯度。
🔸 无法直接应用 PSR 的情况
以下类型的参数门 不能直接使用标准 PSR:
生成子 ( G ) 具有超过两个不同本征值
例如:- 多体相互作用门,如 ( e^{-iθ(Z_1Z_2 + Z_2Z_3)/2} )
- 一些加权求和门 ( e^{-i θ (aZ + bX)/2} ),如果 ( a,b ) 使得算符的特征值不对称分布。
- 生成子非厄米或非幺正分解困难的门
比如一些包含噪声或非幺正操作的参数门。 - 参数进入方式非线性
如果门的定义不是 ( e^{-iθG/2} ) 形式,而是 (\theta) 在多个项中以复杂方式进入,如:
[
U(\theta) = e^{-i f(\theta) X/2}
]
其中 ( f(\theta) ) 是非线性函数(例如 ( f(\theta) = \theta^2 )),PSR 就无法直接应用。 - 含有控制逻辑的参数门(参数在控制条件内)
例如Controlled-Rz(θ)有时需要展开后再做修正,因为生成子在控制空间中不满足 ±r 的条件。
🧩 总结表
| 门类型 | 是否可直接用 PSR | 原因 |
|---|---|---|
Rx(θ), Ry(θ), Rz(θ) | ✅ | 生成子为 Pauli,特征值 ±1 |
CRz(θ)(受控旋转) | ⚠️ | 需展开为受控子空间才能用 |
e^{-iθ (Z₁Z₂)/2} | ✅ | 特征值 ±1 |
e^{-iθ (Z₁Z₂ + Z₂Z₃)/2} | ❌ | 生成子有多个特征值 |
U(θ) = e^{-iθ^2 Z/2} | ❌ | 参数非线性进入 |
| 含噪声通道的参数门 | ❌ | 非幺正操作,不满足 PSR 前提 |
简答:
无法直接应用参数偏移规则的参数门是那些生成子不具有两个等间距特征值(例如 ±r)、或者参数以非线性方式进入门的形式、以及非幺正操作的参数门。
好消息是:
- 对于绝大多数通用的量子机器学习模型,所使用的参数化门(如 $R_x, R_y, R_z$)都属于可以使用PSR的类型。
- 对于更复杂的情况,学术界已经研究出了推广的参数平移法则,它们可能需要平移更多次,或者使用不同的平移量,但原理是相似的。像PennyLane这样的先进框架,会自动识别生成元的类型,并调用合适的梯度计算方法。
总结:实践者的启示
- PSR是解析梯度,不是数值近似:它的精确性源于量子门控的数学结构,保证了梯度计算的可靠性。
- 检查你的门:当你设计自己的含参数量子电路时,要确保你使用的参数化门是PSR支持的(绝大多数情况下都是)。
- 信任你的框架:在使用PennyLane等工具时,你通常不需要手动实现PSR。框架会自动处理梯度计算,你只需要专注于模型的设计和训练。
通过这个深入的探讨,我们不仅学会了如何使用PSR,更理解了它为何如此强大和可靠。


Comments | NOTHING