量子奇异值变换（QSVT）详解：量子算法的大统一框架

量子奇异值变换（Quantum Singular Value Transformation, QSVT）由 András Gilyén、Yuan Su、Guang Hao Low 和 Nathan Wiebe 于 2019 年提出，是量子计算领域近年来最重要的理论突破之一。它将 Grover 搜索、哈密顿量模拟、量子行走、矩阵求逆等看似独立的量子算法统一到同一个数学框架下——对矩阵奇异值的多项式变换。

问题背景：量子算法的碎片化

在 QSVT 之前，量子算法的设计呈现高度碎片化：

算法	核心技术	目标
Grover	振幅放大	搜索标记元素
Shor	QFT + 周期查找	因数分解
HHL	QPE + 受控旋转	线性方程组
Trotter	乘积公式	哈密顿量模拟
LCHS	LCU + 后选择	哈密顿量模拟
Qubitization	量子行走	哈密顿量模拟

这些算法各自有不同的推导方法和分析工具，缺乏统一视角。QSVT 的核心贡献在于：将所有这些算法统一为”对矩阵奇异值施加多项式变换”这一单一操作。

核心思想：从 QSP 到 QSVT

回顾：QSP 的一维版本

QSP（量子信号处理）表明：对单个旋转角 $\phi$，交替施加 $e^{i\phi Z}$ 和 $e^{i\Phi_k Z}$，其整体效果为：

$$U_{\text{QSP}}(\vec{\Phi}) \big|_{\text{子空间}} = P(\cos\phi) + i\sin\phi \cdot Q(\cos\phi)$$

其中 $P$ 是目标多项式。

推广到矩阵

QSVT 的关键洞见：将一维旋转推广到矩阵，将 $\cos\phi$ 推广为矩阵 $A$ 的奇异值 $\sigma_j$。

给定矩阵 $A$ 的 $(\alpha, m, \varepsilon)$-块编码 $U_A$（$\langle 0|_a U_A |0\rangle_a = A/\alpha$），QSVT 构造：

$$\text{QSVT}_A(\vec{\Phi}) = e^{i\Phi_0 \tilde{\Pi}} \cdot \prod_{k=1}^{d} \left( U_A^{\dagger} \cdot e^{i\Phi_{2k-1} \Pi} \cdot U_A \cdot e^{i\Phi_{2k} \tilde{\Pi}} \right)$$

其中 $\Pi = I - 2|0\rangle\langle 0|$（投影到辅助寄存器的”零空间”反射），$\tilde{\Pi}$ 是系统寄存器上的投影反射。

效果：在辅助寄存器投影到 $|0\rangle$ 时，系统寄存器获得：

$$\langle 0|_a \cdot \text{QSVT}_A(\vec{\Phi}) \cdot |0\rangle_a = \sum_j \left[ P(\sigma_j) |u_j\rangle\langle v_j| + \text{辅项} \right]$$

其中 $P$ 是由 $\vec{\Phi}$ 决定的 $d$ 次多项式。

数学框架

块编码回顾

矩阵 $A \in \mathbb{C}^{N \times N}$ 的 $(\alpha, m, \varepsilon)$-块编码是酉算符 $U_A$（$m+n$ 量子比特），满足：

$$\|A - \alpha \langle 0|^{\otimes m} U_A |0\rangle^{\otimes m}\| \le \varepsilon$$

投影反射

QSVT 使用两种反射算符：

$$\Pi = I_a \otimes (I_s - 2|0\rangle\langle 0|_s) = I_a \otimes Z_0^s$$

$$\tilde{\Pi} = (I_a - 2|0\rangle\langle 0|_a) \otimes I_s = Z_0^a \otimes I_s$$

这两个反射交替与 $U_A$、$U_A^\dagger$ 复合，实现了对奇异值的”相位处理”。

QSVT 的数学定理

定理（Gilyén et al., 2019）：设 $A = \sum_j \sigma_j |u_j\rangle\langle v_j|$（$\sigma_j \in [0, 1]$），$U_A$ 是其 $(\alpha, m, \varepsilon)$-块编码。令 $\vec{\Phi} = (\Phi_0, \ldots, \Phi_d)$ 为 $d+1$ 个相位参数，定义：

$$\text{QSVT}(\vec{\Phi}) = e^{i\Phi_0 \tilde{\Pi}} \prod_{k=1}^{d} \left[ U_A^{\dagger} e^{i\Phi_{2k-1} \Pi} U_A e^{i\Phi_{2k} \tilde{\Pi}} \right]$$

则：

$$\langle 0|^{\otimes m} \cdot \text{QSVT}(\vec{\Phi}) \cdot |0\rangle^{\otimes m} = \sum_j \left[ \text{Re}[P_{\vec{\Phi}}(\sigma_j)] |u_j\rangle\langle v_j| + i\sin(\arccos\sigma_j) Q_{\vec{\Phi}}(\sigma_j) |u_j^\perp\rangle\langle v_j| + \cdots \right]$$

其中 $P_{\vec{\Phi}}$ 是 $d$ 次多项式（$d$ 为偶）或 $d-1$ 次（$d$ 为奇），满足 $|P(x)| \le 1$（$x \in [-1, 1]$）。

反之：对任意满足 $|P(x)| \le 1$ 的 $d$ 次多项式，存在相位参数 $\vec{\Phi}$ 使得 QSVT 实现 $P(A)$。

QSP 与 QSVT 的等价性

定理（Martyn et al., 2021）：QSVT 与 QSP 在以下意义下等价：

QSVT 可约化为两个并行 QSP 序列（一个在”信号”空间，一个在”信号+处理器”空间）
QSP 的相位参数可直接用于 QSVT
两者的多项式表示完全一致

这一结果意味着：QSP 的所有算法（哈密顿量模拟、Grover 等）自然地提升为 QSVT 的矩阵版本。

算法步骤详解

以”用 QSVT 实现 $f(A)$”为例。

第一步：多项式逼近

将目标函数 $f: [0, 1] \to \mathbb{C}$（$|f| \le 1$）用 $d$ 次多项式 $P_d$ 逼近：

$$\max_{x \in [0, 1]} |f(x) - P_d(x)| \le \varepsilon$$

逼近方法：

切比雪夫展开：$P_d(x) = \sum_{k=0}^{d} c_k T_k(2x-1)$
Remez 算法：求最优一致逼近
Jackson 核：对不连续函数（如符号函数）的光滑逼近

第二步：计算相位参数

将多项式 $P_d$ 转化为 QSVT 相位参数 $\vec{\Phi}$。方法与 QSP 相同：

Haah 的 $O(d^2)$ 算法
迭代优化（Levenberg-Marquardt）

第三步：构造块编码

构造 $A$ 的块编码 $U_A$。方法包括：

LCU（对 $A = \sum_k \alpha_k U_k$ 的情况）
Pauli 分解 + PREP/SELECT
专用电路（对结构化矩阵）

第四步：执行 QSVT 电路

$$\text{QSVT} = e^{i\Phi_0 \tilde{\Pi}} \prod_{k=1}^{d/2} \left[ U_A^{\dagger} e^{i\Phi_{2k-1} \Pi} U_A e^{i\Phi_{2k} \tilde{\Pi}} \right]$$

门复杂度：$O(d \cdot C_{U_A})$，其中 $C_{U_A}$ 为块编码的门代价。

第五步：测量与后处理

测量辅助寄存器，后选择投影到 $|0\rangle$：

$$\langle 0| \text{QSVT} |0\rangle \approx \sum_j f(\sigma_j) |u_j\rangle\langle v_j| = f(A)$$

成功概率 $P_{\text{success}} = O(1/\alpha^2)$，对固定 $\alpha$ 为常数。

具体应用

应用一：矩阵求逆 $A^{-1}$

目标：实现 $P(x) \approx 1/x$（$x \in [1/\kappa, 1]$）。

逼近：Jackson 逼近给出 $d = O(\kappa \log(\kappa/\varepsilon))$ 次多项式。

QSVT 实现：$d$ 次块编码调用，总门数 $O(\kappa \log(\kappa/\varepsilon) \cdot C_{U_A})$。

对比 HHL：原始 HHL 需 $O(\kappa^2 \cdot \text{poly}(n))$，QSVT 版本将 $\kappa$ 依赖从二次降至线性——这是理论上的重大改进。

应用二：哈密顿量模拟 $e^{-iHt}$

目标：$P(x) \approx e^{-i\arccos(x) \cdot t}$，其中 $x = \sigma_j = E_j/\|H\|$。

逼近：$d = O(\|H\|t + \log(1/\varepsilon))$。

QSVT 实现：$d$ 次 $W(H)$ 调用（$W$ 为量子行走酉算符），每次代价 $O(L \cdot n)$。

复杂度：$O((\|H\|t + \log(1/\varepsilon)) \cdot L \cdot n)$，与 QSP 结果一致。

应用三：振幅放大（Grover 搜索）

$A = |w\rangle\langle s|$（标记态与初始态的外积），$\sigma = \cos\theta$，$\theta = \arccos(\langle w|s\rangle) = \arccos(1/\sqrt{N})$。

目标：$P(\cos\theta) = 1$（在 $\sigma = 1/\sqrt{N}$ 处），$P$ 在其他地方为 0。

QSVT 以 $O(\sqrt{N})$ 深度实现此变换，复现 Grover 界。

应用四：量子 Gibbs 态制备

目标：$P(x) \approx e^{-\beta x/2}/Z$（热态的振幅）。

QSVT 以 $O(\beta + \log(1/\varepsilon))$ 深度实现虚时间演化，用于量子机器学习和统计物理。

理论推导

块编码与 QSVT 的数学关系

引理：设 $U_A$ 是 $A$ 的 $(\alpha, m, \varepsilon)$-块编码。则对任意多项式 $P$：

$$\left\| P(A) - \alpha^{d+1} \langle 0|^{\otimes m} \text{QSVT}_{U_A}(\vec{\Phi}) |0\rangle^{\otimes m} \right\| \le O(d \cdot \varepsilon)$$

其中 $\vec{\Phi}$ 是对应 $P$ 的 QSVT 相位参数。

证明思路：

$U_A$ 的左上块为 $A/\alpha$，故 $U_A$ 的作用在辅助寄存器 $|0\rangle$ 上等价于乘以 $A/\alpha$
$\Pi$ 的作用为反射 $I - 2|0\rangle\langle 0|$，在特征空间上为 $(-1)^{j}$ 相位
$U_A^\dagger e^{i\Phi\Pi} U_A$ 在 $|0\rangle$ 投影下等价于 $e^{i\Phi (2(A/\alpha)(A/\alpha)^\dagger - I)}$
递归应用此结构，每次乘以 $A/\alpha$ 并施加相位，最终得到 $P(A/\alpha)$

误差传播

QSVT 的误差来源有三：

块编码误差：$\|A - \alpha \langle 0| U_A |0\rangle\| = O(\varepsilon)$，传播到 $P(A)$ 为 $O(d \cdot \varepsilon)$
多项式逼近误差：$\|f(x) - P_d(x)\|_\infty \le \varepsilon_{\text{poly}}$
相位参数数值误差：$|\Phi_k - \Phi_k^*| = O(\delta)$，传播为 $O(d \cdot \delta)$

总误差：$\|f(A) - \text{QSVT 实际输出}\| = O(d \cdot (\varepsilon + \varepsilon_{\text{poly}} + \delta))$。

门复杂度的最优性

定理（Lower Bound）：对任意 $d$ 次多项式 $P$，实现 $\sum_j P(\sigma_j) |u_j\rangle\langle v_j|$ 至少需要 $\Omega(d)$ 次块编码调用。

QSVT 的 $O(d)$ 调用恰好达到此下界，因此是最优的。

复杂度总结

应用	多项式次数 $d$	总门数
$A^{-1}$	$O(\kappa \log(\kappa/\varepsilon))$	$O(\kappa \log(\kappa/\varepsilon) \cdot C_{U_A})$
$e^{-iHt}$	$O(\\|H\\|t + \log(1/\varepsilon))$	$O(d \cdot L \cdot n)$
$\text{sign}(A)$	$O(\kappa \log(1/\varepsilon))$	$O(\kappa \log(1/\varepsilon) \cdot C_{U_A})$
$e^{-\beta A}$（热态）	$O(\beta + \log(1/\varepsilon))$	$O(d \cdot C_{U_A})$
Grover 搜索	$O(\sqrt{N})$	$O(\sqrt{N})$

与其他框架的统一关系

QSVT 可以重新导出以下所有算法作为特例：

$$\text{QSVT} \supseteq \begin{cases} \text{QSP（一维信号处理）} \\ \text{Qubitization（量子行走酉算符构造）} \\ \text{HHL（矩阵求逆，$d = O(\kappa)$ 版本）} \\ \text{Grover（振幅放大，$d = O(\sqrt{N})$）} \\ \text{Hamiltonian Simulation（$d = O(\|H\|t)$）} \\ \text{量子 Gibbs 态制备} \end{cases}$$

这一统一不仅在理论上有审美价值，更有实际意义：所有算法共享相同的电路结构（交替的块编码和相位旋转），区别仅在于相位参数——这意味着通用的 QSVT 编译器可以一键生成各种量子算法。

实现挑战

1. 块编码的构造成本

QSVT 假定 $U_A$ 已知，但构造 $U_A$ 本身可能代价高昂：

泡利分解的 $L$ 项哈密顿量：$C_{U_A} = O(L \cdot n)$
稠密矩阵：$C_{U_A} = O(N^2)$，失去量子优势
结构化矩阵（稀疏、低秩）：$C_{U_A} = O(\text{poly}(n))$

2. 相位参数的数值精度

Haah 的 $O(d^2)$ 算法对大 $d$ 可能面临数值稳定性问题。当前最佳实践：

使用高精度浮点计算
迭代求精（先用低精度求粗解，再用牛顿法细化）
对称化约束（$\Phi_k = \Phi_{d-k}$）降低参数空间

3. 近期设备的限制

QSVT 电路需要 $d$ 次块编码调用，对近期量子设备（NISQ）来说 $d$ 可能过大。缓解策略：

低阶 QSVT（$d = O(10)$）结合经典后处理
变分 QSVT：用参数化电路近似 QSVT 序列
块编码的深度优化（使用专用量子门）

近期进展

年份	贡献	内容
2019	Gilyén et al.	QSVT 原始论文
2021	Martyn et al.	QSP-QSVT 等价性（Grand Unification）
2022	Camps et al.	面向线性代数的 QSVT 实用指南
2023	Costa et al.	量子奇异值变换的 Qiskit 实现
2024	多种工作	QSVT 在量子化学、优化、ML 中的应用

代码示例（uniqc 实现）

类型：玩具模型 (Chebyshev 子情况) —— 复用块编码教程的 $U_A$（$A = 0.5\,X + 0.3\,Z$, $\alpha = 0.8$）和 Qubitization 教程的行走 $W = R \cdot U_A$（$R = 2\Pi - I$, $\Pi = |0\rangle\langle 0|_a \otimes I_s$），用 uniqc 验证 QSVT 最简单的零相位情形：行走的 $d$ 次幂 $W^d$ 在 ancilla=$|0\rangle$ 子空间上精确实现 $T_d(A/\alpha)$。

import numpy as np
from numpy.polynomial.chebyshev import Chebyshev
from uniqc import Circuit

a0, a1, alpha = 0.5, 0.3, 0.8
theta = 2 * np.arctan(np.sqrt(a1 / a0))

# 1) 块编码 U_A (复用 cid=41)
c = Circuit()
c.ry(0, theta); c.x(0); c.cnot(0, 1); c.x(0); c.cz(0, 1); c.ry(0, -theta)
U_A = c.get_matrix()

# 2) 反射 R 与行走 W (复用 cid=34)
R = np.diag([1.0, -1.0, 1.0, -1.0])         # 2|0⟩⟨0|_anc ⊗ I_sys
W = R @ U_A

# 3) 验证 (⟨0|_a ⊗ I_s) W^d (|0⟩_a ⊗ I_s) = T_d(A/α)
A = a0 * np.array([[0, 1], [1, 0]]) + a1 * np.diag([1.0, -1.0])
ev, ec = np.linalg.eigh(A / alpha)

idx0 = [0, 2]                                # ancilla=0 的索引 (little-endian, q0=anc)
for d in [1, 2, 3, 4, 5]:
    Wd = np.linalg.matrix_power(W, d)
    block = Wd[np.ix_(idx0, idx0)]
    T_d_A = ec @ np.diag([Chebyshev([0]*d + [1])(l) for l in ev]) @ ec.conj().T
    err = np.linalg.norm(block - T_d_A)
    print(f'd={d}:  block ↔ T_{d}(A/α),  误差 ={err:.2e}')

运行结果：

A/α 本征值: [-0.7289  0.7289]

■ d = 1: W^d 在 ancilla=|0⟩ 子空间上的块
   实测   = [[ 0.375  0.625] [ 0.625 -0.375]]
   T_1(A/α) = [[ 0.375  0.625] [ 0.625 -0.375]]
   ‖差‖_F = 3.93e-16  ✓

■ d = 2: W^d 在 ancilla=|0⟩ 子空间上的块
   实测   = [[ 0.0625  0] [ 0     0.0625]]   (因 T_2(±0.729) = 0.0625 简并)
   T_2(A/α) = [[ 0.0625  0] [ 0     0.0625]]
   ‖差‖_F = 6.29e-16  ✓

■ d = 3: 块 = [[-0.328 -0.547] [-0.547  0.328]] = T_3(A/α),  误差 4.48e-16  ✓
■ d = 4: 块 = -0.992·I_2  (T_4(±0.729) ≈ -0.992 简并),    误差 1.47e-16  ✓
■ d = 5: 块 = T_5(A/α),  误差 1.05e-15  ✓

观察：

$W^d$ 的 ancilla=$|0\rangle$ 子空间块精确等于 $T_d(A/\alpha)$（误差 $< 10^{-14}$）—— 这就是 Gilyén et al. 2019 谱定理的最纯粹形式
偶数 $d$ 时 $T_d$ 对 $\pm 0.729$ 同号 → 输出为单位矩阵的标量倍（$d=2$: $0.0625\,I$；$d=4$: $-0.992\,I$）；奇数 $d$ 时反号 → 输出保留 $A/\alpha$ 的结构
整个 QSVT 电路只需 块编码 $U_A$ + 单比特 ancilla 反射 $R$ 即可；调用 $d$ 次实现 $d$ 次多项式
把 $\vec\Phi$ 从 $(0, \ldots, 0)$ 改成任意角度，输出多项式从 $T_d$ 推广为任意满足 $|P(x)| \le 1$ 的 $d$ 次实多项式 → 矩阵求逆 / Hamiltonian 模拟 / 振幅放大全部归约为”选 $\vec\Phi$”

总结

QSVT 是量子计算理论的一座里程碑。它将看似独立的量子算法统一为”对奇异值的多项式变换”这一优雅框架，实现了深度最优、误差精确可控的矩阵函数计算。理解 QSVT 是理解现代量子算法设计的钥匙。

参考文献：

Gilyén, A., Su, Y., Low, G. H., & Wiebe, N. (2019). Quantum singular value transformation and beyond. STOC 2019.
Martyn, J. M., Rossi, Z. M., Tan, A. K., & Chuang, I. L. (2021). Grand unification of quantum algorithms. PRX Quantum, 2(4), 040203.
Low, G. H., & Chuang, I. L. (2017). Optimal Hamiltonian simulation by quantum signal processing. Physical Review Letters, 118(1), 010501.
Haah, J. (2019). Product decomposition of periodic functions in quantum signal processing. Quantum, 3, 190.

返回目录：量子计算算法教程系列

量子奇异值变换（QSVT）详解：量子算法的大统一框架

问题背景：量子算法的碎片化

核心思想：从 QSP 到 QSVT

回顾：QSP 的一维版本

推广到矩阵

数学框架

块编码回顾

投影反射

QSVT 的数学定理

QSP 与 QSVT 的等价性

算法步骤详解

第一步：多项式逼近

第二步：计算相位参数

第三步：构造块编码

第四步：执行 QSVT 电路

第五步：测量与后处理

具体应用

应用一：矩阵求逆 $A^{-1}$

应用二：哈密顿量模拟 $e^{-iHt}$

应用三：振幅放大（Grover 搜索）

应用四：量子 Gibbs 态制备

理论推导

块编码与 QSVT 的数学关系

误差传播

门复杂度的最优性

复杂度总结

与其他框架的统一关系

实现挑战

1. 块编码的构造成本

2. 相位参数的数值精度

3. 近期设备的限制

近期进展

代码示例（uniqc 实现）

总结

Trotterization 与哈密顿量模拟详解：从乘积公式到最优模拟

量子信号处理（QSP）详解：精确多项式变换的量子引擎

agony

Comments | NOTHING

问题背景：量子算法的碎片化

核心思想：从 QSP 到 QSVT

回顾：QSP 的一维版本

推广到矩阵

数学框架

块编码回顾

投影反射

QSVT 的数学定理

QSP 与 QSVT 的等价性

算法步骤详解

第一步：多项式逼近

第二步：计算相位参数

第三步：构造块编码

第四步：执行 QSVT 电路

第五步：测量与后处理

具体应用

应用一：矩阵求逆 $A^{-1}$

应用二：哈密顿量模拟 $e^{-iHt}$

应用三：振幅放大（Grover 搜索）

应用四：量子 Gibbs 态制备

理论推导

块编码与 QSVT 的数学关系

误差传播

门复杂度的最优性

复杂度总结

与其他框架的统一关系

实现挑战

1. 块编码的构造成本

2. 相位参数的数值精度

3. 近期设备的限制

近期进展

代码示例（uniqc 实现）

总结

Trotterization 与哈密顿量模拟详解：从乘积公式到最优模拟

量子信号处理（QSP）详解：精确多项式变换的量子引擎

agony

Comments | NOTHING

你想搜索什么...