量子奇异值变换(Quantum Singular Value Transformation, QSVT)由 András Gilyén、Yuan Su、Guang Hao Low 和 Nathan Wiebe 于 2019 年提出,是量子计算领域近年来最重要的理论突破之一。它将 Grover 搜索、哈密顿量模拟、量子行走、矩阵求逆等看似独立的量子算法统一到同一个数学框架下——对矩阵奇异值的多项式变换。
问题背景:量子算法的碎片化
在 QSVT 之前,量子算法的设计呈现高度碎片化:
| 算法 | 核心技术 | 目标 |
|---|---|---|
| Grover | 振幅放大 | 搜索标记元素 |
| Shor | QFT + 周期查找 | 因数分解 |
| HHL | QPE + 受控旋转 | 线性方程组 |
| Trotter | 乘积公式 | 哈密顿量模拟 |
| LCHS | LCU + 后选择 | 哈密顿量模拟 |
| Qubitization | 量子行走 | 哈密顿量模拟 |
这些算法各自有不同的推导方法和分析工具,缺乏统一视角。QSVT 的核心贡献在于:将所有这些算法统一为”对矩阵奇异值施加多项式变换”这一单一操作。
核心思想:从 QSP 到 QSVT
回顾:QSP 的一维版本
QSP(量子信号处理)表明:对单个旋转角 $\phi$,交替施加 $e^{i\phi Z}$ 和 $e^{i\Phi_k Z}$,其整体效果为:
$$U_{\text{QSP}}(\vec{\Phi}) \big|_{\text{子空间}} = P(\cos\phi) + i\sin\phi \cdot Q(\cos\phi)$$
其中 $P$ 是目标多项式。
推广到矩阵
QSVT 的关键洞见:将一维旋转推广到矩阵,将 $\cos\phi$ 推广为矩阵 $A$ 的奇异值 $\sigma_j$。
给定矩阵 $A$ 的 $(\alpha, m, \varepsilon)$-块编码 $U_A$($\langle 0|_a U_A |0\rangle_a = A/\alpha$),QSVT 构造:
$$\text{QSVT}_A(\vec{\Phi}) = e^{i\Phi_0 \tilde{\Pi}} \cdot \prod_{k=1}^{d} \left( U_A^{\dagger} \cdot e^{i\Phi_{2k-1} \Pi} \cdot U_A \cdot e^{i\Phi_{2k} \tilde{\Pi}} \right)$$
其中 $\Pi = I - 2|0\rangle\langle 0|$(投影到辅助寄存器的”零空间”反射),$\tilde{\Pi}$ 是系统寄存器上的投影反射。
效果:在辅助寄存器投影到 $|0\rangle$ 时,系统寄存器获得:
$$\langle 0|_a \cdot \text{QSVT}_A(\vec{\Phi}) \cdot |0\rangle_a = \sum_j \left[ P(\sigma_j) |u_j\rangle\langle v_j| + \text{辅项} \right]$$
其中 $P$ 是由 $\vec{\Phi}$ 决定的 $d$ 次多项式。
数学框架
块编码回顾
矩阵 $A \in \mathbb{C}^{N \times N}$ 的 $(\alpha, m, \varepsilon)$-块编码是酉算符 $U_A$($m+n$ 量子比特),满足:
$$\|A - \alpha \langle 0|^{\otimes m} U_A |0\rangle^{\otimes m}\| \le \varepsilon$$
投影反射
QSVT 使用两种反射算符:
$$\Pi = I_a \otimes (I_s - 2|0\rangle\langle 0|_s) = I_a \otimes Z_0^s$$
$$\tilde{\Pi} = (I_a - 2|0\rangle\langle 0|_a) \otimes I_s = Z_0^a \otimes I_s$$
这两个反射交替与 $U_A$、$U_A^\dagger$ 复合,实现了对奇异值的”相位处理”。
QSVT 的数学定理
定理(Gilyén et al., 2019):设 $A = \sum_j \sigma_j |u_j\rangle\langle v_j|$($\sigma_j \in [0, 1]$),$U_A$ 是其 $(\alpha, m, \varepsilon)$-块编码。令 $\vec{\Phi} = (\Phi_0, \ldots, \Phi_d)$ 为 $d+1$ 个相位参数,定义:
$$\text{QSVT}(\vec{\Phi}) = e^{i\Phi_0 \tilde{\Pi}} \prod_{k=1}^{d} \left[ U_A^{\dagger} e^{i\Phi_{2k-1} \Pi} U_A e^{i\Phi_{2k} \tilde{\Pi}} \right]$$
则:
$$\langle 0|^{\otimes m} \cdot \text{QSVT}(\vec{\Phi}) \cdot |0\rangle^{\otimes m} = \sum_j \left[ \text{Re}[P_{\vec{\Phi}}(\sigma_j)] |u_j\rangle\langle v_j| + i\sin(\arccos\sigma_j) Q_{\vec{\Phi}}(\sigma_j) |u_j^\perp\rangle\langle v_j| + \cdots \right]$$
其中 $P_{\vec{\Phi}}$ 是 $d$ 次多项式($d$ 为偶)或 $d-1$ 次($d$ 为奇),满足 $|P(x)| \le 1$($x \in [-1, 1]$)。
反之:对任意满足 $|P(x)| \le 1$ 的 $d$ 次多项式,存在相位参数 $\vec{\Phi}$ 使得 QSVT 实现 $P(A)$。
QSP 与 QSVT 的等价性
定理(Martyn et al., 2021):QSVT 与 QSP 在以下意义下等价:
- QSVT 可约化为两个并行 QSP 序列(一个在”信号”空间,一个在”信号+处理器”空间)
- QSP 的相位参数可直接用于 QSVT
- 两者的多项式表示完全一致
这一结果意味着:QSP 的所有算法(哈密顿量模拟、Grover 等)自然地提升为 QSVT 的矩阵版本。
算法步骤详解
以”用 QSVT 实现 $f(A)$”为例。
第一步:多项式逼近
将目标函数 $f: [0, 1] \to \mathbb{C}$($|f| \le 1$)用 $d$ 次多项式 $P_d$ 逼近:
$$\max_{x \in [0, 1]} |f(x) - P_d(x)| \le \varepsilon$$
逼近方法:
- 切比雪夫展开:$P_d(x) = \sum_{k=0}^{d} c_k T_k(2x-1)$
- Remez 算法:求最优一致逼近
- Jackson 核:对不连续函数(如符号函数)的光滑逼近
第二步:计算相位参数
将多项式 $P_d$ 转化为 QSVT 相位参数 $\vec{\Phi}$。方法与 QSP 相同:
- Haah 的 $O(d^2)$ 算法
- 迭代优化(Levenberg-Marquardt)
第三步:构造块编码
构造 $A$ 的块编码 $U_A$。方法包括:
- LCU(对 $A = \sum_k \alpha_k U_k$ 的情况)
- Pauli 分解 + PREP/SELECT
- 专用电路(对结构化矩阵)
第四步:执行 QSVT 电路
$$\text{QSVT} = e^{i\Phi_0 \tilde{\Pi}} \prod_{k=1}^{d/2} \left[ U_A^{\dagger} e^{i\Phi_{2k-1} \Pi} U_A e^{i\Phi_{2k} \tilde{\Pi}} \right]$$
门复杂度:$O(d \cdot C_{U_A})$,其中 $C_{U_A}$ 为块编码的门代价。
第五步:测量与后处理
测量辅助寄存器,后选择投影到 $|0\rangle$:
$$\langle 0| \text{QSVT} |0\rangle \approx \sum_j f(\sigma_j) |u_j\rangle\langle v_j| = f(A)$$
成功概率 $P_{\text{success}} = O(1/\alpha^2)$,对固定 $\alpha$ 为常数。
具体应用
应用一:矩阵求逆 $A^{-1}$
目标:实现 $P(x) \approx 1/x$($x \in [1/\kappa, 1]$)。
逼近:Jackson 逼近给出 $d = O(\kappa \log(\kappa/\varepsilon))$ 次多项式。
QSVT 实现:$d$ 次块编码调用,总门数 $O(\kappa \log(\kappa/\varepsilon) \cdot C_{U_A})$。
对比 HHL:原始 HHL 需 $O(\kappa^2 \cdot \text{poly}(n))$,QSVT 版本将 $\kappa$ 依赖从二次降至线性——这是理论上的重大改进。
应用二:哈密顿量模拟 $e^{-iHt}$
目标:$P(x) \approx e^{-i\arccos(x) \cdot t}$,其中 $x = \sigma_j = E_j/\|H\|$。
逼近:$d = O(\|H\|t + \log(1/\varepsilon))$。
QSVT 实现:$d$ 次 $W(H)$ 调用($W$ 为量子行走酉算符),每次代价 $O(L \cdot n)$。
复杂度:$O((\|H\|t + \log(1/\varepsilon)) \cdot L \cdot n)$,与 QSP 结果一致。
应用三:振幅放大(Grover 搜索)
$A = |w\rangle\langle s|$(标记态与初始态的外积),$\sigma = \cos\theta$,$\theta = \arccos(\langle w|s\rangle) = \arccos(1/\sqrt{N})$。
目标:$P(\cos\theta) = 1$(在 $\sigma = 1/\sqrt{N}$ 处),$P$ 在其他地方为 0。
QSVT 以 $O(\sqrt{N})$ 深度实现此变换,复现 Grover 界。
应用四:量子 Gibbs 态制备
目标:$P(x) \approx e^{-\beta x/2}/Z$(热态的振幅)。
QSVT 以 $O(\beta + \log(1/\varepsilon))$ 深度实现虚时间演化,用于量子机器学习和统计物理。
理论推导
块编码与 QSVT 的数学关系
引理:设 $U_A$ 是 $A$ 的 $(\alpha, m, \varepsilon)$-块编码。则对任意多项式 $P$:
$$\left\| P(A) - \alpha^{d+1} \langle 0|^{\otimes m} \text{QSVT}_{U_A}(\vec{\Phi}) |0\rangle^{\otimes m} \right\| \le O(d \cdot \varepsilon)$$
其中 $\vec{\Phi}$ 是对应 $P$ 的 QSVT 相位参数。
证明思路:
- $U_A$ 的左上块为 $A/\alpha$,故 $U_A$ 的作用在辅助寄存器 $|0\rangle$ 上等价于乘以 $A/\alpha$
- $\Pi$ 的作用为反射 $I - 2|0\rangle\langle 0|$,在特征空间上为 $(-1)^{j}$ 相位
- $U_A^\dagger e^{i\Phi\Pi} U_A$ 在 $|0\rangle$ 投影下等价于 $e^{i\Phi (2(A/\alpha)(A/\alpha)^\dagger - I)}$
- 递归应用此结构,每次乘以 $A/\alpha$ 并施加相位,最终得到 $P(A/\alpha)$
误差传播
QSVT 的误差来源有三:
- 块编码误差:$\|A - \alpha \langle 0| U_A |0\rangle\| = O(\varepsilon)$,传播到 $P(A)$ 为 $O(d \cdot \varepsilon)$
- 多项式逼近误差:$\|f(x) - P_d(x)\|_\infty \le \varepsilon_{\text{poly}}$
- 相位参数数值误差:$|\Phi_k - \Phi_k^*| = O(\delta)$,传播为 $O(d \cdot \delta)$
总误差:$\|f(A) - \text{QSVT 实际输出}\| = O(d \cdot (\varepsilon + \varepsilon_{\text{poly}} + \delta))$。
门复杂度的最优性
定理(Lower Bound):对任意 $d$ 次多项式 $P$,实现 $\sum_j P(\sigma_j) |u_j\rangle\langle v_j|$ 至少需要 $\Omega(d)$ 次块编码调用。
QSVT 的 $O(d)$ 调用恰好达到此下界,因此是最优的。
复杂度总结
| 应用 | 多项式次数 $d$ | 总门数 |
|---|---|---|
| $A^{-1}$ | $O(\kappa \log(\kappa/\varepsilon))$ | $O(\kappa \log(\kappa/\varepsilon) \cdot C_{U_A})$ |
| $e^{-iHt}$ | $O(\|H\|t + \log(1/\varepsilon))$ | $O(d \cdot L \cdot n)$ |
| $\text{sign}(A)$ | $O(\kappa \log(1/\varepsilon))$ | $O(\kappa \log(1/\varepsilon) \cdot C_{U_A})$ |
| $e^{-\beta A}$(热态) | $O(\beta + \log(1/\varepsilon))$ | $O(d \cdot C_{U_A})$ |
| Grover 搜索 | $O(\sqrt{N})$ | $O(\sqrt{N})$ |
与其他框架的统一关系
QSVT 可以重新导出以下所有算法作为特例:
$$\text{QSVT} \supseteq \begin{cases} \text{QSP(一维信号处理)} \\ \text{Qubitization(量子行走酉算符构造)} \\ \text{HHL(矩阵求逆,$d = O(\kappa)$ 版本)} \\ \text{Grover(振幅放大,$d = O(\sqrt{N})$)} \\ \text{Hamiltonian Simulation($d = O(\|H\|t)$)} \\ \text{量子 Gibbs 态制备} \end{cases}$$
这一统一不仅在理论上有审美价值,更有实际意义:所有算法共享相同的电路结构(交替的块编码和相位旋转),区别仅在于相位参数——这意味着通用的 QSVT 编译器可以一键生成各种量子算法。
实现挑战
1. 块编码的构造成本
QSVT 假定 $U_A$ 已知,但构造 $U_A$ 本身可能代价高昂:
- 泡利分解的 $L$ 项哈密顿量:$C_{U_A} = O(L \cdot n)$
- 稠密矩阵:$C_{U_A} = O(N^2)$,失去量子优势
- 结构化矩阵(稀疏、低秩):$C_{U_A} = O(\text{poly}(n))$
2. 相位参数的数值精度
Haah 的 $O(d^2)$ 算法对大 $d$ 可能面临数值稳定性问题。当前最佳实践:
- 使用高精度浮点计算
- 迭代求精(先用低精度求粗解,再用牛顿法细化)
- 对称化约束($\Phi_k = \Phi_{d-k}$)降低参数空间
3. 近期设备的限制
QSVT 电路需要 $d$ 次块编码调用,对近期量子设备(NISQ)来说 $d$ 可能过大。缓解策略:
- 低阶 QSVT($d = O(10)$)结合经典后处理
- 变分 QSVT:用参数化电路近似 QSVT 序列
- 块编码的深度优化(使用专用量子门)
近期进展
| 年份 | 贡献 | 内容 |
|---|---|---|
| 2019 | Gilyén et al. | QSVT 原始论文 |
| 2021 | Martyn et al. | QSP-QSVT 等价性(Grand Unification) |
| 2022 | Camps et al. | 面向线性代数的 QSVT 实用指南 |
| 2023 | Costa et al. | 量子奇异值变换的 Qiskit 实现 |
| 2024 | 多种工作 | QSVT 在量子化学、优化、ML 中的应用 |
总结
QSVT 是量子计算理论的一座里程碑。它将看似独立的量子算法统一为”对奇异值的多项式变换”这一优雅框架,实现了深度最优、误差精确可控的矩阵函数计算。理解 QSVT 是理解现代量子算法设计的钥匙。
参考文献:
- Gilyén, A., Su, Y., Low, G. H., & Wiebe, N. (2019). Quantum singular value transformation and beyond. STOC 2019.
- Martyn, J. M., Rossi, Z. M., Tan, A. K., & Chuang, I. L. (2021). Grand unification of quantum algorithms. PRX Quantum, 2(4), 040203.
- Low, G. H., & Chuang, I. L. (2017). Optimal Hamiltonian simulation by quantum signal processing. Physical Review Letters, 118(1), 010501.
- Haah, J. (2019). Product decomposition of periodic functions in quantum signal processing. Quantum, 3, 190.


Comments | NOTHING
该文章已经关闭评论