@ickma2311: 高效AI讲座22:量子机器学习I 量子机器学习从不同的计算原语开始:量子比特…

X AI KOLs Timeline 工具

摘要

关于量子机器学习基础的讲座笔记,涵盖量子比特、叠加态、测量和布洛赫球。

高效AI讲座22:量子机器学习I 量子机器学习从一个不同的计算原语开始:量子比特。 经典机器学习将数据表示为数值向量,而量子机器学习则将信息表示为量子态:振幅、相位、叠加和纠缠。 经典比特要么是0要么是1;量子比特可以处于叠加态 |ψ⟩ = α |0⟩ + β |1⟩ 测量将量子振幅转化为经典结果,概率由振幅的平方给出。 量子门变换量子态,多量子比特系统的状态维度呈指数增长。 纠缠和量子电路是量子机器学习模型背后的关键构建模块。 我的笔记: https://ickma2311.github.io/ML/HW-SW-codesign/efficient-ai-lecture-22-quantum-machine-learning-i.html…
查看原文
查看缓存全文

缓存时间: 2026/06/26 22:17

高效AI讲座22:量子机器学习I

量子机器学习从一种不同的计算基础出发:量子比特。 经典机器学习将数据表示为数值向量,而量子机器学习将信息表示为量子态:振幅、相位、叠加和纠缠。

经典比特要么是0要么是1;量子比特可以处于叠加态 |ψ⟩ = α |0⟩ + β |1⟩ 测量将量子振幅转化为经典结果,其概率由振幅模平方给出。 量子门变换量子态,多量子比特系统的状态维度呈指数增长。 纠缠和量子电路是量子机器学习模型背后的关键构建模块。

我的笔记: https://ickma2311.github.io/ML/HW-SW-codesign/efficient-ai-lecture-22-quantum-machine-learning-i.html…


量子机器学习I – ∇ ickma.dev

来源:https://ickma2311.github.io/ML/HW-SW-codesign/efficient-ai-lecture-22-quantum-machine-learning-i.html 本讲座介绍量子机器学习所需的量子计算基础知识。关键转变在于:信息不再仅由经典比特表示,而是由可被可逆门变换并通过测量读出的复数值量子态表示。

量子计算动机

经典比特是离散的:每个比特要么是0要么是1。量子比特由复振幅向量描述。对于(n)个量子比特,状态向量有(2^n)个振幅,因此表示规模呈指数增长。

这种指数级的状态空间正是量子计算机引人注目的原因,但也是它们难以在经典机器上模拟的原因。

单量子比特

计算基态为

[ |0\rangle = \begin{bmatrix} 1 \ 0 \end{bmatrix}, \qquad |1\rangle = \begin{bmatrix} 0 \ 1 \end{bmatrix}. ]

一个量子比特可以是这些基态的复数值线性组合:

[ |\psi\rangle = \alpha |0\rangle + \beta |1\rangle. ]

振幅必须归一化:

[ |\alpha|^2 + |\beta|^2 = 1. ]

叠加态

例如,

[ |q_0\rangle = \begin{bmatrix} \frac{1}{\sqrt{2}} \ \frac{i}{\sqrt{2}} \end{bmatrix} = \frac{1}{\sqrt{2}}|0\rangle + \frac{i}{\sqrt{2}}|1\rangle. ]

这是一个叠加态:状态在测量前被表示为基态的线性组合。

测量

测量将量子态转化为经典结果。从状态(|\psi\rangle)观察到基态(|x\rangle)的概率为

[ p(|x\rangle) = |\langle x|\psi\rangle|^2. ]

像(|x\rangle)这样的右矢是列向量。像(\langle x|)这样的左矢是行向量,由相应右矢的共轭转置形成。

对于上面的例子:

[ \langle 0|q_0\rangle = \frac{1}{\sqrt{2}}\langle 0|0\rangle + \frac{i}{\sqrt{2}}\langle 0|1\rangle = \frac{1}{\sqrt{2}}, ]

所以

[ |\langle 0|q_0\rangle|^2 = \frac{1}{2}. ]

一旦测量,状态坍缩为一个结果。原始的叠加信息不再可用。

布洛赫球

布洛赫球可视化所有可能的单量子比特状态,忽略全局相位。

  • 北极代表(|0\rangle)。
  • 南极代表(|1\rangle)。
  • (\theta)控制(|0\rangle)和(|1\rangle)的相对概率。
  • (\phi)控制相对相位。

单量子比特的布洛赫球表示。 一个通用的单量子比特状态可以写为

[ |q\rangle = \cos\left(\frac{\theta}{2}\right)|0\rangle + e^{i\phi}\sin\left(\frac{\theta}{2}\right)|1\rangle. ]

量子门可以理解为该球面上状态向量的旋转。

单量子比特门

量子门是由酉矩阵表示的可逆操作。

泡利-X门类似于量子非门:

[ X = \begin{bmatrix} 0 & 1 \ 1 & 0 \end{bmatrix}. ]

泡利门有:

名称矩阵布洛赫球效应
(X)比特翻转(\begin{bmatrix}0 & 1 \ 1 & 0\end{bmatrix})绕x轴旋转(180^\circ)
(Y)相位和比特翻转(\begin{bmatrix}0 & -i \ i & 0\end{bmatrix})绕y轴旋转(180^\circ)
(Z)相位翻转(\begin{bmatrix}1 & 0 \ 0 & -1\end{bmatrix})绕z轴旋转(180^\circ)

Z门是

[ Z = \begin{bmatrix} 1 & 0 \ 0 & -1 \end{bmatrix} = |0\rangle\langle 0| - |1\rangle\langle 1|. ]

它保持(|0\rangle)不变,将(|1\rangle)映射为(-|1\rangle)。这个符号在孤立情况下物理上不可区分,但相位对量子干涉很重要。

常见基

X基态是

[ |+\rangle = \frac{1}{\sqrt{2}}(|0\rangle + |1\rangle) = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 \ 1 \end{bmatrix}, ]

[ |-\rangle = \frac{1}{\sqrt{2}}(|0\rangle - |1\rangle) = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 \ -1 \end{bmatrix}. ]

Y基态是

[ |R\rangle = \frac{|0\rangle + i|1\rangle}{\sqrt{2}}, \qquad |L\rangle = \frac{|0\rangle - i|1\rangle}{\sqrt{2}}. ]

哈达玛门

哈达玛门是

[ H = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 & 1 \ 1 & -1 \end{bmatrix}. ]

它将计算基态映射到X基:

[ H|0\rangle = |+\rangle, \qquad H|1\rangle = |-\rangle. ]

相位门和U门

相位门是

[ P(\phi) = \begin{bmatrix} 1 & 0 \ 0 & e^{i\phi} \end{bmatrix}. ]

S门是(\phi = \pi/2)的特殊情况:

[ S = \begin{bmatrix} 1 & 0 \ 0 & i \end{bmatrix}. ]

通用的单量子比特U门可以通过调整三个参数表达任何单量子比特变换:

[ U(\theta, \phi, \lambda) = \begin{bmatrix} \cos\left(\frac{\theta}{2}\right) & -e^{i\lambda}\sin\left(\frac{\theta}{2}\right) \ e^{i\phi}\sin\left(\frac{\theta}{2}\right) & e^{i(\phi+\lambda)} \cos\left(\frac{\theta}{2}\right) \end{bmatrix}. ]

多量子比特

对于两个量子比特,状态有四个振幅:

[ |a\rangle = a_{00}|00\rangle + a_{01}|01\rangle + a_{10}|10\rangle + a_{11}|11\rangle = \begin{bmatrix} a_{00} \ a_{01} \ a_{10} \ a_{11} \end{bmatrix}. ]

更一般地,(n)个量子比特需要(2^n)个振幅。这种指数级缩放赋予了量子计算强大的表示能力,也使经典模拟变得困难。

联合状态

克罗内克积将较小的状态向量组合成更大的联合状态:

[ |ba\rangle = |b\rangle \otimes |a\rangle. ]

对于(n)个量子比特,这创建了一个(2^n)维的状态向量。

多量子比特系统中的单量子比特门

要在更大系统中对某一个量子比特应用门,使用克罗内克积与单位门。例如,对第一个量子比特应用(X),对第二个不做操作,表示为

[ X \otimes I. ]

多量子比特门与纠缠

CNOT门使用一个控制量子比特和一个目标量子比特。如果控制量子比特是(|1\rangle),则目标翻转。

输入:

  • (00 \rightarrow 00)
  • (01 \rightarrow 01)
  • (10 \rightarrow 11)
  • (11 \rightarrow 10)

纠缠是量子比特之间的一种非经典关联。常见的贝尔态电路先对一个量子比特应用哈达玛门,然后应用CNOT:

[ \mathrm{CNOT}|0+\rangle = \frac{1}{\sqrt{2}}(|00\rangle + |11\rangle). ]

测量后,该状态以概率(1/2)产生(00),以概率(1/2)产生(11),但绝不会产生(01)或(10)。

其他有用的多量子比特门包括:

  • CZ:条件相位翻转。
  • SWAP:交换两个量子比特的状态。
  • CRX:绕x轴受控旋转。

量子电路

量子电路组合了:

  • 初始化和复位,
  • 量子门,
  • 测量,
  • 经典控制的量子门。

由于测量会坍缩状态,电路通常将测量延迟到最后,除非明确需要反馈。

量子加法器

量子加法使用可逆门。CNOT类似于异或门用于求和位,而多量子比特门如托佛利门可以表示进位逻辑。

与经典加法器的重要区别在于,量子电路必须保持可逆性,并且可以对叠加输入进行操作。

一个简单的量子ML电路

量子机器学习电路通常有三个阶段:

  • 数据编码:将经典数据(如像素)映射为量子旋转角度。
  • 可训练的量子层:使用参数化门,如(U_3)门。
  • 测量与预测:测量量子态并将结果映射到经典输出,如softmax分类器。

一个简单的量子机器学习电路。

NISQ时代与量子比特映射

NISQ代表含噪中等规模量子。当前的量子设备拥有数十到数百个量子比特,但它们有噪声且未完全进行错误纠正。

两个约束很重要:

  • 门会引入误差。
  • 硬件连接性有限。

量子比特映射解决了逻辑电路与物理芯片之间的差距。如果两个逻辑量子比特需要执行一个门但物理上不相邻,编译器会插入SWAP门。诸如Sabre之类的算法通过前瞻电路依赖图并更新逻辑到物理映射,力求最小化额外SWAP操作。

关键要点

量子机器学习始于量子信息基础:量子比特、测量、门、纠缠和电路。其潜力来自指数级的状态空间,但实际挑战来自NISQ硬件:有噪声的门、有限的连接性以及昂贵的路由。

来源:MIT 6.5940 TinyML与高效深度学习计算,讲座22:量子机器学习I。

相似文章

MALOQ: 用于量子输运的算符大规模加速学习

arXiv cs.LG

MALOQ 引入了一种大规模加速的机器学习模型,用于预测密度泛函理论的哈密顿矩阵/密度矩阵,利用 SO(2) 等变骨干网络和可扩展的图分布,支持对多达10万个原子的系统进行电子结构计算,在 Alps 超级计算机上实现了超过30%的每轮训练时间减少。

什么是量子力学?| Google Quantum AI

YouTube AI Channels

Google Quantum AI 的研究人员讲解量子力学基础、量子比特叠加,以及早期量子计算机未来如何模拟分子以进行药物筛选。