@ickma2311: 高效AI讲座22:量子机器学习I 量子机器学习从不同的计算原语开始:量子比特…
摘要
关于量子机器学习基础的讲座笔记,涵盖量子比特、叠加态、测量和布洛赫球。
查看缓存全文
缓存时间: 2026/06/26 22:17
高效AI讲座22:量子机器学习I
量子机器学习从一种不同的计算基础出发:量子比特。 经典机器学习将数据表示为数值向量,而量子机器学习将信息表示为量子态:振幅、相位、叠加和纠缠。
经典比特要么是0要么是1;量子比特可以处于叠加态 |ψ⟩ = α |0⟩ + β |1⟩ 测量将量子振幅转化为经典结果,其概率由振幅模平方给出。 量子门变换量子态,多量子比特系统的状态维度呈指数增长。 纠缠和量子电路是量子机器学习模型背后的关键构建模块。
我的笔记: https://ickma2311.github.io/ML/HW-SW-codesign/efficient-ai-lecture-22-quantum-machine-learning-i.html…
量子机器学习I – ∇ ickma.dev
来源:https://ickma2311.github.io/ML/HW-SW-codesign/efficient-ai-lecture-22-quantum-machine-learning-i.html 本讲座介绍量子机器学习所需的量子计算基础知识。关键转变在于:信息不再仅由经典比特表示,而是由可被可逆门变换并通过测量读出的复数值量子态表示。
量子计算动机
经典比特是离散的:每个比特要么是0要么是1。量子比特由复振幅向量描述。对于(n)个量子比特,状态向量有(2^n)个振幅,因此表示规模呈指数增长。
这种指数级的状态空间正是量子计算机引人注目的原因,但也是它们难以在经典机器上模拟的原因。
单量子比特
计算基态为
[ |0\rangle = \begin{bmatrix} 1 \ 0 \end{bmatrix}, \qquad |1\rangle = \begin{bmatrix} 0 \ 1 \end{bmatrix}. ]
一个量子比特可以是这些基态的复数值线性组合:
[ |\psi\rangle = \alpha |0\rangle + \beta |1\rangle. ]
振幅必须归一化:
[ |\alpha|^2 + |\beta|^2 = 1. ]
叠加态
例如,
[ |q_0\rangle = \begin{bmatrix} \frac{1}{\sqrt{2}} \ \frac{i}{\sqrt{2}} \end{bmatrix} = \frac{1}{\sqrt{2}}|0\rangle + \frac{i}{\sqrt{2}}|1\rangle. ]
这是一个叠加态:状态在测量前被表示为基态的线性组合。
测量
测量将量子态转化为经典结果。从状态(|\psi\rangle)观察到基态(|x\rangle)的概率为
[ p(|x\rangle) = |\langle x|\psi\rangle|^2. ]
像(|x\rangle)这样的右矢是列向量。像(\langle x|)这样的左矢是行向量,由相应右矢的共轭转置形成。
对于上面的例子:
[ \langle 0|q_0\rangle = \frac{1}{\sqrt{2}}\langle 0|0\rangle + \frac{i}{\sqrt{2}}\langle 0|1\rangle = \frac{1}{\sqrt{2}}, ]
所以
[ |\langle 0|q_0\rangle|^2 = \frac{1}{2}. ]
一旦测量,状态坍缩为一个结果。原始的叠加信息不再可用。
布洛赫球
布洛赫球可视化所有可能的单量子比特状态,忽略全局相位。
- 北极代表(|0\rangle)。
- 南极代表(|1\rangle)。
- (\theta)控制(|0\rangle)和(|1\rangle)的相对概率。
- (\phi)控制相对相位。
单量子比特的布洛赫球表示。 一个通用的单量子比特状态可以写为
[ |q\rangle = \cos\left(\frac{\theta}{2}\right)|0\rangle + e^{i\phi}\sin\left(\frac{\theta}{2}\right)|1\rangle. ]
量子门可以理解为该球面上状态向量的旋转。
单量子比特门
量子门是由酉矩阵表示的可逆操作。
泡利-X门类似于量子非门:
[ X = \begin{bmatrix} 0 & 1 \ 1 & 0 \end{bmatrix}. ]
泡利门有:
| 门 | 名称 | 矩阵 | 布洛赫球效应 |
|---|---|---|---|
| (X) | 比特翻转 | (\begin{bmatrix}0 & 1 \ 1 & 0\end{bmatrix}) | 绕x轴旋转(180^\circ) |
| (Y) | 相位和比特翻转 | (\begin{bmatrix}0 & -i \ i & 0\end{bmatrix}) | 绕y轴旋转(180^\circ) |
| (Z) | 相位翻转 | (\begin{bmatrix}1 & 0 \ 0 & -1\end{bmatrix}) | 绕z轴旋转(180^\circ) |
Z门是
[ Z = \begin{bmatrix} 1 & 0 \ 0 & -1 \end{bmatrix} = |0\rangle\langle 0| - |1\rangle\langle 1|. ]
它保持(|0\rangle)不变,将(|1\rangle)映射为(-|1\rangle)。这个符号在孤立情况下物理上不可区分,但相位对量子干涉很重要。
常见基
X基态是
[ |+\rangle = \frac{1}{\sqrt{2}}(|0\rangle + |1\rangle) = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 \ 1 \end{bmatrix}, ]
[ |-\rangle = \frac{1}{\sqrt{2}}(|0\rangle - |1\rangle) = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 \ -1 \end{bmatrix}. ]
Y基态是
[ |R\rangle = \frac{|0\rangle + i|1\rangle}{\sqrt{2}}, \qquad |L\rangle = \frac{|0\rangle - i|1\rangle}{\sqrt{2}}. ]
哈达玛门
哈达玛门是
[ H = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 & 1 \ 1 & -1 \end{bmatrix}. ]
它将计算基态映射到X基:
[ H|0\rangle = |+\rangle, \qquad H|1\rangle = |-\rangle. ]
相位门和U门
相位门是
[ P(\phi) = \begin{bmatrix} 1 & 0 \ 0 & e^{i\phi} \end{bmatrix}. ]
S门是(\phi = \pi/2)的特殊情况:
[ S = \begin{bmatrix} 1 & 0 \ 0 & i \end{bmatrix}. ]
通用的单量子比特U门可以通过调整三个参数表达任何单量子比特变换:
[ U(\theta, \phi, \lambda) = \begin{bmatrix} \cos\left(\frac{\theta}{2}\right) & -e^{i\lambda}\sin\left(\frac{\theta}{2}\right) \ e^{i\phi}\sin\left(\frac{\theta}{2}\right) & e^{i(\phi+\lambda)} \cos\left(\frac{\theta}{2}\right) \end{bmatrix}. ]
多量子比特
对于两个量子比特,状态有四个振幅:
[ |a\rangle = a_{00}|00\rangle + a_{01}|01\rangle + a_{10}|10\rangle + a_{11}|11\rangle = \begin{bmatrix} a_{00} \ a_{01} \ a_{10} \ a_{11} \end{bmatrix}. ]
更一般地,(n)个量子比特需要(2^n)个振幅。这种指数级缩放赋予了量子计算强大的表示能力,也使经典模拟变得困难。
联合状态
克罗内克积将较小的状态向量组合成更大的联合状态:
[ |ba\rangle = |b\rangle \otimes |a\rangle. ]
对于(n)个量子比特,这创建了一个(2^n)维的状态向量。
多量子比特系统中的单量子比特门
要在更大系统中对某一个量子比特应用门,使用克罗内克积与单位门。例如,对第一个量子比特应用(X),对第二个不做操作,表示为
[ X \otimes I. ]
多量子比特门与纠缠
CNOT门使用一个控制量子比特和一个目标量子比特。如果控制量子比特是(|1\rangle),则目标翻转。
输入:
- (00 \rightarrow 00)
- (01 \rightarrow 01)
- (10 \rightarrow 11)
- (11 \rightarrow 10)
纠缠是量子比特之间的一种非经典关联。常见的贝尔态电路先对一个量子比特应用哈达玛门,然后应用CNOT:
[ \mathrm{CNOT}|0+\rangle = \frac{1}{\sqrt{2}}(|00\rangle + |11\rangle). ]
测量后,该状态以概率(1/2)产生(00),以概率(1/2)产生(11),但绝不会产生(01)或(10)。
其他有用的多量子比特门包括:
- CZ:条件相位翻转。
- SWAP:交换两个量子比特的状态。
- CRX:绕x轴受控旋转。
量子电路
量子电路组合了:
- 初始化和复位,
- 量子门,
- 测量,
- 经典控制的量子门。
由于测量会坍缩状态,电路通常将测量延迟到最后,除非明确需要反馈。
量子加法器
量子加法使用可逆门。CNOT类似于异或门用于求和位,而多量子比特门如托佛利门可以表示进位逻辑。
与经典加法器的重要区别在于,量子电路必须保持可逆性,并且可以对叠加输入进行操作。
一个简单的量子ML电路
量子机器学习电路通常有三个阶段:
- 数据编码:将经典数据(如像素)映射为量子旋转角度。
- 可训练的量子层:使用参数化门,如(U_3)门。
- 测量与预测:测量量子态并将结果映射到经典输出,如softmax分类器。
一个简单的量子机器学习电路。
NISQ时代与量子比特映射
NISQ代表含噪中等规模量子。当前的量子设备拥有数十到数百个量子比特,但它们有噪声且未完全进行错误纠正。
两个约束很重要:
- 门会引入误差。
- 硬件连接性有限。
量子比特映射解决了逻辑电路与物理芯片之间的差距。如果两个逻辑量子比特需要执行一个门但物理上不相邻,编译器会插入SWAP门。诸如Sabre之类的算法通过前瞻电路依赖图并更新逻辑到物理映射,力求最小化额外SWAP操作。
关键要点
量子机器学习始于量子信息基础:量子比特、测量、门、纠缠和电路。其潜力来自指数级的状态空间,但实际挑战来自NISQ硬件:有噪声的门、有限的连接性以及昂贵的路由。
来源:MIT 6.5940 TinyML与高效深度学习计算,讲座22:量子机器学习I。
相似文章
量子对抗机器学习:从经典适应到量子原生方法
量子对抗机器学习综述,涵盖攻击、防御和理论基础。
QUIVER:量子信息视图增强大型机器学习模型的表示
本文介绍了QUIVER,一种通过从量子费舍信息矩阵中提取的量子启发特征来丰富经典机器学习模型的范式,并在分子属性预测和喷注味分类基准上展示了改进效果。
@ickma2311: 高效AI讲座13:LLM部署技术 该讲座帮助我很好地理解了AWQ、vLLM和FlashAttention…
一场关于LLM部署技术的讲座,涵盖AWQ、vLLM、FlashAttention、量化和激活平滑,以实现高效服务。
MALOQ: 用于量子输运的算符大规模加速学习
MALOQ 引入了一种大规模加速的机器学习模型,用于预测密度泛函理论的哈密顿矩阵/密度矩阵,利用 SO(2) 等变骨干网络和可扩展的图分布,支持对多达10万个原子的系统进行电子结构计算,在 Alps 超级计算机上实现了超过30%的每轮训练时间减少。
什么是量子力学?| Google Quantum AI
Google Quantum AI 的研究人员讲解量子力学基础、量子比特叠加,以及早期量子计算机未来如何模拟分子以进行药物筛选。