Challenges and Opportunities of Quantum Machine Learning

Min-Hsiu Hsieh (謝明修)

Hon Hai Quantum Computing Center

f: X\to Y

Unknown Function

\{(x_i,y_i)\}_{i=1}^N

Training Data

\mathcal{H}

Hypothesis Set

Learning

Algorithm

\hat{f}

Comp. Complexity

Sample Complexity

Quantum Computation

Classical Bit $x\in\mathbb{Z}=\{0,1\}$

QuBit $\rho\in\mathbb{C}^{2\times 2}\geq0$ & Tr$[\rho]=1$

Random Bit $\left(\begin{array}{cc} p(0) & 0\\ 0 & p(1) \end{array}\right)$ is a special case.

Quantum Computation

Quantum Operation: $\rho\mapsto\sigma$

Unitary is a special case.

Quantum Measurement: $\rho\mapsto\mathbb{R}$

Quantum Challenge #1

Noncommutative: $AB\neq BA$

Moment Generating Function: $\mathbb{E}e^{\theta (A+B)}\neq\mathbb{E}e^{\theta A}e^{\theta B}$

\frac{a}{b} \mapsto A B^{-1}?

e^{a+b} \mapsto e^A e^B?

Quantum Challenge #2

Entanglement: $\rho_{AB}\neq \rho_{A}\otimes\rho_B$

Problem Setup

=\{\pm 1\}

Alice

Bob

Compute $(QS+RS+RT-QT)$

Classical Mechanics

$\theta=(Q+R)S+(R-Q)T\leq 2$

Let $\text{p}(qrst) := \text{Pr}\{Q=q,R=r,S=s,T=t\}$.

\mathbb{E}[\theta]= \sum_{qrst}\text{p} (qrst)(qs+rs+rt-qt)

\leq 2

Probabilistically,

Quantum Mechanics

|\Psi_{AB}\rangle = \frac{1}{\sqrt{2}}\left(|0\rangle_A|1\rangle_B -|1\rangle_A |0\rangle_B\right)

=\{\pm 1\}

Q=Z

R=X

S=\frac{-Z-X}{\sqrt{2}}

T=\frac{Z-X}{\sqrt{2}}

Quantum Mechanics

\mathbb{E}[\theta] = \langle QS\rangle + \langle RS\rangle + \langle RT\rangle - \langle QT\rangle= 2\sqrt{2}

Why Quantum Computation Matters?

Many More!

Type of Input

Type of Algorithms

CQ

CC

QC

QQ

CQ

QQ

QC

Linear Equation Solvers

Peceptron

Recommendation Systems

Semidefinite Programming

Many Others (such as non-Convex Optimization)

State Tomography

Entanglement Structure

Quantum Control

CC

Linear Equation Solvers

Recommendation Systems

Semidefinite Programming

Minimum Conical Hull

Quantum-Inspired Classical Algorithms

CQ

QC

Readin

Readout

Q.C.

Input Models

[1] V. Giovannetti, S. Lloyd, and L. Maccone, Phys. Rev. Lett. 100, 160501 (2008).

Readout

\text{In general, requires } O(\frac{rd}{\epsilon^2}) \text{ copies of } \rho.

Readout

Our readout improvement

Given: Input $A\in\mathbb{R}^{m\times n}$ of rank $r$ &

$|v\rangle \in\text{row}(A)$

Thm: poly($r,\epsilon^{-1}$) query to QRAM &

poly($r,\epsilon^{-1}$) copies of $|v\rangle$.

[1] Efficient State Read-out for Quantum Machine Learning Algorithms. Kaining Zhang, Min-Hsiu Hsieh, Liu Liu, Dacheng Tao. arXiv:2004.06421

High Level Proof

1. $|v\rangle = \sum_{i=1}^r x_i |A_{g(i)}\rangle\in\text{row}(A)$

2. quantum Gram-Schmidt Process algorithm to construct $\{A_{g(i)}\}$

3. Obtain $\{x_i\}$.

Neural Networks

Expressive Power

$\rangle$

[1] Yuxuan Du, Min-Hsiu Hsieh, Tongliang Liu, Dacheng Tao. The Expressive Power of Parameterized Quantum Circuits. Physical Review Research 2, 033125 (2020) [arXiv:1810.11922].

Trainability of QNN

Gradients vanish to zero exponentially with respect to the number of qubits.

Barren Plateau problem:

[1] Jarrod R McClean, Sergio Boixo, Vadim N Smelyanskiy, Ryan Babbush, and Hartmut Neven. Barren plateaus in quantum neural network training landscapes. Nature communications, 9(1):1– 6, 2018.

Trainability of QNN

[1] Kaining Zhang, Min-Hsiu Hsieh, Liu Liu, Dacheng Tao. Toward Trainability of Quantum Neural Networks. arXiv:2011.06258 (2020).

\mathbb{E}_{\bm{\theta}} \|\nabla_{\bm{\theta}} f_{\text{TT}} \|\geq O(\frac{2^{-2L}}{n})