量子機械学習入門
概要とモチベーション
始める前に、この短いコース受講前アンケートにご回答ください。コンテンツの質とユーザー体験の改善に重要な 情報となります。
Note: This survey is provided by IBM Quantum and relates to the original English content. To give feedback on doQumentation's website, translations, or code execution, please open a GitHub issue.
量子機械学習へようこそ!
以下の動画では、下記のテキストを補足する簡単な紹介を行います。
動画の内容を簡単に振り返り、補足します:
- ある問題が初めて量子コンピュータで解かれ、その後、古典的なスーパーコンピュータでも解く方法が見つかるというサイクルが見られています。このように古典コンピューティングと量子コンピューティングがお互いの限界を押し上げるサイクルは、しばらく続く可能性があります。
- エラーの削減や利用可能な量子ビット数の増加といった分野の進歩を前提とすれば、量子コンピューティングが古典コンピューティングに対して証明可能な優位性を持てる特定の問題が存在します。しかし、量子に適したデータセットや有用な量子特徴マップを探索する時代はまだ続いています。
- 量子機械学習(QML)は、量子コンピューティングが既存の古典的なワークフローを強化・補完できる多くの興味深い分野の一つです。
機械学習(ML)はデータセットにアルゴリズムを適用するものであり、QML にはデータ側またはアルゴリズム側(あるいは両方)に量子力学が含まれる可能性があります。これらすべての可能性は潜在的に興味深いものです。しかし、私たちは主に古典的データに適用される量子アルゴリズムの 議論に限定します。理由の一つは、古典的データを用いた ML 問題がすでに非常によく研究されており、広く利用可能であることです。古典的データから始まる問題を解くことへの関心は広く存在します。もう一つの理由は QRAM の欠如です。量子データを比較的長い時間スケールで大量に保存する能力がなければ、量子データから始まる手法はまだ産業への応用からかなり遠い状態にあります。また、古典的データに効率的に「量子的にアクセス」する方法も明確ではありません。特に興味深い ML の種類として、ラベル付きデータセットを使ってアルゴリズムを訓練する教師あり学習と、アルゴリズムがラベルなしサンプルから分布を学習しようとする教師なし学習があります。教師なしアルゴリズムは、例えば同じ分布から新しいサンプルを生成する方法や、類似した特性を持つグループにサンプルをクラスタリングする方法を学習することがあります。

左の画像は教師あり学習のようにラベル付きされた2つのカテゴリのデータを示しています。この場合、カテゴリは線形分離可能です。右の画像はデータのクラスターを示しています。教師なし学習タスクでは、これらのデータは最初はラベル付けされておらず、アルゴリズムが分布を調べ、クラスターを探索します。アルゴリズムが識別するクラスターの例を可視化するために、データポイントにラベルが付与されています。二つの主な違いは、教師あり学習プロセスは データが既にラベル付けされた状態から始まり、教師なしプロセスはデータが最終的にラベル付けされる場合でも、最初はラベルなしデータから始まる点です。
機械学習の背景知識を持つ方は、多くの解法がデータをより高次元の空間に写像することを伴うことをご存知でしょう。これはカーネルの文脈で特によく研究されています。簡単に復習すると、データがデータと同じ次元数の直線、平面、または超平面(コンパクトに表現するために「超平面」と呼ぶことにします)によってカテゴリに分離できる場合があります。これは上の最初の画像に示されています。一方、そのような次元では超平面によって分離できない場合もあります(2番目の画像を参照)。しかし、高次元への写像で活用できる構造がデータに存在する場合があり、その高次元空間ではデータが分離可能になります。これは、円形対称性を持つ 2D データを、データポイントが放物面に沿って配置される 3D 空間に写像する例で示されています。

QML における共通の目標は、低次元の特徴セットからより高次元の空間への写像を見つけることで、データポイントを効果的に分離し、その写像を使って新しいデータポイントを分類できるようにすることです。 しかし、これは簡単なタスクではありません。機械学習における量子コンピューティングの潜在的な有用性についての議論は、適切な注意事項を伴う必要があります。特に、データセット選択における微妙な点や、実用スケー ルへの到達における課題に対処する必要があります。また、古典的なアルゴリズムによって既に効率的かつ適切に処理されているデータについて、古典的な ML アルゴリズムを上回ることを目指すのではなく、有用な可能性がある新しい特徴マップの探索へと議論の焦点を移す必要があります。
期待値の管理
文献に記述されている QML アプリケーションで使用される多くのデータセットは「特徴量エンジニアリングされている」ものであり、量子コンピューティングが有用であるという狭い使用事例を示すために特別に選択または生成されたデータセットを意味します。これが不正行為のように見えるとすれば、それは目の前のタスクを誤解しているということです。一部の量子特徴マップがすべてまたは多くの分類タスクを古典的機械学習アルゴリズムよりも効率的またはスケーラブルに解決できる、ということはありません。むしろ、一部の量子特徴マップ(すべてではない)は古典的な特徴マップとは異なる振る舞いをします。目の前のタスクは、複雑なデータ構造の文脈で量子回路を探索することです。取り組むべき具体的な質問は以下の通りです:
- 古典的な代替手法と比較して、最も新規な振る舞いをする可能性が高い量子回路はどれか?
- そのような新規な量子回路を使って最もよく探索できる特性を持つデータが関係する、実世界の問題は存在するか?