JupyterHub on an on-premises cloud — a special focus on GPU Accelerated Machine Learning and 3D Visualization

EUNIS 2021 (EPiC Series in Computing, vol. 78)(2021) · 論文 · blankburian2021onpremises

📅 この論文を見た日

初回 2026-06-09 / 最終 2026-06-09 / 計 1 回更新

AI解説

出版社版: https://doi.org/10.29007/f8vp(運用: jupyterhub.uni-muenster.de) 情報源: 全文(PDF・8頁)を精読して検証済み。OpenStack+Ceph の WWU Cloud、ベアメタル Kubernetes(Cluster API + Metal3.io + OpenStack Ironic)、KubeSpawner、vGPU=VFIO mdev(NVIDIA GRID)で CUDA ネイティブ実行、VirtualGL+noVNC、CPU 15倍/RAM 1.5倍オーバーコミット、を確認。

一言で

ドイツ・ミュンスター大学の IT 部門が、自前のオンプレ クラウド(OpenStack 上のベアメタル Kubernetes)の上に JupyterHub を構築し、GPU を使う機械学習ブラウザ越しの 3D 可視化まで提供した運用報告。各ユーザを 1 Pod として KubeSpawner で起動し、セッション内で vGPU を使って CUDA コードをネイティブに走らせ、X11 の 3D アプリは VirtualGL + noVNC でブラウザにストリーミングする——「クライアント側に何も要らない」のが売り。

背景・問題

大学の IT 部門として、学生・教員・研究者に計算環境を提供したい。困りごとは、

問題は「オンプレ クラウド上の JupyterHub で、GPU ML と 3D 可視化までを”クライアント要件ゼロ”で提供する標準構成がない」こと。

提案手法(システム構成=やったこと)

土台はハイパーコンバージド(計算+ストレージ+GPU を同居)な OpenStack「WWU Cloud」。その上にベアメタル Kubernetes クラスタを敷き(将来は Cluster API + OpenStack Ironic へ移行)、ストレージは Ceph

直感:KubeSpawner で「1 ユーザ = 1 Pod」を実現するのは定番だが、本論文の独自色は (a) vGPU をセッションに通して CUDA をネイティブに動かすことと、(b) サーバ側 GPU で 3D をレンダリングして noVNC で配信すること。重い GPU 処理をサーバに集約し、ユーザはブラウザだけで使える。

数式・アルゴリズム

最適化ではなく運用アーキテクチャ。スタックの対応を書くと:OpenStack(WWU Cloud) → ベアメタル Kubernetes → JupyterHub/KubeSpawner → ユーザ Pod(+vGPU, +VirtualGL/Xorg サイドカー → noVNC)、ストレージは Ceph

実験・結果(運用知見)

関連研究との関係(メモ)

Q&A

(自分がAIに実際に質問したことだけを Q/A 形式で残す。まだなし。)

自分のコメント

(ここは自分で都度書く欄。例:vGPU をセッションに通す方式は、自分が考える「実行中だけ GPU を割り当てる」設計(NotebookOS 的)とどう両立するか、Pod 常駐と GPU 共有の関係を確認したい。)