NII 以外のサーバー上に解析基盤を構築して利⽤する⽅法
1. この作業をする⽬的
NII が⽤意した解析環境では希望する要件を満たせない場合は、ご⾃⾝で⽤意されたクラウド、
またはオンプレミスのサーバー(以下サーバー)に、同様のJupyterHub環境を構築し、
GakuNin RDM データ解析機能(GakuNin Federated Computing Services) で管理することが可能です。
独⾃のサーバーが必要となるケースとしては、以下のようなものが想定されます。
- GPUやその他のAIアプライアンスを使⽤して、マシンラーニング、ディープラーニングを⾏いたい
- もっと⾼性能なCPUや広⼤なメモリ空間を使いたい
- メンテナンス等、停⽌のタイミングを⾃⾝で決めたい
- 単位や学位の認定等、他の機関でも同時期に⼤量に発⽣しうる計算の影響を受けたくない
2. 簡易的な解析基盤の構築
独自の解析基盤の構築には様々な方法がありますが、今回はもっともシンプルな tljh-repo2docker を例に解説します。
- サーバーの準備
-
Ubuntu 22.04 のサーバーを用意します。
準備されたサーバーは少なくとも、GakuNin RDM、および利⽤者の端末と
接続できる状態にしておく必要があります。 - The Littlest JupyterHub側のインストール
-
GakuNin RDM データ解析機能で使用する The Littlest JupyterHub環境を起動するには、
以下のREADMEの⼿順を参考にインストール⼿順を実施してください。
https://github.com/RCOSDP/CS-tljh-repo2docker/blob/master/README.md
本家の The Littlest JupyterHub のインストール⼿順も併せて参照してください。
https://tljh.jupyter.org/en/latest/install/custom-server.html
3. GakuNin Federated Computing Services アドオンの構成
-
サーバーの確認
tljh-repo2docker 環境を構築したサーバーのURLを確認します。IPアドレスでも動作します。 -
サーバーの追加
①GakuNin RDM プロジェクトのナビゲーションバーの「アドオン」をクリックします。
②左ペインの「アドオンを構成」をクリックします。
③「BinderHubを追加」をクリックします。
④表⽰されたダイアログの「BinderHub URL」のフォームに、先ほど確認した URL を⼊⼒します。
⑤保存をクリックします。
-
デフォルトBinderHub URLの設定
「GakuNin Federated Computing Services (Jupyter)」の項に、先ほど⼊⼒した URL が追加されているはずです。
優先的に使う解析環境の URL の右側にあるチェックボックスにチェックを⼊れてください。
そのさらに右にある「x」をクリックすると URL がリストから消えてしまいますので、ご注意ください。 -
BinderHub URLリストからの解除
ご⾃分で準備された解析基盤の仕様を中⽌される場合は、
URLの右側のチェックボックスのさらに右にある「x」にチェックを⼊れてください。
4. 解析環境のビルド
- ホストの変更
現在使用している JupyterHub の URL の右側にある 「変更」の文字をクリックします。
- ホストの選択
表示されたダイアログの中からデータ解析環境を構築するサーバーのホストを選択します。
- ビルドの準備
NII が準備した解析基盤 (https://binder.cs.rcos.nii.ac.jp) を使⽤するときと、ほぼ同じ⽅法でビルドできます。
パッケージ選択の詳細は、データ解析の始め⽅をご覧ください。 - ビルド中の様⼦
ユーザーマニュアルの中のデータ解析の始め⽅に従い、「新しい環境を作成」ボタンをクリックすると、
別の新しいタブが表⽰され、その中でビルドを開始します。 - データ解析環境の利⽤
すべての解析環境を表⽰」をクリックすると、新しいタブでJupyterHubのページが表⽰されるので
「Start My Server」をクリックします。新しい環境をラジオボタンで選択し「Start」をクリックします。
The Littlest JupyterHubの How-To ガイドも併せて参照してください。
https://tljh.jupyter.org/en/latest/howto/index.html