ユーザーマニュアル

外部解析基盤との連携

NII 以外のサーバー上に解析基盤を構築して利⽤する⽅法

1. この作業をする⽬的

NII が⽤意した解析環境では希望する要件を満たせない場合は、ご⾃⾝で⽤意された、クラウド、またはオンプレミスのサーバー(以下サーバー)に、同様のJupyterHub環境を構築して、データ解析機能(GakuNin Federated Computing Services) で管理することが可能です。

独⾃のサーバーが必要となるケースとしては、以下のようなものが想定されます。

  1. GPUやその他のAIアプライアンスを使⽤して、マシンラーニング、ディープラーニングを⾏いたい
  2. もっと⾼性能なCPUや広⼤なメモリ空間を使いたい
  3. メンテナンス等、停⽌のタイミングを⾃⾝で決めたい
  4. ⼤学の単位認定等、他の機関で同時期に⼤量に発⽣する計算の影響を受けたくない

2.tljh-repo2docker の構築

サーバーにtljh-repo2dockerをインストールします。準備されたサーバーは、少なくとも、GakuNin RDM、および利⽤者の端末と接続できる状態にしておく必要があります。

  1. このマニュアルでは、mdx上に準備したUbuntu 20.04 LTS の環境を使⽤していますが、mdxについては解説しません。mdxの詳細については、mdxドキュメントをご覧ください。
  2. The Littlest JupyterHub側のインストール
    tljh-repo2dockerを含むThe Littlest JupyterHub環境を起動するには、以下のREADMEの⼿順を参考にインストール⼿順を実施してください。
    https://github.com/RCOSDP/CS-tljh-repo2docker/blob/master/README.md

    The Littlest JupyterHubのインストール⼿順も併せて参照してください。
    https://tljh.jupyter.org/en/latest/install/custom-server.html

    動作確認⽤の環境はhttps://github.com/RCOSDP/CS-tljh-repo2docker/blob/master/README.mdの記載に沿って構築されています。

3. GakuNin Federated Computing Services アドオンの構成

  1. サーバーの確認
    tljh-repo2docker 環境を構築したサーバーのURLを確認します。

    img5601_dnat_address.png

  2. サーバーの追加

    ①GakuNin RDM プロジェクトのナビゲーションバーの「アドオン」をクリックします。
    ②左ペインの「アドオンを構成」をクリックします。
    ③「BinderHubを追加」をクリックします。
    img5602_add_binder_host.png
    ④表⽰されたダイアログの「BinderHub URL」のフォームに、先ほど確認した URL を⼊⼒します。
    img5603_config_binder.png
    ⑤保存をクリックします。
    img5604_save_binder_config.png

  3. デフォルトBinderHub URLの設定
    「GakuNin Federated Computing Services (Jupyter)」の項に、先ほど⼊⼒した URL が追加されているはずです。 優先的に使う解析環境の URL の右側にあるチェックボックスにチェックを⼊れてください。そのさらに右にある「x」をクリックすると URL がリストから消えてしまいますので、ご注意ください。

    img5605_chg_default_binder.png

  4. BinderHub URLリストからの解除 ご⾃分で準備された解析基盤の仕様を中⽌される場合は、URLの右側のチェックボックスのさらに右にある「x」にチェックを⼊れてください。

4. 解析環境のビルド

  1. ホストの選択
    「私の解析環境」の中の「ホスト:」の右側にある URL の表⽰の右端にある印をクリックし、デ ータ解析環境を構築するサーバーのホストを選択します。

    img5606_show_env_list.png

  2. ビルドの準備
    NII が準備した解析基盤 (https://binder.cs.rcos.nii.ac.jp) を使⽤するときと、ほぼ同じ⽅法でビルドできます。
    その際、「新しい環境を作成: 」の右側にある URL が変更されていることをご確認ください。
    パッケージ選択の詳細は、データ解析の始め⽅をご覧ください。

    img5609_launch_new_env.png

  3. ビルド中の様⼦ ユーザーマニュアルの中のデータ解析の始め⽅に従い、「新しい環境を作成」ボタンをクリックすると、別の新しいタブが表⽰され、その中でビルドを開始します。

    img5610_build_new_env.png

  4. データ解析環境の利⽤「すべての解析環境を表⽰」をクリックすると、新しいタブでJupyterHubのページが表⽰されるので「Start My Server」をクリックします。

    img5607_start_binder_server.png

    新しい環境をラジオボタンで選択し「Start」をクリックします。

    img5612_start_jupyter_server.png

    The Littlest JupyterHubの How-To ガイドも併せて参照してください。

    https://tljh.jupyter.org/en/latest/howto/index.html