ユーザーマニュアル

データ解析の進め方

1. 解析環境の利⽤

作成した解析環境は「私の解析環境」の⼀覧に表⽰されます。それぞれの解析環境にある3つの統合開発環境 (IDE) の中から、利⽤したい IDE のアイコンをクリックして起動します。

アイコン 名称 特徴
jupyter-notebook_icon.png Jupyter Notebook シンプルなノートブック形式の開発環境です。
jupyterlab_icon.png JupyterLab Jupyter Notebook の後継となる高機能な統合開発環境です。
rstudio_icon.png RStudio R 言語に特化した定番の統合開発環境です。

JupyterHub で管理運⽤される解析環境は各々独⽴したファイルシステムを持つコンテナとしてビルドされます。したがって、同じ解析環境の中ならば、どの IDE を使っても同じファイルを読み書きできます。⼀⽅、異なる解析環境のファイルを読み書きすることはできません。解析環境をまたいでファイルをやりとりするには、後述する共有フォルダを利⽤します。
解析環境を削除すると、ファイルも全部消えてしまいます。解析環境にあるファイルを保存するには、後述する GakuNin RDM への同期機能を利⽤します。

2. ⻑期間停⽌したままの解析環境の扱いについて

30⽇以上使⽤されなかった解析環境は、NIIの管理者が削除いたします。

3. 解析環境作成後のパッケージの追加について

解析環境を作成する際に指定したパッケージは、あくまでビルド時にインストールされるものです。ビルド後にパッケージのリストを変更しても、それまでに作成された解析環境には反映されません。

作成済みの解析環境にパッケージを追加するには、その解析環境のIDEまたはターミナルを利⽤してパッケージ管理コマンドを実⾏します。例えば、Jupyter Notebookでcondaパッケージをインストールする際は、以下のコードセルを実⾏します。

!conda install -y パッケージ名

4. 便利な機能

NII のデータ解析基盤で、独⾃に利便性や安全性を考慮して改変したものを以下に記載します。

  1. 共有フォルダ
    /mnt/user フォルダは、⾃分が作成したすべての解析環境から読み書きできる10GBのストレージです。解析環境の容量が少し⾜りないときや複数の解析環境間でファイルを交換するのに利⽤できます。なお、このフォルダーで他のユーザーとファイルの受け渡しはできません。
    また、アドオンで追加したストレージは /mnt/rdm/ 以下にマウントされています。例えばGoogle Drive を追加した場合、/mnt/rdm/googledrive にマウントされます。ここに置いたファイルは他ユーザーとのデータの交換に使⽤できますが、プロジェクトメンバー全員から⾒える仕組みになっているため、データの機密性に留意してファイルを置いてください。
  2. GakuNin RDM への同期
    ホ ーム直下の result フォルダは GakuNin RDM にアップロードできます。解析結果などの重要なファイルや他のユーザーと共有したいファイルは GakuNin RDM に保存しましょう。
    1. ホームディレクトリに result という名前のフォルダを作成します。
    2. アップロードしたいファイルを result フォルダに置きます。
    3. GakuNin RDM への同期を⾏います。IDE ごとに操作⽅法が異なります。
      • Jupyter Notebook では、画⾯上部にある「Sync to RDM」ボタンをクリックします。 img5401_Sync2GRDM_ipynb.png
      • JupyterLab では、左ペインの上部にある GakuNin RDM アイコンをクリックします。 img5402_Sync2GRDM_lab.png
      • -RStudio では、ツールバーの「Addins」プルダウンメニューの「Sync to RDM」を選択します。 img5403_Sync2GRDM_Rstudio.png
    4. result フォルダとその中身が GakuNin RDM にアップロードされます。
    5. アップロードされたフォルダは「result-ユーザー名-⽇付-環境名」という名前になります。
    6. 次回ビルド時には「result-ユーザー名-⽇付-環境名」フォルダが新しい解析環境に取り込まれます。
      新しいフォルダが作成されても古いものは削除されないので、不要になったファイルはどこかに移動するか削除してください。
  3. ターミナル Jupyter Notebook、JupyterLab、RStudioの標準機能であるターミナルはここでも使えますが、NII の解析基盤では安全のため、管理者(root)権限を持つことができません。起動⽅法は標準のものと同じです。
    • Jupyter Notebook では、右上⽅の「New」をクリックしてプルダウンメニューを表⽰し、「Terminal」を選択します。
    • JupyterLab では、Launcher の Other のグループにある「Terminal」のアイコンをクリックするとターミナルが開きます。
    • RStudio では、左ペインの「Terminal」タブをクリックします。