Posts for: #NVIDIA

GPU周りがおかしくなったときのメモ(ubuntu)

GPU周りがおかしくなったときのメモ(ubuntu)

いまだにちょくちょくGPU周りの設定がおかしくなることがあるのでメモ。たまに問題が起きる毎にメモが追加されます。

①nvidia-smiが遅い、ubuntuが起動しているのにGUIが何も表示されない

現象

  • 何も画面に映らなくなる現象です。sshとかはいけます。
  • nvidia-smiを実行すると普通は一瞬でGPUの状況が表示されますが、このケースでは1分以上かかったりします。

解決方法

cudaを入れ直して再起動したら直りました。原因はよくわかりません。
aptでcudaを入れている場合は次のような感じです。

NVIDIAのGPUのdriverの更新

NVIDIAのGPUのdriver更新手順

色々手順はあると思いますが、1つのやり方のメモです。

  1. 古いドライバを削除しておく
    • 公式からCUDA Toolkitをダウンロードしてインストールした場合は次で削除できるはず。
      $ cd /usr/local/cuda-x/bin 
      $ sudo cuda-uninstaller
      $ sudo nvidia-uninstall
      
    • もしapt-getを使って古いドライバを入れていたら次のコマンドで消え去るはず。nvidia containerが入っている場合はそれも消えるので、嫌な人は注意。
      sudo apt-get remove --purge nvidia\* libnvidia-\*
      
  2. CUDA Toolkitのダウンロードとインストール(Installer Typeはrunfileが一番ラク)
    • CUDA 11.2ならここの手順に従うhttps://developer.nvidia.com/cuda-11.2.1-download-archive
    • 最新版のCUDAはここの手順に従うhttps://developer.nvidia.com/cuda-downloads
  3. nvidia-smiコマンドを実行して動けばOK