Mok Manager / Проблема с драйвером NVIDIA после установки CUDA - proUbuntu
2 голосов
/

При установке CUDA 10.1 (через сетевой дебет) в Ubuntu 18.10 меня попросили установить пароль для Mok.Когда я перезагрузил свой компьютер, меня встретил синий экран Mok Manager, где я предполагаю, что должен был использовать ранее установленный пароль.Однако вместо выбора Enroll MOK я случайно продолжил загрузку.

После загрузки nvcc --version вернул правильный вывод (10.1), но когда я попытался проверить свои драйверы, используя nvidia-smi, я получил:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Я подумал, что это было результатом пропуска регистрации MOK, поэтому я попытался перезагрузиться, но синий экран MOK не появился снова.Я попытался следовать некоторым инструкциям, чтобы вернуться к этому экрану, но я не смог этого сделать.Также, что интересно, теперь запуск nvcc--version возвращает

Command 'nvcc' not found, but can be installed with:

sudo apt install nvidia-cuda-toolkit

Это особенно странно, потому что исполняемый файл nvcc можно найти в / usr / local / cuda / bin.Я не уверен, как поступить отсюда.Я сузил его до следующих параметров:

  1. Отключить безопасную загрузку (очевидно, это может испортить драйверы nvidia).Я не знаю, поможет ли это или ухудшит ситуацию.Я также не уверен, как это сделать в моей системе.
  2. Каким-то образом вернитесь на синий экран MOK и выберите вариант регистрации MOK.Я пытался сделать это, но безуспешно.
  3. Удалите все, что связано с nvidia, с моего компьютера, переустановите драйверы nvidia, затем переустановите CUDA.Я не уверен, достаточно ли это хорошо или есть более глубокая проблема.
  4. Возможно, что правильная проблема / решение - это нечто совсем другое, и в этом случае любое из перечисленного может усугубить проблему..

Если это полезно, вот вывод ubuntu-drivers devices (исключая модалии):

vendor   : NVIDIA Corporation
model    : GM107M [GeForce GTX 960M]
driver   : nvidia-driver-418 - third-party free recommended
driver   : nvidia-driver-390 - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

В настоящее время я использую систему двойной загрузки с Windows 10 иUbuntu 18.10 (что может иметь значение для моей ситуации с MOK / GRUB).Согласно lspci -nnk | grep -i vga -A3 мой графический драйвер Intel в настоящее время используется.Вот результат lspci | grep -i nvidia:

01:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Моя конечная цель состояла в том, чтобы настроить CUDA и cuDNN для PyTorch.Я был бы очень признателен за любую помощь, как двигаться вперед.

Ответы [ 2 ]

3 голосов
/

Оказывается, решение было довольно простым.

"Исчезающий" nvcc:

Я добавил переменную пути, показанную ниже, к моему текущему экземпляру терминала, но я не добавил ее к ~ / .bashrc (это означает, что nvcc работал только в этом экземпляре терминала, следовательно, «исчезающий» более поздний выпуск). Там также может быть файл ~ / .profile, но кажется, что bashrc читается первым, если он присутствует, поэтому вам может потребоваться добавить его в другой файл в зависимости от доступных файлов. Это хороший ресурс, если вы не уверены: https://stackoverflow.com/questions/14637979/how-to-permanently-set-path-on-linux-unix

export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/NsightCompute-2019.1${PATH:+:${PATH}}

Проблемы с драйверами:

Я решил все проблемы с драйверами, отключив безопасную загрузку. В моем случае мне не нужно было удерживать клавишу во время загрузки, чтобы открыть настройки для этого. Вместо этого, когда я запускаюсь и прихожу на экран GRUB, чтобы выбрать свою ОС, я выбираю Системные настройки. Здесь доступна настройка безопасной загрузки. Просто отключите, примените и выйдите. Это может быть взломом, но nvidia-smi теперь работает правильно, и я убедился, что PyTorch подключен к CUDA и правильно использует GPU. Я уверен, что это также означает, что мне больше не нужно беспокоиться об этом экране регистрации MOK.

0 голосов
/

Я тоже пропустил экран MOK, и он не появился при следующей перезагрузке. Решение было запустить

sudo mokutil --import /var/lib/shim-signed/mok/MOK.der

из терминала. Вам будет предложено выбрать пароль, а затем при перезагрузке снова появится экран регистрации MOK. Выберите для регистрации, выберите ключ и повторно введите пароль.

Благодарим этот пост на форумах NVIDIA за помощь в поиске ключа.

...