Ubuntu

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running. 오류 해결하기

devJua 2023. 8. 22. 15:40

Ubuntu 20.04 환경에서 딥러닝을 돌리다가

다운되는 현상이 발생하였다.

 

이렇게 딥러닝 도중 다운이 되면

가끔

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

이러한 오류 메시지가 출력되면서

잘 되던 nvidia-smi 명령어가

먹지 않는 경우가 발생한다.

 

해결하는 방법은 간단하다.

 

nvidia driver만 지우고 다시깔면 된다.

다행스럽게도 cuda와 cudnn 등은 다시 설치할 필요가 없다!

 

 

 

해결하는 방법

 

1. 설치된 드라이버를 확인한다.

$ apt --installed list | grep nvidia-driver

 

2. 설치된 드라이버를 깔끔하게 삭제해준다.

$ sudo apt remove nvidia-driver-<설치된 버전>
$ sudo apt autoremove

 

3. 삭제 후 재설치 해준다. (필자는 아래 방법 사용)

https://devjua.tistory.com/5

 

Ubuntu 20.04 nvidia 그래픽 드라이버 설치하기(1주일 삽질 후 성공 후기) - ASUS ROG G18 RTX4070

해결방법만 궁금하신 분은 아래 으로 바로 가시면 됩니다! 최종적으로 해결한 자료 https://www.youtube.com/watch?v=VP-R7LNSJXA 해당 영상은 3가지 방법으로 나누어 설치 방법을 제안하고 있습니다. 저는 2

devjua.tistory.com

 

4. 재설치 후 리부팅한다.

 

5. nvidia-smi 명령어가 잘 실행되는 것을 확인하면 끝!