포스트

NVIDIA driver 삭제하고 재설치 하기

1.이슈

집에서 ubuntu 에 nvidia, cuda를 설치해서 사용하고 있는데 reboot 할때마다 드라이버를 못 잡는다.

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

매번 삭제하고 다시 깔아줘야 한다.

2.해결

2.1.사용중인 NVIDIA 삭제

1
2
## nvidia 모듈 확인
lsmod | grep nvidia
1
2
3
4
5
# 사용중이라면 kill 하고 다시 rmmod 실행
sudo lsof /dev/nvidia*

# 여기에 나온 PID 확인해서 
kill -9 pid
1
2
3
4
5
## 정상적으로 종료되었다면 아래 명령어 쳤을 때 아무것도 안떠야 함
sudo rmmod nvidia_drm 
sudo rmmod nvidia_modeset 
sudo rmmod nvidia_uvm 
sudo rmmod nvidia
1
2
3
4
# nvidia 관련 전부 삭제
sudo apt --purge remove *nvidia*
sudo apt autoremove
sudo apt autoclean

2.2.NVIDIA 설치

1
2
## 특정버전 run 파일 설치 할 때
sh NVIDIA-Linux-x86_64-460.91.03.run

2.3.apt로도 설치할 수 있다

1
2
## 검색방법 1
ubuntu-drivers devices
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
== /sys/devices/pci0000:00/0000:00:03.1/0000:07:00.0 ==
modalias : pci:v000010DEd00001E84sv00001458sd00004008bc03sc00i00
vendor   : NVIDIA Corporation
model    : TU104 [GeForce RTX 2070 SUPER]
driver   : nvidia-driver-510 - distro non-free
driver   : nvidia-driver-515 - distro non-free
driver   : nvidia-driver-470 - distro non-free
driver   : nvidia-driver-470-server - distro non-free
driver   : nvidia-driver-525 - distro non-free
driver   : nvidia-driver-525-open - distro non-free recommended
driver   : nvidia-driver-450-server - distro non-free
driver   : nvidia-driver-515-server - distro non-free
driver   : nvidia-driver-515-open - distro non-free
driver   : nvidia-driver-525-server - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin
1
2
## 검색방법 2
nvidia-detector
1
nvidia-driver-525
1
2
## 마음에 드는 버전으로 설치
sudo apt install nvidia-driver-525

참고

  1. https://velog.io/@jeongm/Ubuntu-18.04-nvidia-%EC%82%AD%EC%A0%9C-%EB%B0%8F-%EC%9E%AC%EC%84%A4%EC%B9%98
  2. https://velog.io/@terry_9996/nvidia-smi-%EC%8B%9C-%EC%97%90%EB%9F%AC%EA%B0%80-%EB%82%98%EC%98%AC%EB%95%8C
이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.