ML

[Error] CUDA error: invalid device ordinal 해결방법

young_3060 2024. 1. 18. 14:04
728x90

 

BERT 돌리다가 이런 런타임 에러를 마주했다.

이건, 내 시스템의 GPU에 내가 호출한 GPU가 없어서 나타나는 에러인데,

시스템에 있는 디바이스들을 잘 확인해보고 호출해주어야 한다.

만약, 그런거 잘 모르겠지만 일단 확실하게 한개는 있다고 자신한다면 그냥 "cuda:0"을 사용해주면된다.

 

시스템에 있는 디바이스를 출력해보는 코드는 아래와 같다.

from tensorflow.python.client import device_lib

device_lib.list_local_devices()

 

이외에도 간단하게 있는지 여부와 몇개인지 출력하고싶으면 아래의 코드를 실행하면 된다.

print(torch.cuda.is_available()) #GPU작동 가능여부 확인
print(torch.cuda.device_count()) #몇개인지

 

 

확인해보니 나는 가능한 디바이스가 한개인데 cuda:1을 호출해서 문제가 났었다.

cuda:0으로 바꿔주니 해결 완료!

728x90