딥러닝을 공부하다 보면 텍스트, 음성, 시계열 데이터 쪽에서 자주 보이는 모델이 있습니다.바로 RNN, LSTM, GRU입니다.셋 다 순서가 있는 데이터를 처리한다는 점은 비슷하지만, 막상 처음 배우면 “RNN이 기본형이고, LSTM이랑 GRU는 정확히 뭐가 다른 거지?” 하는 부분에서 많이 헷갈립니다.가장 짧게 말하면 RNN은 기본 순환신경망이고, LSTM과 GRU는 RNN의 단점을 보완한 변형입니다. PyTorch 문서도 nn.RNN, nn.LSTM, nn.GRU를 나란히 “recurrent layers”로 소개하고 있고, C++ 문서에서는 RNN은 기본 recurrent layer, LSTM은 장기 의존성을 다루는 gated architecture, GRU는 더 단순한 gated recurrent ..