Long Short-Term Memory

hidden state, cell state 존재
- cell state에 long-term information을 저장()
- cell에 read, erase, write가 가능
gates을 통해서 해당 메모리를 관리함
- open, close를 통해서 관리
- 상태가 dynamic 함→ 현재 context에 따라 다른 결과가 나옴

그럼 다른 방법은 없나?

Residual Connections (Skip Connections) Dense Connection Highway connection

Attention도 같은 문제를 해결하기 위한 거였음 transformer전에는 이런식으로 해결했었따

task 잘했음
- handwriting recognition, speech recognition, machine translation, parsing, and image captioning

sentiment classification task

기존 RNN

Bidirectional RNN

전체 Sequence가 통째로 input으로 들어갈 때 사용가능 다만 Generation task는 쓸 수 없음

Multi-layer RNNs (stacked RNNs)

더욱 복잡한 표현이 가능하도록 함 (higher-level features)
- CV의 경우 아래 layer에서는 low한 task(엣지 찾기), 위에는 눈 찾기 같은 layer 설계
- NLP의 경우 형태소 분석 → 문장 → 문맥 처럼 다양한 layer로 처리가능
너무 층이 높아지면, 문제가 생김
- 더 깊은 RNN (예: 8층)을 학습시키려면 skip-connection 같은 구조가 필요
- 너무 많은 레이어를 쌓으면 학습이 어려워짐 (그래디언트가 흐르지 않음)
- 이를 해결하기 위해 ResNet처럼 층을 건너뛰는 연결을 넣어줌

Document

탐색기