[파이토치로 시작하는 딥러닝] Part-4 RNN

2023. 7. 2. 15:04·ML_DL/딥러닝 공부하기
목차
  1. RNN (Recurrent Neural Network)
  2. Seq2Seq
  3. Padding & Packing
728x90
반응형

RNN (Recurrent Neural Network)

  • 입력하는 데이터의 순서에 영향을 받는다.
  • 음성, 텍스트 등 데이터의 크기가 가변적이다.
  • data shape = ( batch size, sequence length, input data dimension)
  • hidden state : 같은 값이 둘로 나뉘기 때문에 hidden size와 output size는 같다.
  • pytorch에서는 batch size와 sequence length를 자동으로 파악할 수 있다.

Seq2Seq

  • encoder : 입력된 seqeunce를 vector로 변환한다.
  • decoder : vector를 hidden state로 하여 output을 생성한다.
  • SOS_token : decoder의 시작 / EOS_token : 각 sequence의 끝
class Encoder(nn.Module):
    def __init__(self, input_size, hidden_size):
        super(Encoder, self).__init__()
        self.hidden_size = hidden_size
        self.embedding = nn.Embedding(input_size, hidden_size) 
        self.gru = nn.GRU(hidden_size, hidden_size)

    def forward(self, x, hidden):
        x = self.embedding(x).view(1,1,-1)
        x, hidden = self.gru(x, hidden)
        return x, hidden
class Decoder(nn.Module):
    def __init__(self, input_size, hidden_size):
        super(Decoder, self).__init__()
        self.hidden_size = hidden_size
        self.embedding = nn.Embedding(input_size, hidden_size) 
        self.gru = nn.GRU(hidden_size, hidden_size)
        self.out = nn.Linear(hidden_size, output_size)
        self.softmax = nn.LogSoftmax(dim=1)

    def forward(self, x, hidden):
        x = self.embedding(x).view(1,1,-1)
        x, hidden = self.gru(x, hidden)
        x = self.softmax(self.out(x[0]))
        return x, hidden

Padding & Packing

  • sequence의 길이가 일정하지 않은 경우가 대부분이다.
  • padding : 가장 긴 sequence를 기준으로 다른 sequence의 비어있는 부분을 token으로 채운다.
  • packing : 각 sequence의 길이를 데이터에 포함한다. (단, 길이가 긴 순으로 정렬해야 한다.)
저작자표시

'ML_DL > 딥러닝 공부하기' 카테고리의 다른 글

[자연어처리] Word Embedding  (1) 2023.10.14
이미지 불러오기  (0) 2023.08.09
[파이토치로 시작하는 딥러닝] Part-3 CNN  (0) 2023.07.02
[파이토치로 시작하는 딥러닝] Part-2 DNN  (0) 2023.07.02
[파이토치로 시작하는 딥러닝] Part-1 Basic ML  (0) 2023.06.24
  1. RNN (Recurrent Neural Network)
  2. Seq2Seq
  3. Padding & Packing
'ML_DL/딥러닝 공부하기' 카테고리의 다른 글
  • [자연어처리] Word Embedding
  • 이미지 불러오기
  • [파이토치로 시작하는 딥러닝] Part-3 CNN
  • [파이토치로 시작하는 딥러닝] Part-2 DNN
swwho
swwho
일상을 데이터화하다
  • swwho
    하루한장
    swwho
  • 전체
    오늘
    어제
    • 분류 전체보기 (188) N
      • ML_DL (39) N
        • MUJAKJUNG (무작정 시리즈) (18) N
        • 딥러닝 공부하기 (21)
      • 데이터사이언스 (1)
        • EDA (1)
        • 데이터과학을 위한 통계 (0)
      • 데이터엔지니어링 (2)
      • 논문리뷰 (2)
        • Computer Vision (2)
      • Python 활용하기 (12)
      • 코딩테스트 (127)
        • Python (109)
        • MySQL (14)
      • Git (3)
      • MySQL 활용하기 (0)
      • 일상 이야기 (1)
  • 블로그 메뉴

    • 홈
    • 태그
  • 최근 글

  • 250x250
  • hELLO· Designed By정상우.v4.10.3
swwho
[파이토치로 시작하는 딥러닝] Part-4 RNN
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.