AI 정리

딥러닝 아키텍처(Architecture)

dawon-project 2025. 3. 24. 23:54

딥러닝 아키텍처 : Neural Network(신경망)의 전체적인 구조나 구성 방식

-> 어떻게 레이어가 배열되는지, 뉴런들이 어떻게 연결되는지, 어떤 활성화 함수를 사용하는지 등을 결정

-> 설계도나 골격과 같은 개념

<딥러닝 아키텍처의 여러 유형>

1. 완전 연결 계층(FC : Fully Connected Layers) : 가장 기본 적인 형태의 아키텍처로, 각 뉴런이 이전 레이어의 모든 뉴련과 연결된다.
-> 주로 분류 문제나 회귀 문제에서 출력 레이어로 사용
-> Dense Layers라고도 부른다
-> 일반적으로 다른 신경망과 함께 사용
-> 기본적인 아키텍처임

2. 컨볼루션 신경망(CNN : Convolutional Neural Networks) : 이미지 처리에서 가장 많이 사용되는 아키텍처로, 컨볼루션 레이어, 풀링 레이어, 완전 연결 레이어 등을 포함할 수 있다.
-> 공간적 구조를 가진 데이터에서 패턴을 학습하는데 효과적

 

3. 순환 신경망(RNN : Recurrent Neural Networks) : 시퀀스 데이터(ex. 텍스트, 시계열 데이터) 처리에 적합하다.
-> 이전 스템의 출력(상태)을 현재 스텝의 입력으로 사용
-> LSTM(Long Short - Term Memory) 나 GRU(Gated Recurrent Units) 같은 변형 구조도 있다.

4. 트랜스포머(Transformer) : 주로 자연어 처리 작업에 사용되며, 병렬 처리와 어텐션 메커니즘에 의존한다.
-> BERT, GPT 등의 유명한 모델들이 예시이다.

5. 자동 인코더 (Autoencoders) : 입력 데이터를 압축적으로 표현하는 내부 표현으로 변환한 후 다시 복원하는 구조
-> 노이즈를 제거하거나 차원 감소에 사용될 수 있다.

6. Generative Adversarial Networks(GAN) : 두 개의 네트워크( 생성자와 판별자)가 경쟁하는 방식으로 동작
-> 주로 데이터를 생성하는데 사용

 

 

딥러닝 과정

데이터 수집 -> 데이터 전처리 -> 회귀인지 분류인지에 따라 데이터 특성에 따른 아키텍처 선택 후 -> 학습 [Traning set을 입력해서 순전파 ->  손실 함수 -> 역전파 -> 손실 함수에서 Optimizer 함수를 통한  최적화하는 Global Minimum 구하기 -> Global Minimum으로 만드는 가중치로 변경 ] -> Validation set을 통한 검증 -> 일반화될 때까지 충분한 재학습 후 -> Testing set을 통한 모델 최종 평가 후 성능 지표(AUC-ROC 그래프 등)를 통해 모델의 일반화 능력 확인

 

  • 데이터 수집(Data Collection) : 모델을 학습시키기 위한 데이터를 수집하는 단계
    -> 이미지, 텍스트, 음성 , 시계열 데이터 등의 다양한 형태
  • 데이터 전처리(Data PreProcessing) : 원시 데이터를 모델이 학습할 수 있도록 정제하고 변환하는 단계
    -> 모델을 사용할때 정해 놓은 Input Layer에 입력 값 타입에 맞게 변환해주는 작업 

 

참고 자료 : https://velog.io/@jolabokaflod/%EC%95%84%ED%82%A4%ED%85%8D%EC%B2%98%EB%9E%80%EB%94%A5%EB%9F%AC%EB%8B%9D -> 아키텍처

https://developer-ping9.tistory.com/121 -> GAN

'AI 정리' 카테고리의 다른 글

CNN 발전 과정(1)  (0) 2025.03.26
CNN(Convolution Neural Network)  (0) 2025.03.25
Pytorch  (0) 2025.03.24
행렬(Matrix)  (0) 2025.03.24
Validation  (0) 2025.03.23