딥러닝 아키텍처 : Neural Network(신경망)의 전체적인 구조나 구성 방식
-> 어떻게 레이어가 배열되는지, 뉴런들이 어떻게 연결되는지, 어떤 활성화 함수를 사용하는지 등을 결정
-> 설계도나 골격과 같은 개념
<딥러닝 아키텍처의 여러 유형>
1. 완전 연결 계층(FC : Fully Connected Layers) : 가장 기본 적인 형태의 아키텍처로, 각 뉴런이 이전 레이어의 모든 뉴련과 연결된다.
-> 주로 분류 문제나 회귀 문제에서 출력 레이어로 사용
-> Dense Layers라고도 부른다
-> 일반적으로 다른 신경망과 함께 사용
-> 기본적인 아키텍처임
2. 컨볼루션 신경망(CNN : Convolutional Neural Networks) : 이미지 처리에서 가장 많이 사용되는 아키텍처로, 컨볼루션 레이어, 풀링 레이어, 완전 연결 레이어 등을 포함할 수 있다.
-> 공간적 구조를 가진 데이터에서 패턴을 학습하는데 효과적
3. 순환 신경망(RNN : Recurrent Neural Networks) : 시퀀스 데이터(ex. 텍스트, 시계열 데이터) 처리에 적합하다.
-> 이전 스템의 출력(상태)을 현재 스텝의 입력으로 사용
-> LSTM(Long Short - Term Memory) 나 GRU(Gated Recurrent Units) 같은 변형 구조도 있다.
4. 트랜스포머(Transformer) : 주로 자연어 처리 작업에 사용되며, 병렬 처리와 어텐션 메커니즘에 의존한다.
-> BERT, GPT 등의 유명한 모델들이 예시이다.
5. 자동 인코더 (Autoencoders) : 입력 데이터를 압축적으로 표현하는 내부 표현으로 변환한 후 다시 복원하는 구조
-> 노이즈를 제거하거나 차원 감소에 사용될 수 있다.
6. Generative Adversarial Networks(GAN) : 두 개의 네트워크( 생성자와 판별자)가 경쟁하는 방식으로 동작
-> 주로 데이터를 생성하는데 사용
딥러닝 과정
데이터 수집 -> 데이터 전처리 -> 회귀인지 분류인지에 따라 데이터 특성에 따른 아키텍처 선택 후 -> 학습 [Traning set을 입력해서 순전파 -> 손실 함수 -> 역전파 -> 손실 함수에서 Optimizer 함수를 통한 최적화하는 Global Minimum 구하기 -> Global Minimum으로 만드는 가중치로 변경 ] -> Validation set을 통한 검증 -> 일반화될 때까지 충분한 재학습 후 -> Testing set을 통한 모델 최종 평가 후 성능 지표(AUC-ROC 그래프 등)를 통해 모델의 일반화 능력 확인
- 데이터 수집(Data Collection) : 모델을 학습시키기 위한 데이터를 수집하는 단계
-> 이미지, 텍스트, 음성 , 시계열 데이터 등의 다양한 형태 - 데이터 전처리(Data PreProcessing) : 원시 데이터를 모델이 학습할 수 있도록 정제하고 변환하는 단계
-> 모델을 사용할때 정해 놓은 Input Layer에 입력 값 타입에 맞게 변환해주는 작업
참고 자료 : https://velog.io/@jolabokaflod/%EC%95%84%ED%82%A4%ED%85%8D%EC%B2%98%EB%9E%80%EB%94%A5%EB%9F%AC%EB%8B%9D -> 아키텍처
'AI 정리' 카테고리의 다른 글
CNN 발전 과정(1) (0) | 2025.03.26 |
---|---|
CNN(Convolution Neural Network) (0) | 2025.03.25 |
Pytorch (0) | 2025.03.24 |
행렬(Matrix) (0) | 2025.03.24 |
Validation (0) | 2025.03.23 |