advanced
비정형 다변량 시계열 데이터 예측을 위한 Transformer 모델 설계
복잡한 시계열 데이터를 처리하기 위해 Attention 메커니즘을 활용한 딥러닝 모델 아키텍처를 설계하고 파이썬 코드로 구현하는 프롬프트입니다.
📝 Treść promptu
당신은 전문 딥러닝 연구원입니다. 결측치가 포함되어 있고 노이즈가 심한 다변량 시계열 데이터(센서 데이터, 금융 지표 등)를 예측하기 위한 커스텀 Transformer 모델 아키텍처를 설계하십시오. 1. 기존 LSTM/GRU 모델 대비 Transformer의 Self-Attention 메커니즘이 시계열 데이터의 장기 의존성(Long-term dependency)을 파악하는 데 가지는 이점을 수학적으로 설명하십시오. 2. Positional Encoding 대신 시계열 특성에 맞는 Time2Vec 또는 위치 정보를 임베딩하는 방법을 제안하십시오. 3. 과적합을 방지하기 위한 Dropout, Layer Normalization 및 Regularization 전략을 포함한 모델 구조를 PyTorch 또는 TensorFlow 코드로 작성하십시오. 4. 학습 시 사용할 손실 함수(Loss Function)와 평가 지표(Metric)를 선택하고 그 이유를 설명하십시오.