본문 바로가기

PyTorch4

이미지 분류 모델 가이드: ResNet18 파인튜닝 이미지 분류: ResNet-18을 활용한 사자 vs 치타 분류이미지 분류는 입력 이미지에 대해 특정 클래스(레이블)를 예측하는 컴퓨터 비전의 기본 작업입니다. 이는 의료 영상, 자율 주행, 야생 동물 모니터링, 보안 등 다양한 분야에서 활용됩니다. 일반적인 분류 파이프라인은 이미지를 딥러닝 모델에 입력하고, 출력으로 각 클래스에 대한 확률을 예측합니다.ImageNet 데이터셋이란?ImageNet은 컴퓨터 비전 역사상 가장 영향력 있는 데이터셋 중 하나로, 20,000개 이상의 카테고리에 대해 1,400만 장이 넘는 라벨링된 이미지로 구성되어 있습니다. 특히 ILSVRC 대회에서는 1,000개 카테고리 하위셋이 널리 사용됩니다. 이 데이터로 학습된 모델은 강력한 시각 특징 표현을 학습하게 되며, 다양한 전.. 2025. 5. 3.
PyTorch Transforms v2로 구현하는 컴퓨터 비전 이미지 증강 딥러닝에서 이미지 증강이 중요한 이유컴퓨터 비전에서는 이미지 증강(Image Augmentation)이 딥러닝 모델의 일반화 성능을 향상시키는 데 매우 중요합니다. 라벨을 보존하면서 입력 이미지에 다양한 변형을 가함으로써, 학습 데이터의 다양성을 인위적으로 확장하고 과적합(overfitting)을 줄이며, 모델의 견고함(robustness)을 높일 수 있습니다.특히 계층적 특성을 학습하는 CNN(합성곱 신경망)이나 공간 정보를 이용하는 Vision Transformer(ViT) 모델에서는 입력의 다양성이 모델이 더 일반적인 특성을 학습하도록 유도합니다. 이는 정보 이론 관점에서 출력 예측에 유의미한 특성과의 상호정보(Mutual Information)를 증대시키고, 노이즈를 제거하는 효과와도 같습니다.주.. 2025. 5. 1.
코사인 유사도와 코사인 거리 개념 및 딥러닝에서의 활용 | PyTorch 예제 포함 1. 코사인 유사도(Cosine Similarity)란?코사인 유사도는 두 벡터 간의 방향 유사도를 측정하는 지표로, 주로 텍스트 유사도 분석, 문장 임베딩 비교, 이미지 임베딩 비교 등에서 활용됩니다. 벡터의 크기보다는 방향성에 초점을 맞추는 것이 특징입니다.공식:cos_sim(A, B) = (A · B) / (||A|| * ||B||) A와 B는 각각의 벡터이며, ·는 내적(dot product), ||A||는 A의 놈(norm, 길이)입니다. 값의 범위는 -1 ~ 1입니다. 1에 가까울수록 방향이 유사하고 반대로 -1에 가까울 수록 두 벡터의 방향이 서로 다름을 의미합니다.2. 코사인 거리(Cosine Distance)란?코사인 거리란 코사인 유사도를 거리 개념으로 변환한 것으로, 다음과 같이.. 2025. 4. 30.
기울기 소실 문제 기울기 소실(Vanishing Gradient)은 깊은 신경망, 특히 매우 깊은 구조를 가진 신경망을 학습할 때 흔히 발생하는 문제입니다. 이로 인해 모델이 학습 과정에서 데이터로부터 제대로 학습하는 것이 어려워집니다. 기울기 소실 문제란?딥러닝에서는 역전파(backpropagation) 라는 방법을 통해 학습이 이루어집니다. 이 과정에서 모델은 손실 함수(loss function) 를 각 가중치에 대해 미분한 기울기(일종의 변화율) 를 이용해 가중치를 조정합니다. 이 기울기는 각 가중치를 얼마나 변경해야 성능이 향상될지를 모델에게 알려줍니다. 하지만 딥 뉴럴 네트워크에서는, 역전파가 진행될수록 기울기가 점점 작아질 수 있습니다. 이러한 현상을 기울기 소실(vanishing gradient) 이라고 부릅.. 2025. 4. 20.