본문 바로가기

AI42

정확도, 정밀도, 재현율, F1 Score: 분류 모델 성능 지표의 이해 머신러닝 또는 딥러닝 모델을 개발할 때 가장 기본적으로 요구되는 요소는 해당 모델이 실제 문제를 얼마나 잘 해결하는가입니다. 하지만 "정확하다"는 것을 수치로 표현하려면 적절한 성능 측정 지표가 필요합니다. 단순한 정확도(Accuracy)만으로는 모델의 성능을 판단하기 어려운 경우가 많습니다. 특히 클래스 불균형이 심한 데이터셋에서는 정확도가 높은데도 불구하고 실제로는 쓸모없는 모델일 수 있습니다.예를 들어 암 환자 진단 모델을 만든다고 가정해봅시다. 전체 환자 중 99%가 건강한 경우, 모든 사람을 "건강함"이라고 예측해도 정확도는 99%입니다. 하지만 암 환자를 놓치는 심각한 문제를 내포하고 있죠. 이럴 때 정밀도(Precision), 재현율(Recall), F1 Score와 같은 지표들이 더 의미 .. 2025. 5. 6.
D-FINE: 객체 탐지의 새 지평을 여는 DETR 기반 알고리즘 D-FINE은 기존 Transformer 기반 객체 탐지 모델(DETR 계열)들이 겪던 경계 상자 회귀와 느린 수렴 문제를 해결하고자 개발된 최신 알고리즘입니다. 이 글에서는 D-FINE의 핵심 메커니즘인 FDR (Fine-grained Distribution Refinement)과 GO-LSD (Global Optimal Localization Self-Distillation)을 중심으로, 그 구조와 기술적 기여, 성능 비교, 그리고 YOLOv12와의 차별성을 자세히 분석합니다.1. D-FINE의 등장 배경과 문제의식DETR(Detection Transformer)은 객체 탐지에서 앵커와 NMS를 제거한 획기적인 모델로 각광받았으나, 실전 적용에는 몇 가지 약점이 있었습니다. 대표적으로:수렴 속도가 매.. 2025. 5. 6.
MLflow 사용법과 예제 - 딥러닝/머신러닝 실험 관리 및 MLOps 모니터링 가이드 MLflow를 활용한 딥러닝/머신러닝 실험 관리 및 모니터링MLflow란 무엇인가?MLflow는 오픈소스로 개발된 머신러닝 실험 관리 플랫폼으로, 머신러닝 및 딥러닝 모델의 학습, 평가, 배포에 이르는 전체 생명주기를 일관되게 관리할 수 있는 기능을 제공합니다. 복잡한 모델 개발 과정에서 다양한 실험이 반복되며 하이퍼파라미터, 데이터 버전, 소스코드, 모델 아키텍처 등이 지속적으로 바뀌는데, 이를 효과적으로 추적하지 않으면 실험 결과의 재현성이나 모델 성능 개선이 어려워집니다.MLflow는 이를 해결하기 위해 다음과 같은 네 가지 핵심 컴포넌트를 제공합니다:MLflow Tracking: 실험의 메타데이터(파라미터, 메트릭, 모델, 로그 등)를 저장하고 비교할 수 있는 기능MLflow Projects: 재.. 2025. 5. 5.
이미지 분류 모델 - 모델 저장, 추론, 하이퍼파라미터 튜닝까지 ResNet-18을 활용한 이미지 분류: 고도화된 학습 전략 및 추론 시스템 구현이 글에서는 이전 이미지 분류 (Image Classification) 모델 학습 '이미지 분류 모델 가이드: ResNet18 파인튜닝'의 후속 내용으로 이전 글의 내용을 먼저 보시길 바랍니다.1. 하이퍼파라미터 설정딥러닝 모델 성능은 학습에 사용되는 하이퍼파라미터에 큰 영향을 받습니다. 아래는 일반적으로 조정 가능한 주요 하이퍼파라미터입니다:Learning Rate: 학습 속도를 조절하는 계수. 일반적으로 1e-3 ~ 1e-5 범위 사용.Batch Size: 학습 시 한 번에 처리하는 이미지 개수. GPU 메모리에 따라 조정.Epoch: 전체 데이터를 학습하는 횟수.Optimizer: 파라미터를 업데이트하는 방식 (예: A.. 2025. 5. 4.
이미지 분류 모델 가이드: ResNet18 파인튜닝 이미지 분류: ResNet-18을 활용한 사자 vs 치타 분류이미지 분류는 입력 이미지에 대해 특정 클래스(레이블)를 예측하는 컴퓨터 비전의 기본 작업입니다. 이는 의료 영상, 자율 주행, 야생 동물 모니터링, 보안 등 다양한 분야에서 활용됩니다. 일반적인 분류 파이프라인은 이미지를 딥러닝 모델에 입력하고, 출력으로 각 클래스에 대한 확률을 예측합니다.ImageNet 데이터셋이란?ImageNet은 컴퓨터 비전 역사상 가장 영향력 있는 데이터셋 중 하나로, 20,000개 이상의 카테고리에 대해 1,400만 장이 넘는 라벨링된 이미지로 구성되어 있습니다. 특히 ILSVRC 대회에서는 1,000개 카테고리 하위셋이 널리 사용됩니다. 이 데이터로 학습된 모델은 강력한 시각 특징 표현을 학습하게 되며, 다양한 전.. 2025. 5. 3.
PyTorch Transforms v2로 구현하는 컴퓨터 비전 이미지 증강 딥러닝에서 이미지 증강이 중요한 이유컴퓨터 비전에서는 이미지 증강(Image Augmentation)이 딥러닝 모델의 일반화 성능을 향상시키는 데 매우 중요합니다. 라벨을 보존하면서 입력 이미지에 다양한 변형을 가함으로써, 학습 데이터의 다양성을 인위적으로 확장하고 과적합(overfitting)을 줄이며, 모델의 견고함(robustness)을 높일 수 있습니다.특히 계층적 특성을 학습하는 CNN(합성곱 신경망)이나 공간 정보를 이용하는 Vision Transformer(ViT) 모델에서는 입력의 다양성이 모델이 더 일반적인 특성을 학습하도록 유도합니다. 이는 정보 이론 관점에서 출력 예측에 유의미한 특성과의 상호정보(Mutual Information)를 증대시키고, 노이즈를 제거하는 효과와도 같습니다.주.. 2025. 5. 1.