본문 바로가기

AI2

PyTorch 예제로 배우는 머신러닝 거리 함수 완벽 가이드 머신러닝에서 거리 함수(Distance Metric)는 데이터 간의 유사도 또는 차이를 수치적으로 표현하는 중요한 도구입니다. 이러한 거리 함수는 군집화 알고리즘(K-Means), 최근접 이웃 분류(KNN), 추천 시스템, 이상치 탐지 등 다양한 AI 분야에서 핵심적으로 활용됩니다. 본 글에서는 머신러닝과 데이터 과학 분야에서 가장 많이 사용되는 주요 거리 함수 9가지(코사인, 유클리드, 마할라노비스, 헬링거, 자카드, 맨해튼, 상관계수, 다이스, 해밍 거리)에 대해 개념 설명과 PyTorch를 활용한 실습 예제를 통해 체계적으로 학습해 보겠습니다.1. 코사인 거리 (Cosine Distance)코사인 거리는 두 벡터 사이의 방향(각도)에 기반하여 유사도를 측정하는 방식으로, 벡터의 크기보다는 방향성이 .. 2025. 6. 15.
RoFormer와 Rotary Position Embedding: Transformer 위치 인코딩의 혁신 Rotary Position Embedding(RoPE)은 2021년 발표된 RoFormer 논문(https://arxiv.org/pdf/2104.09864)에서 제안된 위치 인코딩 기법입니다. 이 기술은 기존의 절대적 위치 인코딩 방식의 한계를 극복하고, Transformer 모델의 시퀀스 인식 능력을 한층 강화합니다.** You can find the English version of this content at this page (https://markbyun.blogspot.com/2025/05/roformer-and-rotary-position-embedding.html)1. 기존 위치 인코딩 방식의 한계Transformer는 입력 토큰 간 순서를 인식하지 못하기 때문에, 위치 인코딩(Posit.. 2025. 5. 27.