딥러닝19 Z-Test와 P-Value 완전 정복: ML/DL 활용법까지 Z-test와 P-value의 개념, 계산 방법, 머신러닝과 딥러닝에의 응용 사례 및 파이썬 코드 예제를 자세히 설명합니다.Z-Test란?z-test는 모집단 평균과 표본 평균 간의 유의미한 차이가 있는지를 검정하는 통계적 가설 검정 방법입니다. 모집단의 분산이 알려져 있고 표본 크기가 충분히 클 경우(n > 30)에 적합합니다.귀무가설 (Null Hypothesis, $H_0$)은 일반적으로 "차이가 없다", "영향이 없다"는 전제를 의미하며, 검정의 출발점이 됩니다. 대립가설 (Alternative Hypothesis, $H_1$)은 반대로 차이가 있다는 주장입니다. 통계적 검정은 수집된 데이터로부터 귀무가설을 기각할 수 있을 만큼의 증거가 있는지를 확인하는 과정입니다.공식:$ z = \frac{\b.. 2025. 6. 16. RoFormer와 Rotary Position Embedding: Transformer 위치 인코딩의 혁신 Rotary Position Embedding(RoPE)은 2021년 발표된 RoFormer 논문(https://arxiv.org/pdf/2104.09864)에서 제안된 위치 인코딩 기법입니다. 이 기술은 기존의 절대적 위치 인코딩 방식의 한계를 극복하고, Transformer 모델의 시퀀스 인식 능력을 한층 강화합니다.** You can find the English version of this content at this page (https://markbyun.blogspot.com/2025/05/roformer-and-rotary-position-embedding.html)1. 기존 위치 인코딩 방식의 한계Transformer는 입력 토큰 간 순서를 인식하지 못하기 때문에, 위치 인코딩(Posit.. 2025. 5. 27. SmolVLM: 허깅페이스의 작고 효율적인 멀티모달 모델 SmolVLM은 HuggingFace와 Stanford가 주도한 최신 연구로, 수억 개의 파라미터 수준에서도 대형 모델에 필적하는 성능을 발휘하는 초경량 멀티모달 모델 시리즈입니다. Qwen25-VL 모델의 경우 성능은 뛰어나나 기본적으로 약 15G의 VRAM을 요구하고 GPU에서의 사용을 전제로 하고 있습니다. 물론 Intel의 OpenVINO를 이용하여 Int4로 경량화된 모델을 사용하여 Intel CPU에서 실행을 시킬 수 있으나 이 경우 대략 20초가 넘는 응답 시간을 보여주고 있어 CPU혹은 휴대폰과 같은 에지디바이스에서 동작하는 빠른 경량 모델이 요구되고 있습니다. 반면 SmolVLM은 동일한 Int4 경량 모델을 CPU에서 실행했을 때 대략 5초의 응답 시간을 보여주고 있습니다. 이 블로그에.. 2025. 5. 14. Retrieval-Augmented Generation(RAG) 설명 Retrieval-Augmented Generation(RAG): 아키텍처, 변형, 실전 적용 전략Retrieval-Augmented Generation(RAG)은 대규모 언어 모델(LLM)과 외부 지식 검색 시스템을 결합한 하이브리드 접근 방식입니다. 기존의 LLM이 내부 파라미터에 내재된 지식에 의존하는 반면, RAG는 외부 소스를 동적으로 참조하여 보다 정확하고 사실 기반의 응답을 생성할 수 있게 합니다. 이 과정에서 가장 핵심적인 역할을 수행하는 기술이 벡터 데이터베이스 기반의 문서 검색입니다.가장 간단한 형태의 RAG는 생성형 AI를 사용하는 사용자가 특정한 도메인 지식을 참고하기 위해 URL 정보나 PDF 파일과 같은 외부 자료를 직접 프롬프트에 첨부하여 질문하는 방식이라고 볼 수 있습니다. .. 2025. 5. 8. LangChain, FAISS, Gemini 임베딩을 활용한 벡터 DB 저장 및 검색 방법 LangChain, FAISS, Gemini 임베딩을 활용한 벡터 DB 저장 및 검색 방법대규모 언어 모델(LLM)을 기반으로 한 RAG(Retrieval-Augmented Generation) 시스템을 구축할 때, 벡터 데이터베이스의 효율적인 저장 및 검색은 핵심 요소입니다. 본 가이드에서는 LangChain, FAISS, Google Gemini 임베딩을 활용하여 문서 임베딩을 저장하고 의미적으로 유사한 정보를 검색하는 전문적인 Python 구현 방식을 설명합니다. 이 구현은 의미 기반 검색 및 RAG 파이프라인을 설계하는 고급 머신러닝 및 딥러닝 엔지니어를 위한 것입니다.LLM 응용에서 벡터 데이터베이스의 중요성기존의 키워드 기반 검색 시스템은 문장의 의미를 제대로 이해하지 못하는 한계가 있습니다... 2025. 5. 8. Python 데코레이터 완벽 가이드 | 고급 파이썬 문법 Python에서 데코레이터는 함수나 클래스를 래핑(wrapping)하여 그 동작을 수정하거나 확장할 수 있는 강력한 기능입니다. 데코레이터는 고급 메타프로그래밍 기법 중 하나이며, 주로 로깅(logging), 인증(auth), 캐싱(caching), 측정(metrics), 트레이싱$\text{(tracing)}$ 등의 작업에서 활용됩니다. 본 문서에서는 파이썬 데코레이터의 문법과 가능한 모든 사용 사례를 설명합니다.1. 데코레이터의 기본 문법def my_decorator(func): def wrapper(*args, **kwargs): print("Before function call") result = func(*args, **kwargs) print("Aft.. 2025. 5. 7. 이전 1 2 3 4 다음