통계학 2

[Statistics#2] Bayes Theorem(베이즈 정리)란 뭘까?

머신러닝과 통계학은 매우 밀접한 관련이 있습니다.  그중, MLE(Maximum Likelihood Estimation)와 MAP(Maximum A Posterior)은 머신러닝 분야와 통계학을 이어주는 중요한 개념이라고 개인적으로 생각하고 있습니다. 따라서, 앞으로 몇 가지의 통계학(Statistics) 포스팅은 이 두 가지 개념을 머신러닝 관점에서 다루는 글을 작성하고자 합니다. 먼저, Bayes Theorem(베이즈 정리)에 대해서 알아보도록 하겠습니다. 그전에 Conditional Probability(조건부 확률)에 대해서 설명해 보면, 조건부 확률은 어떤 사건 $B$가 발생했다는 조건 하에서 다른 사건 $A$가 발생할 확률을 의미합니다. 이를 수식으로 표현하면 다음과 같습니다.$$P(A \mi..

Statistics 2025.01.04

[Statistics#1] 탐색적 데이터 분석(EDA)

고전적인 통계학에서는 거의 추론(inference), 즉 적은 표본(샘플)을 가지고 더 큰 모집단에 대한 결론을 도출하는 데 집중했습니다.  하지만 1962년 존 투기는 'The future of data analysis' 논문에서 통계적 추론을 하나의 구성 요소로 보는 데이터 분석이라는 새로운 과학적 학문을 제안했습니다.※ 참고: https://link.springer.com/chapter/10.1007/978-1-4612-4380-9_31 탐색적 데이터 분석(Exploratory Data Analysis, EDA)은 존 투키의 1977년 책 'Exploratory Data Analysis'를 통해 정립되었습니다.  그는 EDA를 numerical detective work라고 언급하면서 실험의 첫 번..

Statistics 2024.12.09