๐ ํต๊ณ ์ด๋ณด 99%๊ฐ ํท๊ฐ๋ฆฌ๋ ํต์ฌ ์ฉ์ด ์์ ์ ๋ณต ― ๋ชจ์ง๋จ๋ถํฐ ๊ฐ์ค๊ฒ์ ๊น์ง 5๋ถ ๊ฐ๋ ๊ตฌ์กฐํ
๐ ํต๊ณ ์ด๋ณด 99%๊ฐ ํท๊ฐ๋ฆฌ๋ ํต์ฌ ์ฉ์ด ์์ ์ ๋ณต
― ๋ชจ์ง๋จ๋ถํฐ ๊ฐ์ค๊ฒ์ ๊น์ง 5๋ถ ๊ฐ๋ ๊ตฌ์กฐํ
๐ ๊ฒ์ ์ค๋ช (150์ ์ด๋ด)
ํต๊ณ ์ฉ์ด ๋๋ฌธ์ ๋จธ๋ฆฌ ์ํ๊ฐ์? ๋ชจ์ง๋จ·ํ๋ณธ·์ ๋ขฐ๊ตฌ๊ฐ๊น์ง 10๊ฐ ํต์ฌ์ 5๋จ๊ณ๋ก ์ ๋ฆฌ! 5๋ถ ๋ง์ ๊ฐ๋ ์ด ์ฐ๊ฒฐ๋๋ ๋๋ผ์ด ๊ฒฝํ์ ํ์ธ์.
๐ ๋ชฉ์ฐจ
์ ํต๊ณ ์ฉ์ด๋ ํท๊ฐ๋ฆด๊น?
ํต๊ณ์ ์ถ๋ฐ์ : ๋ชจ์ง๋จ๊ณผ ํ๋ณธ
๋ชจ์ vs ํต๊ณ๋ ์์ ๊ตฌ๋ถ๋ฒ
๊ธฐ์ ํต๊ณ(Descriptive Statistics) ํต์ฌ ์ ๋ฆฌ
ํ๋ฅ ๋ณ์์ ์ ๊ท๋ถํฌ ์ดํดํ๊ธฐ
์ถ๋ก ํต๊ณ(Inferential Statistics) ๊ตฌ์กฐ ์ ๋ฆฌ
์ ์ถ์ vs ๊ตฌ๊ฐ์ถ์
์ ๋ขฐ๊ตฌ๊ฐ(Confidence Interval)์ ์ง์ง ์๋ฏธ
๊ฐ์ค๊ฒ์ (Hypothesis Testing) ํ ๋ฐฉ ์ ๋ฆฌ
์ค์ ์ ์ฉ ๊ฐ์ด๋
์์ฝ ์ ๋ฆฌ
์ฐธ๊ณ ๋ฌธํ
ํ๊ทธ
1️⃣ ์ ํต๊ณ ์ฉ์ด๋ ํท๊ฐ๋ฆด๊น?
“์ด๊ฒ ๋ค ๋ฐ๋ก๋ฐ๋ก ๋งฅ๋ฝ ์์ด ์๊ธฐํ๋ ค๊ณ ๋ง ํ๋๊น ๊ทธ๋ฐ ๊ฒ๋๋ค.” ¹
ํต๊ณ๋ ์ฉ์ด ์๊ธฐ ๊ณผ๋ชฉ์ด ์๋๋๋ค. ๊ตฌ์กฐ ์ดํด ๊ณผ๋ชฉ์ ๋๋ค.
ํต์ฌ์ ๋จ ํ๋์ ๋๋ค.
๋ชจ์ง๋จ → ํ๋ณธ → ๊ธฐ์ → ์ถ๋ก
์ด ํ๋ฆ์ ์ดํดํ๋ฉด ๋ชจ๋ ์ฉ์ด๊ฐ ์ฐ๊ฒฐ๋ฉ๋๋ค.
2️⃣ ํต๊ณ์ ์ถ๋ฐ์ : ๋ชจ์ง๋จ(Population)๊ณผ ํ๋ณธ(Sample)
✅ ๋ชจ์ง๋จ (Population)
์ฐ๋ฆฌ๊ฐ ์๊ณ ์ถ์ ์ ์ฒด ๋์
์:
๋ํ๋ฏผ๊ตญ ์ ์ฒด ๊ตญ๋ฏผ
์ด๋ค ํ์ฌ์ ๋ชจ๋ ๊ณ ๊ฐ
ํ ์ง์ญ์ ์ ์ฒด ํ์
✅ ํ๋ณธ (Sample)
๋ชจ์ง๋จ์์ ์ผ๋ถ๋ฅผ ๋๋คํ๊ฒ ๋ฝ์ ๊ฒ
์ด ๊ณผ์ ์ ํ๋ณธ์ถ์ถ(Sampling) ์ด๋ผ๊ณ ํฉ๋๋ค.
๐ฆ ์คํ ํฌ์ธํธ
[์คํ ์์ญ]
• ์ฐ๊ตฌ ์ฃผ์ ๋ฅผ ์ ํ๋ค
• ์ ์ฒด ๋์(๋ชจ์ง๋จ)์ ์ ์ํ๋ค
• ๋๋ค ํ๋ณธ์ ์ถ์ถํ๋ค
• ํ๋ณธ ํฌ๊ธฐ๋ฅผ ๊ธฐ๋กํ๋ค
3️⃣ ๋ชจ์(Parameter) vs ํต๊ณ๋(Statistic)
| ๊ตฌ๋ถ | ์๋ฏธ |
|---|---|
| ๋ชจ์ (Parameter) | ๋ชจ์ง๋จ์ ํน์ฑ๊ฐ |
| ํต๊ณ๋ (Statistic) | ํ๋ณธ์ ํน์ฑ๊ฐ |
์:
๋ชจํ๊ท ฮผ
๋ชจ๋ถ์ฐ ฯ²
ํ๋ณธํ๊ท x̄
ํ๋ณธํ์คํธ์ฐจ s
ํต์ฌ:
๋ชจ์๋ ๋ณดํต ๋ชจ๋ฅธ๋ค.
๊ทธ๋์ ํต๊ณ๋์ผ๋ก ์ถ์ ํ๋ค.
4️⃣ ๊ธฐ์ ํต๊ณ (Descriptive Statistics)
๋ฐ์ดํฐ๋ฅผ ์์ฝ·์ ๋ฆฌํ๋ ๋จ๊ณ์ ๋๋ค.
๐ ์ค์ฌ ์์น
ํ๊ท (Mean)
์ค์๊ฐ (Median)
์ต๋น๊ฐ (Mode)
๐ ๋ถํฌ ๋ชจ์
์๋ (Skewness) → ์ข์ฐ ๋น๋์นญ
์ฒจ๋ (Kurtosis) → ๋พฐ์กฑํ ์ ๋
๐ ๋ณ๋์ฑ
๋ถ์ฐ (Variance)
ํ์คํธ์ฐจ (Standard Deviation)
๐ฆ ์คํ ํฌ์ธํธ
[์คํ ์์ญ]
• ๋ฐ์ดํฐ ํ๊ท ๊ณ์ฐ
• ํ์คํธ์ฐจ ๊ณ์ฐ
• ํ์คํ ๊ทธ๋จ ์์ฑ
• ๋ถํฌ ๋ชจ์ ํ์ธ
5️⃣ ํ๋ฅ ๋ณ์(Random Variable)์ ์ ๊ท๋ถํฌ(Normal Distribution)
ํ๋ฅ ๋ณ์
๊ฐ๋ฅํ ๋ชจ๋ ๊ฐ์ ๊ฐ์ง ์ ์๋ ๋ณ์
ํ๋ฅ ๋ถํฌ(Probability Distribution)
๊ฐ๋ค์ด ํ๋ฅ ์ ์ผ๋ก ์ด๋ป๊ฒ ํผ์ ธ์๋์ง ๋ณด์ฌ์ฃผ๋ ๊ฒ
์ ๊ท๋ถํฌ
์ข์ฐ ๋์นญ ์ข ๋ชจ์ ๋ถํฌ
ํน์ง:
ํ๊ท ๊ทผ์ฒ์ ๋ฐ์ดํฐ ๋ฐ์ง
๋ฉ์ด์ง์๋ก ํ๋ฅ ๊ฐ์
๐ท ์์ ๊ทธ๋ฆผ (๊ฐ๋ ๋)
/\
/ \
/ \
/ \
(์ ๊ท๋ถํฌ ์ข ๋ชจ์)
6️⃣ ์ถ๋ก ํต๊ณ (Inferential Statistics)
ํ๋ณธ → ๋ชจ์ง๋จ์ผ๋ก ํ๋จํ๋ ๊ณผ์
๊ตฌ์ฑ:
ํต๊ณ์ ์ถ์
๊ฐ์ค๊ฒ์
7️⃣ ์ ์ถ์ (Point Estimation)
ํ๋์ ๊ฐ์ผ๋ก ์ถ์
์:
๋ชจํ๊ท ฮผ = 100์ผ ๊ฒ์ด๋ค.
์ฌ์ฉ๋๋ ๊ฐ:
ํ๋ณธํ๊ท x̄
์ด๋ x๋̄ ์ถ์ ๋(Estimator) ์ ๋๋ค.
8️⃣ ๊ตฌ๊ฐ์ถ์ (Interval Estimation)
ํ๋์ ์ ์ด ์๋๋ผ ๋ฒ์๋ก ์ถ์
์:
95% ์ ๋ขฐ๊ตฌ๊ฐ = 95 ~ 105
์ ๋ขฐ๊ตฌ๊ฐ(Confidence Interval)
“์ด ๊ตฌ๊ฐ ์์ ๋ชจ์๊ฐ ์์ ํ๋ฅ ์ด 95%”
ํต์ฌ:
์ ์ถ์ ์ ๋ ์นด๋กญ๊ณ ,
๊ตฌ๊ฐ์ถ์ ์ ์์ ํ๋ค.
๐ฆ ์คํ ํฌ์ธํธ
[์คํ ์์ญ]
• ํ๋ณธํ๊ท ๊ณ์ฐ
• ํ์ค์ค์ฐจ ๊ณ์ฐ
• 95% ์ ๋ขฐ๊ตฌ๊ฐ ๊ณต์ ์ ์ฉ
• ๋ฒ์๋ก ํด์
9️⃣ ๊ฐ์ค๊ฒ์ (Hypothesis Testing)
์ด๋ฏธ ๊ฐ๊ณ ์๋ ์ฃผ์ฅ(๊ฐ์ค)์ ๋ฐ์ดํฐ๋ก ๊ฒ์ฆ
์:
“ํ๊ท ์ 100์ด๋ค.”
๋ฐ์ดํฐ๋ก ๋ง๋์ง ํ๋ฆฐ์ง ํ๋จ
ํต์ฌ ๋จ๊ณ:
๊ท๋ฌด๊ฐ์ค ์ค์
๋๋ฆฝ๊ฐ์ค ์ค์
์ ์์์ค ๊ฒฐ์
๊ฒ์ ํต๊ณ๋ ๊ณ์ฐ
p-value ๋น๊ต
๊ธฐ๊ฐ ์ฌ๋ถ ๊ฒฐ์
๐ฆ ์คํ ํฌ์ธํธ
[์คํ ์์ญ]
• ๊ฐ์ค์ ๋ฌธ์ฅ์ผ๋ก ๋ช
ํํ ์์ฑ
• ์ ์์์ค 0.05 ์ค์
• p-value ๊ณ์ฐ
• ๊ธฐ๊ฐ/์ฑํ ํ๋จ
๐ ์ ์ฒด ๊ตฌ์กฐ ํ๋์ ์ ๋ฆฌ
ํต๊ณ =
๋ชจ์ง๋จ
↓
ํ๋ณธ
↓
๊ธฐ์ ํต๊ณ
↓
์ถ๋ก ํต๊ณ
├ ์ ์ถ์
├ ๊ตฌ๊ฐ์ถ์
└ ๊ฐ์ค๊ฒ์
๐ ์ถ๊ฐ ์ค๋ช (๋ณด๊ฐ ๋ด์ฉ)
※ ์ถ๊ฐ ์ค๋ช
ํ์ค์ค์ฐจ(Standard Error)๋
“์ถ์ ๋์ ํ๋ค๋ฆผ ์ ๋”
๊ณต์:
ํ์คํธ์ฐจ ÷ √n
ํ๋ณธ ํฌ๊ธฐ๊ฐ ์ปค์ง์๋ก ์ ๋ขฐ๊ตฌ๊ฐ์ ์ข์์ง๋๋ค.
์ด๊ฒ์ด ํต๊ณ์ ํ์ ๋๋ค.
๐ฏ ์ค์ ์ ์ฉ ์์
✔ ์ค๋ฌธ์กฐ์ฌ
✔ ์ฃผ์ ์์ต๋ฅ ๋ถ์
✔ ์ํ ์ฐ๊ตฌ
✔ ๋ง์ผํ
A/B ํ
์คํธ
๐ก ๊ธฐ์ตํด์ผ ํ ํต์ฌ ๋ฌธ์ฅ
“ํต๊ณ๋ ์ซ์๋ฅผ ๊ณ์ฐํ๋ ํ๋ฌธ์ด ์๋๋ผ, ๋ถํ์ค์ฑ์ ๋ค๋ฃจ๋ ๊ธฐ์ ์ด๋ค.” ²
๐ ์์ฝ
• ํต๊ณ๋ ๋ชจ์ง๋จ์์ ์์ํ๋ค
• ํ๋ณธ์ผ๋ก ๋ชจ์ง๋จ์ ์ถ๋ก ํ๋ค
• ๊ธฐ์ ํต๊ณ๋ ์์ฝ
• ์ถ๋ก ํต๊ณ๋ ํ๋จ
• ์ถ์ ์ ๊ฐ ๋๋ ๋ฒ์
• ๊ฐ์ค๊ฒ์ ์ ์ฃผ์ฅ ๊ฒ์ฆ
์ด ๊ตฌ์กฐ๋ง ๊ธฐ์ตํ๋ฉด ํต๊ณ๋ ์ ๋ฐ ์ฑ๊ณต์ ๋๋ค.
๐ ์ฐธ๊ณ ๋ฌธํ
ํต๊ณ ์ด๋ณด์ ํ์! ๊ผญ ํ๋ฆฌ๋ ํต๊ณ ์ฉ์ด 5๋ถ ์ ๋ฆฌ - YouTube
https://www.youtube.com/watch?v=ZkhF6AbdrrgMontgomery & Runger, Applied Statistics and Probability for Engineers
Moore, McCabe & Craig, Introduction to the Practice of Statistics
Khan Academy Statistics Course
๐ ํ๊ทธ
ํต๊ณ๊ธฐ์ด
๊ธฐ์ ํต๊ณ
์ถ๋ก ํต๊ณ
์ ๋ขฐ๊ตฌ๊ฐ
๊ฐ์ค๊ฒ์
๋ชจ์ง๋จ
ํ๋ณธ
์ ๊ท๋ถํฌ
ํต๊ณ์ฉ์ด์ ๋ฆฌ
ํต๊ณ๊ฐ์์๋ฃ
์ถ๊ฐ
✔ ๊ฐ์ค๊ฒ์ ์ฌํ
✔ p-value ํด์ ์์ ์ ๋ณต
✔ ํ์ค์ค์ฐจ ์๊ฐํ ์๋ฃ
๋ ์ด์ด์ ์ ๋ฆฌํด ๋๋ฆฌ๊ฒ ์ต๋๋ค.
๋๊ธ
๋๊ธ ์ฐ๊ธฐ