๐Ÿ“Š ํ†ต๊ณ„ ์ดˆ๋ณด ํƒˆ์ถœ! 5๋ถ„ ๋งŒ์— ๋๋‚ด๋Š” ํ•„์ˆ˜ ํ†ต๊ณ„ ์šฉ์–ด ์™„์ „ ์ •๋ณต

 

๐Ÿ“Š ํ†ต๊ณ„ ์ดˆ๋ณด ํƒˆ์ถœ! 5๋ถ„ ๋งŒ์— ๋๋‚ด๋Š” ํ•„์ˆ˜ ํ†ต๊ณ„ ์šฉ์–ด ์™„์ „ ์ •๋ณต

“ํ†ต๊ณ„ ์šฉ์–ด ๋•Œ๋ฌธ์— ๊น”๋ ค ์ฃฝ์„ ๊ฒƒ ๊ฐ™๋‹ค…”
— ํ†ต๊ณ„๋ฅผ ์ฒ˜์Œ ์ ‘ํ•˜๋Š” ์‚ฌ๋žŒ์˜ 99%๊ฐ€ ํ•˜๋Š” ๋ง¹

๋น„์Šท๋น„์Šทํ•œ ์šฉ์–ด, ๋์—†๋Š” ๊ฐœ๋… ์•”๊ธฐ…
ํ•˜์ง€๋งŒ **๋งฅ๋ฝ(Context)**๋งŒ ์ดํ•ดํ•˜๋ฉด ํ†ต๊ณ„๋Š” ๋‹จ๋ฒˆ์— ์ •๋ฆฌ๋ฉ๋‹ˆ๋‹ค.

์˜ค๋Š˜์€ ํ†ต๊ณ„ ์ดˆ๋ณด์ž๊ฐ€ ๋ฐ˜๋“œ์‹œ ํ—ท๊ฐˆ๋ฆฌ๋Š” ํ•ต์‹ฌ ์šฉ์–ด๋ฅผ
์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์ ˆ์ฐจ์„œ ํ˜•์‹์œผ๋กœ ์ •๋ฆฌํ•ด๋“œ๋ฆฝ๋‹ˆ๋‹ค.
๋ธ”๋กœ๊ทธ ์šด์˜์ž๋ผ๋ฉด ๊ฐ•์˜ ์ž๋ฃŒ๋กœ ๋ฐ”๋กœ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ตฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.


๐Ÿ“Œ ๋ชฉ์ฐจ

  1. ํ†ต๊ณ„์˜ ์ถœ๋ฐœ์ : ๋ชจ์ง‘๋‹จ๊ณผ ํ‘œ๋ณธ

  2. ๊ธฐ์ˆ  ํ†ต๊ณ„(Descriptive Statistics) ์™„์ „ ์ดํ•ด

  3. ์ •๊ทœ๋ถ„ํฌ์™€ ํ™•๋ฅ ๋ณ€์ˆ˜ ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

  4. ์ถ”๋ก  ํ†ต๊ณ„(Inferential Statistics)์˜ ๊ตฌ์กฐ

  5. ์ ์ถ”์ • vs ๊ตฌ๊ฐ„์ถ”์ •

  6. ๊ฐ€์„ค ๊ฒ€์ •(Hypothesis Testing)์˜ ๋ณธ์งˆ

  7. ์‹ค์ „ ์ ์šฉ ์ ˆ์ฐจ ๊ฐ€์ด๋“œ

  8. ์š”์•ฝ ์ •๋ฆฌ

  9. ์ฐธ๊ณ ๋ฌธํ—Œ

  10. ํƒœ๊ทธ


1️⃣ ํ†ต๊ณ„์˜ ์ถœ๋ฐœ์ : ๋ชจ์ง‘๋‹จ๊ณผ ํ‘œ๋ณธ

✔ ๋ชจ์ง‘๋‹จ(Population)

์šฐ๋ฆฌ๊ฐ€ ์•Œ๊ณ  ์‹ถ์€ ๋Œ€์ƒ ์ „์ฒด

์˜ˆ: ๋Œ€ํ•œ๋ฏผ๊ตญ ์ „์ฒด ๊ณ ๋“ฑํ•™์ƒ ํ‚ค

✔ ํ‘œ๋ณธ(Sample)

๋ชจ์ง‘๋‹จ์—์„œ ์ผ๋ถ€๋ฅผ ๋ฌด์ž‘์œ„๋กœ ๋ฝ‘์€ ๊ฒƒ

์ด ๊ณผ์ •์„
ํ‘œ๋ณธ์ถ”์ถœ(Sampling) ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.


✔ ๋ชจ์ˆ˜(Parameter)

๋ชจ์ง‘๋‹จ์˜ ํŠน์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ’
์˜ˆ: ๋ชจ์ง‘๋‹จ ํ‰๊ท , ๋ชจ์ง‘๋‹จ ๋ถ„์‚ฐ

์šฐ๋ฆฌ๋Š” ๋ณดํ†ต ๋ชจ์ˆ˜๋ฅผ ๋ชจ๋ฅธ๋‹ค๋Š” ์ „์ œ์—์„œ ์ถœ๋ฐœํ•ฉ๋‹ˆ๋‹ค.


✔ ํ†ต๊ณ„๋Ÿ‰(Statistic)

ํ‘œ๋ณธ์˜ ํŠน์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ’
์˜ˆ: ํ‘œ๋ณธ ํ‰๊ท , ํ‘œ๋ณธ ๋ถ„์‚ฐ

๐Ÿ’ก ํ•ต์‹ฌ ๊ฐœ๋…:

๋ชจ์ˆ˜๋Š” “์ง„์งœ ๊ฐ’”
ํ†ต๊ณ„๋Ÿ‰์€ “์šฐ๋ฆฌ๊ฐ€ ๊ณ„์‚ฐํ•œ ๊ฐ’”


2️⃣ ๊ธฐ์ˆ  ํ†ต๊ณ„(Descriptive Statistics)

๋ฐ์ดํ„ฐ๋ฅผ ์š”์•ฝํ•˜๊ณ  ์„ค๋ช…ํ•˜๋Š” ๋‹จ๊ณ„

์ฃผ์š” ๊ธฐ์ˆ  ํ†ต๊ณ„๋Ÿ‰

๊ตฌ๋ถ„์„ค๋ช…
ํ‰๊ท (Mean)์ค‘์‹ฌ ์œ„์น˜
์ค‘์•™๊ฐ’(Median)๊ฐ€์šด๋ฐ ๊ฐ’
์ตœ๋นˆ๊ฐ’(Mode)๊ฐ€์žฅ ๋งŽ์ด ๋‚˜์˜จ ๊ฐ’
ํ‘œ์ค€ํŽธ์ฐจ(Standard Deviation)๋ฐ์ดํ„ฐ์˜ ํผ์ง ์ •๋„
์™ธ๋„(Skewness)๋ถ„ํฌ์˜ ๋น„๋Œ€์นญ ์ •๋„
์ฒจ๋„(Kurtosis)๋พฐ์กฑํ•œ ์ •๋„

๐Ÿ“ฆ ์‹คํ–‰ ์˜์—ญ ①

□ ์—‘์…€์ด๋‚˜ ๊ตฌ๊ธ€ ์Šคํ”„๋ ˆ๋“œ์‹œํŠธ๋กœ ํ‰๊ท ๊ณผ ํ‘œ์ค€ํŽธ์ฐจ ๊ณ„์‚ฐํ•ด๋ณด๊ธฐ
□ ๊ฐ™์€ ๋ฐ์ดํ„ฐ์—์„œ ์ค‘์•™๊ฐ’๊ณผ ํ‰๊ท  ๋น„๊ตํ•ด๋ณด๊ธฐ
□ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ ๊ทธ๋ž˜ํ”„ ๊ทธ๋ ค๋ณด๊ธฐ

์ถ”์ฒœ ๋„๊ตฌ:

  • ๊ตฌ๊ธ€ ์Šคํ”„๋ ˆ๋“œ์‹œํŠธ

  • Python (pandas, matplotlib)


3️⃣ ์ •๊ทœ๋ถ„ํฌ์™€ ํ™•๋ฅ ๋ณ€์ˆ˜

✔ ์ •๊ทœ๋ถ„ํฌ(Normal Distribution)

์ขŒ์šฐ ๋Œ€์นญ ์ข… ๋ชจ์–‘ ๋ถ„ํฌ

ํŠน์ง•:

  • ํ‰๊ท  ๊ทผ์ฒ˜ ๊ฐ’์ด ๋งŽ์ด ๋‚˜์˜จ๋‹ค

  • ๋ฉ€์–ด์งˆ์ˆ˜๋ก ํ™•๋ฅ ์ด ๋‚ฎ์•„์ง„๋‹ค

        ▲
      ▲   ▲
    ▲       ▲

(์ข… ๋ชจ์–‘์„ ์ƒ์ƒํ•ด๋ณด์„ธ์š”)


✔ ํ™•๋ฅ ๋ณ€์ˆ˜(Random Variable)

๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ๊ฐ’์„ ํ™•๋ฅ ์ ์œผ๋กœ ํฌํ•จํ•˜๋Š” ๋ณ€์ˆ˜

์˜ˆ:
์‹œํ—˜ ์ ์ˆ˜๋Š” 0~100 ์‚ฌ์ด ๋‹ค์–‘ํ•œ ๊ฐ’์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ์Œ

์ด ๋ถ„ํฌ๋ฅผ ๊ทธ๋ฆผ์œผ๋กœ ํ‘œํ˜„ํ•œ ๊ฒƒ์ด
ํ™•๋ฅ ๋ถ„ํฌ(Probability Distribution)


4️⃣ ์ถ”๋ก  ํ†ต๊ณ„(Inferential Statistics)

ํ‘œ๋ณธ → ๋ชจ์ง‘๋‹จ ๋ฐฉํ–ฅ์œผ๋กœ ์ถ”๋ก ํ•˜๋Š” ๊ณผ์ •

๊ตฌ์„ฑ:

  1. ํ†ต๊ณ„์  ์ถ”์ •(Estimation)

  2. ๊ฐ€์„ค ๊ฒ€์ •(Hypothesis Testing)


5️⃣ ์ ์ถ”์ • vs ๊ตฌ๊ฐ„์ถ”์ •

✔ ์ ์ถ”์ •(Point Estimation)

“๋ชจํ‰๊ท ์€ 100์ผ ๊ฒƒ์ด๋‹ค”

ํ•˜๋‚˜์˜ ๊ฐ’์œผ๋กœ ์ถ”์ •

์‚ฌ์šฉํ•˜๋Š” ๋„๊ตฌ:
์ถ”์ •๋Ÿ‰(Estimator)
์˜ˆ: ํ‘œ๋ณธ ํ‰๊ท 


✔ ๊ตฌ๊ฐ„์ถ”์ •(Interval Estimation)

“๋ชจํ‰๊ท ์€ 95% ํ™•๋ฅ ๋กœ 95~105 ์‚ฌ์ด์— ์žˆ๋‹ค”

๋Œ€ํ‘œ ๊ฐœ๋…:
์‹ ๋ขฐ๊ตฌ๊ฐ„(Confidence Interval)


๐Ÿ“ฆ ์‹คํ–‰ ์˜์—ญ ②

□ ํ‘œ๋ณธ ํ‰๊ท  ๊ณ„์‚ฐํ•˜๊ธฐ
□ ํ‘œ์ค€์˜ค์ฐจ(Standard Error) ๊ณ„์‚ฐํ•ด๋ณด๊ธฐ
□ 95% ์‹ ๋ขฐ๊ตฌ๊ฐ„ ์ง์ ‘ ๊ณ„์‚ฐํ•ด๋ณด๊ธฐ

์‹ ๋ขฐ๊ตฌ๊ฐ„ ๊ณต์‹ ์ดํ•ด:
ํ‰๊ท  ± (์ž„๊ณ„๊ฐ’ × ํ‘œ์ค€์˜ค์ฐจ)


6️⃣ ๊ฐ€์„ค ๊ฒ€์ •(Hypothesis Testing)

์ด๋ฏธ ๋จธ๋ฆฟ์†์— ์žˆ๋Š” ์ฃผ์žฅ

์˜ˆ:
“์ด ์ œํ’ˆ์€ ํ‰๊ท  100์ ์ด๋‹ค”

์ด๋ฅผ ๋ฐ์ดํ„ฐ๋กœ ๊ฒ€์ฆ

๊ตฌ์„ฑ:

  • ๊ท€๋ฌด๊ฐ€์„ค(H₀)

  • ๋Œ€๋ฆฝ๊ฐ€์„ค(H₁)

  • ์œ ์˜์ˆ˜์ค€(Significance Level)

  • p-value

ํ•ต์‹ฌ ์งˆ๋ฌธ:

“์ด ๋ฐ์ดํ„ฐ๊ฐ€ ์šฐ์—ฐํžˆ ๋‚˜์˜ฌ ํ™•๋ฅ ์ด ์–ผ๋งˆ๋‚˜ ๋‚ฎ์€๊ฐ€?”


๐Ÿ“ฆ ์‹คํ–‰ ์˜์—ญ ③

□ A/B ํ…Œ์ŠคํŠธ ์„ค๊ณ„ํ•ด๋ณด๊ธฐ
□ ํ‰๊ท  ์ฐจ์ด ๊ฒ€์ • ํ•ด๋ณด๊ธฐ
□ p-value ๊ณ„์‚ฐํ•ด๋ณด๊ธฐ

์‹ค์ „ ์ถ”์ฒœ:

  • R

  • Python (scipy.stats)

  • Jamovi (์ดˆ๋ณด์ž์šฉ ๋ฌด๋ฃŒ ํ†ต๊ณ„ ํ”„๋กœ๊ทธ๋žจ)


๐Ÿ”ฅ ๊ฐ•์˜ ์ค€๋น„์ž๋ฅผ ์œ„ํ•œ ๊ตฌ์กฐํ™” ํŒ

๊ฐ•์˜๋Š” ๋‹ค์Œ ํ๋ฆ„์œผ๋กœ ๊ตฌ์„ฑํ•˜์„ธ์š”:

๋ชจ์ง‘๋‹จ → ํ‘œ๋ณธ → ๊ธฐ์ˆ ํ†ต๊ณ„ → ๋ถ„ํฌ → ์ถ”์ • → ๊ฒ€์ •

์ด ํ๋ฆ„๋งŒ ์ดํ•ดํ•ด๋„ ํ†ต๊ณ„๋Š” 70% ์ •๋ณต์ž…๋‹ˆ๋‹ค.


๐Ÿ“š ์ถ”๊ฐ€ ์„ค๋ช… (๋ณด๊ฐ• ๋‚ด์šฉ)

※ ์ถ”๊ฐ€ ์„ค๋ช…

  • ํ‘œ์ค€์˜ค์ฐจ(Standard Error): ํ‘œ๋ณธ ํ‰๊ท ์˜ ํ”๋“ค๋ฆผ ์ •๋„

  • ๋ถˆํŽธ์„ฑ(Unbiasedness): ํ‰๊ท ์ ์œผ๋กœ ๋ชจ์ˆ˜๋ฅผ ์ •ํ™•ํžˆ ๋งž์ถ”๋Š” ์„ฑ์งˆ

  • ์ผ์น˜์„ฑ(Consistency): ํ‘œ๋ณธ์ด ์ปค์งˆ์ˆ˜๋ก ์ •ํ™•ํ•ด์ง€๋Š” ์„ฑ์งˆ

์‹ฌํ™” ์˜์—ญ์€ ์ˆ˜๋ฆฌํ†ต๊ณ„ํ•™(Mathematical Statistics)์—์„œ ๋‹ค๋ฃน๋‹ˆ๋‹ค.


๐Ÿ“– ์ฐธ๊ณ ๋ฌธํ—Œ

  1. Montgomery & Runger, Applied Statistics and Probability for Engineers

  2. James et al., An Introduction to Statistical Learning

  3. ์„œ์šธ๋Œ€ํ•™๊ต ํ†ต๊ณ„ํ•™๊ณผ ๊ณต๊ฐœ ๊ฐ•์˜ ์ž๋ฃŒ

  4. Khan Academy Statistics Course


๐Ÿง  ์ตœ์ข… ์š”์•ฝ

  • ํ†ต๊ณ„๋Š” ๋ชจ์ง‘๋‹จ ์ดํ•ด๋ฅผ ์œ„ํ•œ ํ•™๋ฌธ

  • ํ‘œ๋ณธ์œผ๋กœ ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•œ๋‹ค

  • ๊ธฐ์ˆ ํ†ต๊ณ„๋Š” ์„ค๋ช…

  • ์ถ”๋ก ํ†ต๊ณ„๋Š” ํŒ๋‹จ

  • ์ ์ถ”์ •์€ ํ•œ ์ 

  • ๊ตฌ๊ฐ„์ถ”์ •์€ ๋ฒ”์œ„

  • ๊ฐ€์„ค๊ฒ€์ •์€ ์ฃผ์žฅ ๊ฒ€์ฆ

ํ•ต์‹ฌ์€
“๋ชจ์ง‘๋‹จ์„ ๋ชจ๋ฅด๊ธฐ ๋•Œ๋ฌธ์— ํ‘œ๋ณธ์œผ๋กœ ์ถ”๋ก ํ•œ๋‹ค”


๐Ÿท ํƒœ๊ทธ

#ํ†ต๊ณ„๊ธฐ์ดˆ #Statistics #๋ชจ์ง‘๋‹จ #ํ‘œ๋ณธ #๊ธฐ์ˆ ํ†ต๊ณ„ #์ถ”๋ก ํ†ต๊ณ„ #์‹ ๋ขฐ๊ตฌ๊ฐ„ #๊ฐ€์„ค๊ฒ€์ • #๋ฐ์ดํ„ฐ๋ถ„์„ #ํ†ต๊ณ„๊ฐ•์˜


๐Ÿ”Ž ๊ฒ€์ƒ‰ ์„ค๋ช… (150์ž ์ด๋‚ด)

ํ†ต๊ณ„ ์šฉ์–ด ๋•Œ๋ฌธ์— ํ—ท๊ฐˆ๋ฆฌ์…จ๋‚˜์š”? 5๋ถ„ ๋งŒ์— ๋ชจ์ง‘๋‹จ·์‹ ๋ขฐ๊ตฌ๊ฐ„·๊ฐ€์„ค๊ฒ€์ •๊นŒ์ง€ ์™„์ „ ์ •๋ฆฌ! ์‹ค์ „ ์ ์šฉ 3๋‹จ๊ณ„๋กœ ๋‘ํ†ต ์—†์ด ์ดํ•ดํ•˜์„ธ์š”!


¹ ์›๋ฌธ ์˜์ƒ ์ค‘ ์ธ์šฉ
“ํ†ต๊ณ„ ๋•Œ๋ฌธ์— ๊น”๋ ค ์ฃฝ์„ ๊ฒƒ ๊ฐ™๋‹ค”

๋Œ“๊ธ€

์ด ๋ธ”๋กœ๊ทธ์˜ ์ธ๊ธฐ ๊ฒŒ์‹œ๋ฌผ

ํžˆ๋ธŒ๋ฆฌ์ธ, ์ด์Šค๋ผ์—˜์ธ, ์œ ๋Œ€์ธ ์„ฑ๊ฒฝ ์† ์ด๋ฆ„์— ์ˆจ๊ฒจ์ง„ ์†Œ๋ฆ„ ๋‹๋Š” ๋น„๋ฐ€

์ž‘์€ ํ‹ˆ์ด ๋ฌด๋„ˆ๋œจ๋ฆฐ๋‹ค ์™œ ์šฐ๋ฆฌ๋Š” ‘์‚ฌ์†Œํ•œ ๋ถ„์—ด’์„ ๊ทน๋„๋กœ ๊ฒฝ๊ณ„ํ•ด์•ผ ํ•˜๋Š”๊ฐ€

์ž‘์€ ํ‹ˆ์ด ๋ฌด๋„ˆ๋œจ๋ฆฐ๋‹ค ์™œ ์„ฑ๊ฒฝ์€ ‘๋ถ„์—ด์˜ ์‹œ์ž‘’์„ ๊ทธ๋ ‡๊ฒŒ ๊ฒฝ๊ณ ํ•˜๋Š”๊ฐ€