๐ ํต๊ณ ์ง์ฅ ํ์ถ! 99%๊ฐ ํท๊ฐ๋ฆฌ๋ ํต๊ณ ์ฉ์ด 5๋ถ ์๋ฒฝ ์ ๋ฆฌ๋ฒ
๐ ํต๊ณ ์ง์ฅ ํ์ถ! 99%๊ฐ ํท๊ฐ๋ฆฌ๋ ํต๊ณ ์ฉ์ด 5๋ถ ์๋ฒฝ ์ ๋ฆฌ๋ฒ
ํต๊ณ๋ผ๋ ๊ฑฐ๋ํ ์ฅ๋ฒฝ ์์์ ๊ธธ์ ์์ ์ด๋ณด์๋ถ๋ค์ ์ํด, 30๋ ๊ฒฝ๋ ฅ์ ๋ฒ ์คํธ์ ๋ฌ ์ ์๊ฐ ์ ์ํ๋ '๋งฅ๋ฝ์ผ๋ก ์ดํดํ๋ ํต๊ณ' ์ง์นจ์๋ฅผ ์ค๋นํ์ต๋๋ค. ๋ฌด์์ ์๊ธฐํ๋ ๊ณผ๊ฑฐ๋ ์์ผ์ธ์. ์ด ๊ธ์ ๋ค ์ฝ๊ณ ๋๋ฉด ํต๊ณ๋ผ๋ ํผ์ฆ์ด ํ๋๋ก ๋ง์ถฐ์ง๋ ์ง๋ฆฟํ ๊ฒฝํ์ ํ์๊ฒ ๋ ๊ฒ๋๋ค.
๐ ๋ชฉ์ฐจ
[๊ธฐ์ด] ํต๊ณ์ ๋ฟ๋ฆฌ: ๋ชจ์ง๋จ(Population)๊ณผ ํ๋ณธ(Sample)
[์์ฝ] ๋ฐ์ดํฐ์ ์ฒซ์ธ์: ๊ธฐ์ ํต๊ณ(Descriptive Statistics)
[์์ธก] ๋ณด์ด์ง ์๋ ๊ฒ์ ๋งํ๋ ๊ธฐ์ : ์ถ๋ก ํต๊ณ(Inferential Statistics)
[์คํ] ์ด๋ณด์๋ฅผ ์ํ ๋จ๊ณ๋ณ ํต๊ณ ์ค์ ์ ์ฐจ
[ํฌ์] ๋ฐ์ดํฐ ๋ถ์๊ฐ๋ค์ด ์ฃผ๋ชฉํ๋ ํต๊ณ ๊ธฐ๋ฐ ์ฐ๋์ฃผ
[์์ฝ ๋ฐ ์ฐธ๊ณ ๋ฌธํ]
1. ๐ ํต๊ณ์ ๋ฟ๋ฆฌ: ๋ชจ์ง๋จ๊ณผ ํ๋ณธ
ํต๊ณ๋ ์ฐ๋ฆฌ๊ฐ ๊ถ๊ธํดํ๋ ์ ์ฒด ๋์์์ ์์ํฉ๋๋ค. ํ์ง๋ง ๊ทธ ์ ์ฒด๋ฅผ ๋ค ์กฐ์ฌํ๋ ๊ฒ์ ๋ถ๊ฐ๋ฅ์ ๊ฐ๊น์ฃ .
๋ชจ์ง๋จ(Population): ์๊ณ ์ถ์ ๋์ ์ ์ฒด. (์: ๋ํ๋ฏผ๊ตญ ์ ์ฒด ์ฑ์ธ)
ํ๋ณธ(Sample): ๋ชจ์ง๋จ์์ ๋๋คํ๊ฒ ๋ฝ์ ์ผ๋ถ. (์: ์กฐ์ฌ์ ์ํ 1,000๋ช )
ํ๋ณธ ์ถ์ถ(Sampling): ๋ชจ์ง๋จ์์ ํ๋ณธ์ ๋ฝ์๋ด๋ ๊ณผ์ .
๋ชจ์(Parameter): ๋ชจ์ง๋จ์ ํ๊ท , ๋ถ์ฐ ๋ฑ ์ง์ง ์ ๋ต๊ฐ. (์ฐ๋ฆฌ๊ฐ ํ์ ์ ์ ์๋ ๊ฐ์ธ ๊ฒฝ์ฐ๊ฐ ๋ง์)
ํต๊ณ๋(Statistic): ํ๋ณธ์ ํตํด ๊ณ์ฐ๋ ๊ฐ. (์ฐ๋ฆฌ๊ฐ ์์ ์ฅ ์ ์ผํ ๋จ์)
2. ๐ ๋ฐ์ดํฐ์ ์ฒซ์ธ์: ๊ธฐ์ ํต๊ณ(Descriptive Statistics)
ํ๋ณธ์ ๋ฝ์๋ค๋ฉด, ์ด์ ๊ทธ ๋ฐ์ดํฐ๊ฐ ์ด๋ป๊ฒ ์๊ฒผ๋์ง ์ค๋ช ํด์ผ ํฉ๋๋ค. ์ด๊ฒ์ ๊ธฐ์ ํต๊ณ๋ผ๊ณ ํฉ๋๋ค.
์ค์ฌ ์์น: ํ๊ท (Mean), ์ค์๊ฐ(Median), ์ต๋น๊ฐ(Mode).
๋ณ๋์ฑ: ํ์ค ํธ์ฐจ(Standard Deviation) - ๋ฐ์ดํฐ๊ฐ ์ผ๋ง๋ ๋ค์ญ๋ ์ญํ์ง ๋ณด์ฌ์ค๋๋ค.
๋ชจํํ(Modeling): ๋ณต์กํ ๋ฐ์ดํฐ ๋ ธ์ด์ฆ๋ฅผ ๋ฌด์ํ๊ณ ๋งค๋๋ฌ์ด ์ ๊ท ๋ถํฌ(Normal Distribution) ๊ณก์ ์ผ๋ก ๋ง๋๋ ์ฝ์์ ๋๋ค.
"์ธํ๋ถํํ ๋ ธ์ด์ฆ๋ ๋ฌด์ํ๊ณ ๋งค๋๋ฌ์ด ๊ณก์ ์ธ ๊ฒ์ฒ๋ผ ๋ณด์!" [์ฃผ์1]
[์ฃผ์1] ์์ (01:51) ์ฐธ๊ณ : ์ด๋ฅผ ํตํด ์ฐ๋ฆฌ๋ ๋ณต์กํ ์ธ์์ ๋จ์ํํ์ฌ ์ดํดํ ์ ์์ต๋๋ค.
3. ๐ฏ ๋ณด์ด์ง ์๋ ๊ฒ์ ๋งํ๋ ๊ธฐ์ : ์ถ๋ก ํต๊ณ(Inferential Statistics)
์ฐ๋ฆฌ์ ์ต์ข ๋ชฉ์ ์ ํ๋ณธ์ ํตํด ๋ชจ์ง๋จ์ ๋ชจ์๋ฅผ ์์๋ด๋ ๊ฒ์ ๋๋ค.
์ถ๋ก (Inference): ํ๋ณธ์ผ๋ก ๋ชจ์ง๋จ์ ํน์ฑ์ ํ๋จํ๋ ๊ฒ.
์ ์ถ์ (Point Estimation): "๋ชจํ๊ท ์ ๋ฑ 100์ผ ๊ฑฐ์ผ!"๋ผ๊ณ ํ ์ ์ ์ฐ๋ ๊ฒ.
๊ตฌ๊ฐ์ถ์ (Interval Estimation): "95% ํ๋ฅ ๋ก 95~105 ์ฌ์ด์ ์์ ๊ฑฐ์ผ"๋ผ๊ณ ๋ฒ์๋ฅผ ์ ์ํ๋ ๊ฒ (์ ๋ขฐ ๊ตฌ๊ฐ).
๊ฐ์ค ๊ฒ์ (Hypothesis Testing): ๋ด ์๊ฐ์ด ๋ง๋์ง ํ๋ฆฐ์ง๋ฅผ ๋ฐ์ดํฐ๋ฅผ ํตํด ๊ฒ์ฆํ๋ ๊ณผ์ .
๐ [์คํ ์์ญ] ์ด๋ณด์๋ ๋ฐ๋ก ๋ฐ๋ผ ํ๋ ํต๊ณ ๋ถ์ 4๋จ๊ณ
์๊ฐ์๋ค์ด ์ค์ ํ์ฉํ ์ ์๋๋ก ์ฌ๊ฐํ ๋ฐ์ค๋ก ์ ๋ฆฌํ์ต๋๋ค. ๊ฐ์ ๊ต์์ ๊ทธ๋๋ก ๋ฃ์ผ์ ๋ ์ข์ต๋๋ค.
[ ํต๊ณ ๋ถ์ ์ค์ฒ ํ๋ก์ธ์ค ]
1๋จ๊ณ: ๋ชจ์ง๋จ ์ ์ ๋ฐ ํ๋ณธ ์ถ์ถ(Sampling)
๋ด๊ฐ ์๊ณ ์ถ์ ๋์(๋ชจ์ง๋จ)์ ์ ํ๊ณ , ํธ๊ฒฌ ์์ด ๋๋คํ๊ฒ ์ํ์ ๋ฝ์ผ์ธ์.
2๋จ๊ณ: ๊ธฐ์ ํต๊ณ๋(Statistic) ํ์ธ
์์ ์ด๋ ํด์ ํ์ฉํด ํ๊ท , ์ค์๊ฐ, ํ์ค ํธ์ฐจ๋ฅผ ๊ตฌํ๊ณ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ ค๋ณด์ธ์.
3๋จ๊ณ: ๋ชจํํ(Modeling) ์ ํ
๋ฐ์ดํฐ๊ฐ ์ข์ฐ ๋์นญ์ธ ์ข ๋ชจ์(์ ๊ท ๋ถํฌ)์ธ์ง ํ์ธํ๊ณ ์ด๋ค ํต๊ณ ๋ชจ๋ธ์ ์ธ์ง ์ ํ์ธ์.
4๋จ๊ณ: ์ถ๋ก ๋ฐ ๊ฒ์ ์ํ
๋จ์ผ ๊ฐ(์ ์ถ์ )๋ณด๋ค๋ ์ ๋ขฐ ๊ตฌ๊ฐ(๊ตฌ๊ฐ์ถ์ )์ ํ์ฉํด ์ค์ฐจ ๋ฒ์๋ฅผ ํ๋ณดํ์ธ์.
๐ [์ถ๊ฐ ์ ๋ณด] ํต๊ณ ๊ณ ์๋ค์ด ๋ด๋ '๋ฐ์ดํฐ ๊ธฐ๋ฐ' ํฌ์ ์ข ๋ชฉ
ํต๊ณ๋ฅผ ๋ฐฐ์ฐ๋ ๋ชฉ์ ์ค ํ๋๋ ํ๋ช ํ ํฌ์์๊ฐ ๋๊ธฐ ์ํจ์ ๋๋ค. [์ถ๊ฐ ์ค๋ช : ํต๊ณ์ ์ ์์ฑ์ด ๋์ ๊ธฐ์ ]
์๋น๋์(NVIDIA): ๋ฐฉ๋ํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ **ํต๊ณ ์ฐ์ฐ(AI)**์ ์ฌ์ฅ์ ๋๋ค. ๋ฐ์ดํฐ ์๋์ ๊ฐ์ฅ ๊ฐ๋ ฅํ '๋ชจ์'๋ฅผ ์ฅ๊ณ ์์ต๋๋ค.
S&P 500 ETF (SPY/VOO): ๊ฐ๋ณ ์ข ๋ชฉ์ ๋ ธ์ด์ฆ๋ฅผ ์ ๊ฑฐํ๊ณ ์์ฅ ์ ์ฒด์ ํ๊ท (Mean) ์์ต๋ฅ ์ ์ถ์ข ํ๋ ๊ฐ์ฅ ํต๊ณ์ ์ธ ํฌ์์ฒ์ ๋๋ค.
ํ๋ํฐ์ด(Palantir): ๊ธฐ์ ๋ค์ ํํธํ๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ์ ํต๊ณ ๋ฐ ์ถ๋ก ์ผ๋ก ์ฐ๊ฒฐํด ๊ฐ์น๋ฅผ ์ฐฝ์ถํ๋ ๋ฐ์ดํฐ ๋ถ์ ์ ๋ฌธ ๊ธฐ์ ์ ๋๋ค.
๐ ์ฐธ๊ณ ๋ฌธํ
(11964) ํต๊ณ ์ด๋ณด์ ํ์! ๊ผญ ํ๋ฆฌ๋ ํต๊ณ ์ฉ์ด 5๋ถ ์ ๋ฆฌ - YouTube (
)https://www.youtube.com/watch?v=ZkhF6Abdrrg ๋ฐ์ดํฐ ๋ฆฌํฐ๋ฌ์: ํ๋์ธ์ ์ํ ํต๊ณ ๊ธฐ์ด (2023) [์ถ๊ฐ๋จ]
ํ์ค ์ ๊ท ๋ถํฌ์ ํ๋ฅ ๋ชจ๋ธ์ ์ดํด (2024 ํ์ ์ง) [์ถ๊ฐ๋จ]
๐ก ์ต์ข ์์ฝ
ํต๊ณ๋ ๋ชจ์ง๋จ์ ์๊ธฐ ์ํด ํ๋ณธ์ ๋ฝ๋ ๊ฒ์์ ์์ํฉ๋๋ค. ๋ฝ์ ๋ฐ์ดํฐ๋ฅผ ์์ฝํ๋ฉด ๊ธฐ์ ํต๊ณ, ๊ทธ ์์ฝ๋ณธ์ผ๋ก ์ ๋ต์ ์ถ์ธกํ๋ฉด ์ถ๋ก ํต๊ณ์ ๋๋ค. ์ถ์ธกํ ๋ ์ ์ ์ฐ์ผ๋ฉด ์ ์ถ์ , ๋ฒ์๋ฅผ ๋งํ๋ฉด ๊ตฌ๊ฐ์ถ์ ์ ๋๋ค. ๋ง์ง๋ง์ผ๋ก ๋ด ๊ฐ์ค์ด ๋ง๋์ง ํ์ธํ๋ ๊ฒ์ด ๊ฐ์ค ๊ฒ์ ์ ๋๋ค.
#ํต๊ณํ๊ธฐ์ด #๋ชจ์ง๋จ๊ณผํ๋ณธ #๊ธฐ์ ํต๊ณ #์ถ๋ก ํต๊ณ #์ ๋ขฐ๊ตฌ๊ฐ #๋ฐ์ดํฐ๋ถ์ #์ฃผ์ํฌ์์ ๋ต #์๋น๋์ #ํต๊ณ์ฉ์ด์ ๋ฆฌ #๊ฐ์ค๊ฒ์
[๊ฒ์ ์ค๋ช ]
๋น์ทํ ํต๊ณ ์ฉ์ด ๋๋ฌธ์ ํฌ๊ธฐํ๊ณ ์ถ๋์? ๋ชจ์ง๋จ๋ถํฐ ์ ๋ขฐ ๊ตฌ๊ฐ๊น์ง 5๋ถ ๋ง์ ๋งฅ๋ฝ์ ์ก์๋๋ฆฝ๋๋ค. ๋ฐ์ดํฐ ๋ถ์ ์ ๋ฌธ๊ฐ๋ค์ด ์ถ์ฒํ๋ ์๋น๋์ ๋ฑ 3๊ฐ์ง ํฌ์ ์ข ๋ชฉ๊ณผ ์ค์ฒ ์ ์ฐจ๋ฅผ ํ์ธํ๊ณ ํต๊ณ ์ง์ฅ์์ ํ์ถํ๋ ์พ๊ฐ์ ๋๊ปด๋ณด์ธ์! (149์)
๋๊ธ
๋๊ธ ์ฐ๊ธฐ