Ensemble Learning์ด๋?
์ฌ๋ฌ ๊ฐ์ base-learner(base-model)๋ฅผ ์กฐํฉํ๋ ๋ชจ๋ธ
Bagging
- ๋ค๋ฅธ ์ด๋ฆ: Bootstrap Aggregating
- Bootstrap: Random Sampling ๋ฐฉ๋ฒ๋ก ์ค ํ๋. ๋ณต์ ์ถ์ถ์ ์ํํ๋ค.
- ๋ณต์ ์ถ์ถ์ ํตํด ๋์ผํ ํฌ๊ธฐ์ ๋ฐ์ดํฐ์ ์ ์ฌ๋ฌ ๊ฐ ์์ฑํ ํ, ์์๋ธ์ ๊ตฌ์ฑํ๋ ํ์ต ๋ฐฉ์
- ๋จ์ : ๋๋ค ์ํ๋ง์ ์ด์ ์์กดํ๋ค.
๋ง์ฝ, decision tree๋ฅผ ํ์ต์ํจ๋ค๊ณ ๊ฐ์ ํด๋ณด์.
boostrap์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ ๊ฒฝ์ฐ, ๋ณต์ ์ถ์ถ์ด๊ธฐ ๋๋ฌธ์ ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์ฌ๋ฌ ๋ฒ ๋ฝํ ์ ์๊ณ , ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ๋ฐ์ดํฐ์ ๋ผ๋ฆฌ ์ ์ฌํ๋ค. ๊ทธ๋ฌ๋ฏ๋ก ์ด๋ฐ ๊ฒฝ์ฐ decision tree์ root node๋ ๋ชจ๋ธ ๊ฐ์ ํญ์ ๋น์ทํด์ง ์๋ฐ์ ์๋ค.
Boosting
- Bagging๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ์ด randomness์ ์์กดํ๋ค๋ ๋จ์ ์ ๋ณด์ํ๊ธฐ ์ํด ๊ณ ์๋ ๋ฐฉ์
- ์ ์ฒด ๋ฐ์ดํฐ์ ์ 3๊ฐ๋ก ๋ถํ ํ๋ค. (D1, D2, D3)
- ํ์ต ๋ฐฉ์
base-learner๋ฅผ 3๊ฐ ํ์ต์ํจ๋ค.
1. h1์ D1์ผ๋ก ํ์ต์ํจ๋ค.
2. h2๋ฅผ D2 ์ค h1์ด ํ๋ ธ๋ ๋ฌธ์ + ๋ง์๋ ๋ฌธ์ ๊ฐ์ ๋น์จ๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ์ ์ผ๋ก ํ์ต์ํจ๋ค.
3. h3์ h2๊ฐ ํ๋ ธ๋ ๋ฌธ์ ๋ฐ์ดํฐ์ ์ผ๋ก ํ์ต์ํจ๋ค.
- ์์ธก ๋ฐฉ์
h1(x)=h2(x)๋ผ๋ฉด, h1(x)๋ฅผ ๋ฐํ.
์๋๋ผ๋ฉด h3(x)์ ๋ฐํ. => ํ๋ ธ๋ ๋ฌธ์ ๋ง์ผ๋ก ํ์ต๋ ๋ชจ๋ธ์ด๋ฏ๋ก ๊ฐ์ฅ ๋ง์ ํ๋ฅ ์ด ๋๋ค.