1.1 The Industrial Revolution, Cognition, and Computers
์ฆ๊ธฐ ๊ธฐ๊ด๊ณผ ์ฐ์ ํ๋ช ์ ๋น ๋ฅด๊ฒ ์ธ๊ฐ์ ๊ธฐ๊ณ๋ก ๋์ฒดํ์ต๋๋ค. ์ด๋ ์ธ๋ฅ ์ฌํ์ ์ฐ์ ์ ํฌ๊ฒ ๋ฐ๊พธ์๊ณ , ๋ง์ ์ด๋ค์ ์์ฐ์ง์์ ์๋น์ค์ง์ผ๋ก ๋ฐ๋์์ต๋๋ค. ์ด๋ ์ก์ฒด์ ์ธ ํ๋ณด๋ค๋ ์ธ์ง ๋ฅ๋ ฅ์ด ์ค์ํ๊ฒ ๋ ๊ฒ์ ๋๋ค. ์ฆ๊ธฐ ๊ธฐ๊ด, ํ์ ์ฐ๋ฃ ๋ฐ ๊ธฐํ ์๋์ง์์ด ๋ฌผ๋ฆฌ์ ๋ ธ๋์ ์ํด ๋ฌ์ฑํ ๊ฒ์ฒ๋ผ ์ปดํจํ ๊ธฐ์ ์ ์ธ๊ฐ์ ์ธ์์ ํ์๋ก ํ๋ ์์ ์ ๋ํด ๋ฌ์ฑํ ์ ์์ด์ผ ํฉ๋๋ค. ํ์ง๋ง ๊ทธ๋ผ์๋ ์ปดํจํฐ์ ์ฌ์ด์๋ ๊ต์ฅํ ์ฐจ์ด๊ฐ ์์ต๋๋ค. ์๋ฅผ ๋ค๋ฉด, ์ปดํจํฐ์ ์ฐ์ฐ์ ์ค๋ฆฌ์ฝ์์ deterministic binary gate๋ฅผ ์ด์ฉํด ์ฐ์ฐ์ ํ์ง๋ง, ๋๋ noisy biological neurones ์ probabilistic firing patterns๋ฅผ ํตํ ์ฐ์ฐ์ ํฉ๋๋ค.
์ญ์ฌ์ ์ผ๋ก AI๋ Expert System์ ๊ตฌํํ๋๋ฐ ์ด์ ์ด ๋ง์ถฐ์ง ์ ์ด ์๋๋ฐ, ์ด๋ ์ฌ๋์๊ฒ ๊ต์ฅํ ์ฌ์ํ์ผ ์ผ์๋ ์๋ ์ผ๋ ๊ธฐ๊ณ์๊ฒ ์ด๋ ค์ด ์ผ์์ด ์ฆ๋ช ๋์์ต๋๋ค.
๊ทธ๋ฌ๋ ์ค, Machine Learning(ML)์ด ๊ธฐ๊ณ์๊ฒ ์ธ์ง์ ์ธ ๋ฅ๋ ฅ์ ๋ง๋ค ์ ์๋ ๋์์ด ๋์๋๋ฐ, ์ธ๊ฐ์ด ๋์ด์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ฃฐ์ ์ง์ ํด์ฃผ์ง ์๊ณ ๋, ํ์ตํ ์ ์๋ ๋ฃฐ๊ณผ ์ถฉ๋ถํ ๋ฐ์ดํฐ๋ง์ผ๋ก ์ด๋ฅผ ๊ฐ๋ฅ์ผ ํ์์ต๋๋ค. ์ด๋ ์ง๋ 30์ฌ๋ ๊ฐ ๊ต์ฅํ ๋ง์ ๋ถ์ผ์ ์ ์ฉ๋์์ผ๋ฉฐ, ๊ฐ์ฅ ์ต๊ทผ์ Deep Learning ๋ถ์ผ์์ ํฐ ์ฑ๊ณต๋ค์ ์ด๋ฃจ์์ต๋๋ค. ์ด๋ ์ฃผ๋ก ๋ง์ ์์ ๋ฐ์ดํฐ์ ๊ทธ์ ๋ง๋ ๊ฒฐ๊ณผ๊ฐ์ ๊ฐ์ง๊ณ ์๋ Supervised Learning(SL)์ด๋ผ๊ณ ๋ถ๋ฆฌ์ฐ๋๋ฐ, SL์ ์ค์ํ ๊ฐ์ ์ค์ ํ๋๋ ๋ฐ์ดํฐ๋ผ๋ฆฌ์ independentํจ ์ ๋๋ค. ๊ทธ๋ ๊ธฐ์ ์๊ฐ๋ณด๋ค ๋ง์ ํ์ค ๋ฌธ์ ๋ฅผ ํธ๋๋ฐ ์ ์ฝ์ด ๋ฉ๋๋ค. ์ด๋ค ๊ฒฐ์ ์ ๋ฐ๋ผ ๋ฏธ๋์ ๋ฐ์ดํฐ๊ฐ ๋ฐ๋๋ค๋ฉด, SL์ ๊ฐ์ ์ ์๋ฐํ๋๋ฐ, ์๋ฅผ ๋ค๋ฉด ์์จ์ฃผํ ์๋์ฐจ๋ ์ด๋ ๋ฐฉํฅ์ผ๋ก ๊ฐ๋๋์ ๋ฐ๋ผ ์์๊ฐ๊ฐ ๋ค์ด์ค๋ ๋ฐ์ดํฐ๊ฐ ๋ค๋ฅผ ๊ฒ ์ ๋๋ค. ๋ํ ์ถ์ฒ์์คํ ์์๋ ์ ์ ๊ฐ ์ถ์ฒ๋ฐ์ ์ํฉ์์ ๊ทธ ์ถ์ฒ์ ์ด๋ป๊ฒ ์ด์ฉํ๋๋์ ๋ฐ๋ผ ๊ณ์ํด์ ์ํฉ์ ๋ณํํ ๊ฒ์ ๋๋ค.
์ด๋ฐ ์ํฉ๋ค์ ํด๊ฒฐํ๊ธฐ ์ํด ๋ ์ค๋ฅธ ๊ฒ์ด Reinforcement Learning(RL)์ ๋๋ค. RL์์์ ํ๋์ฃผ์ฒด๋ฅผ ๋ณดํต agent๋ผ๊ณ ์ ์ํ๋๋ฐ, ์ด agent๊ฐ ํ๊ฒฝ(environment)๊ณผ ์ํธ์์ฉํ๋ฉฐ ์ด๋ ํ ๋ฐ๋์งํ ํ๋์ ํ๋๋ก ์ฐ๋ฆฌ๋ ๋ง๋ค ์ ์์ต๋๋ค. ์ด agent๋ environment์์ ์ด๋ ํ ์์ ์ ์ฃผ์ด์ง๋ ์ํฉ(state)๋ฅผ ๋ฐ์ ํ๋(action)์ ์ทจํ๊ณ ๊ทธ์ ๋ฐ๋ฅธ ๋ณด์(reward)๋ฅผ ๋ฐ๊ฒ๋ฉ๋๋ค. ์ด ๋, agent์ action์ ๋ฐ๋ผ ๋น์ฅ์ reward๊ฐ ๋ฐ๋๋ ๊ฒ ๋ฟ๋ง ์๋๋ผ ๋ค์ state์ ๋ํ ๋ถํฌ๋ ๋ฐ๊ฟ ์ ์์ต๋๋ค. agent๋ ์ด๋ฅผ ์ฌ์ ์ ์ฃผ์ด์ง ์ง์์ด๋ ๋ฃฐ์ด ์๋ environment์ ์ง์ ์ํธ์์ฉํ๋ฉฐ ๋ฐฐ์๊ฐ๋๋ค.
Last updated