Pandas
Pandas Library๋ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ์ ๋ฆฌํ๋๋ฐ ์ต์ ํ๋ ๋๊ตฌ์ด๋ฉฐ, ์คํ์์ค์ด๋ค. Pandas๋ฅผ ์ด์ฉํ๋ฉด ๋ฐ์ดํฐ๊ณผํ์ 80% ~ 90% ์ ๋ฌด๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ค.
๋ฐ์ดํฐ ๋ถ์์ ์ํด ๋ค์ํ ์์ค๋ก๋ถํฐ ์์งํ๋ ๋ฐ์ดํฐ๋ ํํ์ ์์ฑ์ด ๋งค์ฐ ๋ค์ํ๋ค. ์๋ก ๋ค๋ฅธ ํ์์ ๊ฐ๋ ์ฌ๋ฌ ์ข ๋ฅ์ ๋ฐ์ดํฐ๋ฅผ ์ปดํจํฐ๊ฐ ์ดํดํ ์ ์๋๋ก ๋์ผํ ํ์์ ๊ฐ๋ ๊ตฌ์กฐ๋ก ํตํฉํ ํ์๊ฐ ์๋ค.
Pandas Library๋ ์ฌ๋ฌ ์ข ๋ฅ์ class์ ๋ด์ฅ ํจ์๋ก ๊ตฌ์ฑ๋์ด์๋ค.
ํ๊ฒฝ์ค์
Mac OS์์ pyenv, virtual-env ๊ฐ์ ํ๊ฒฝ์ ํ๊ฒฝ์ค์ ์ ํ ๊ฒ์ด๋ค.
virtual-env ์์ฑ ๋ฐ local ์ค์
๊ด๋ จ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค์ ์ค์นํ๊ธฐ ์ด์ ์ pip๋ฅผ upgradeํด์ค๋ค.
pandas : ๋ฐ์ดํฐ ๋ถ์์ฉ
numpy : Numerical Python์ ์ฝ์๋ก ํ์ด์ฌ ๊ธฐ๋ฐ ์์น ํด์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
matplotlib : ๊ทธ๋ํ๋ ์ฐจํธ ๋ฑ ๊ทธ๋ํฝ์ผ๋ก ํํํ๋๋ฐ ์ฌ์ฉํ๋ ํ์ด์ฌ ๊ธฐ๋ฐ 2D ์๊ฐํ ๋๊ตฌ
scipy : ๊ณผํ์ฉ ์ฐ์ฐ(๋ฏธ์ ๋ถ, ์ ํ๋์, ํ๋ ฌ ์ฐ์ฐ, ๋ฐฉ์ ์ ๊ณ์ฐ ๋ฑ)์ ํ์ํ ํจํค์ง๋ฅผ ๋ชจ์ ๋์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
scikit-learn : ๋จธ์ ๋ฌ๋ ํ์ต์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค. numpy์ scipy๊ฐ ์ค์น๋ ์ํ์ฌ์ผํ๋ค.
seaborn : Matplotlib์ ๊ธฐ๋ฐ์ผ๋ก ๋ค์ํ ์์ ํ ๋ง์ ํต๊ณ์ฉ ์ฐจํธ ๋ฑ์ ๊ธฐ๋ฅ์ ์ถ๊ฐํ ์๊ฐํ ํจํค์ง์ด๋ค. (Seaborn Data)
BeautifulSoup4 : Beautiful Soup์ HTML ๋ฐ XML ๋ฌธ์๋ฅผ ๊ตฌ๋ฌธ ๋ถ์ํ๊ธฐ์ํ Python ํจํค์ง(์น ์คํฌ๋ํ์ ์ฌ์ฉ)
requests : Python์์ HTTP ์์ฒญ์ ๋ณด๋ด๋ ๋ชจ๋
์ค์น๋ฅผ ์๋ฃํ๊ณ ํ์ requirements.txt๋ก ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ฒ์ ์ ๊ด๋ฆฌํ ์ ์๋ค.
DataSet
๋ฐ์ดํฐ ๋ถ์๊ณผ ๋จธ์ ๋ฌ๋ ๊ณต๋ถ ์์ ๋ฐ์ดํฐ์ ์ ์ ๊ณตํ๋ ๊ณณ์ ์์๋๋ฉด ์ข๋ค.
scikit-learn, seaborn ๋ฑ python ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ๊ณต ๋ฐ์ดํฐ์
๊ณต๊ณต ๋ฐ์ดํฐ
ํด์ธ : WorldBank, WTO๋ฑ ๊ตญ์ ๊ธฐ๊ตฌ
๊ตญ๋ด : ๊ณต๊ณต๋ฐ์ดํฐ ํฌํ, ๊ตญ๊ฐํต๊ณํฌํธ
Last updated