Pandas
Pandas Library๋ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ์ ๋ฆฌํ๋๋ฐ ์ต์ ํ๋ ๋๊ตฌ์ด๋ฉฐ, ์คํ์์ค์ด๋ค. Pandas๋ฅผ ์ด์ฉํ๋ฉด ๋ฐ์ดํฐ๊ณผํ์ 80% ~ 90% ์ ๋ฌด๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ค.
๋ฐ์ดํฐ ๋ถ์์ ์ํด ๋ค์ํ ์์ค๋ก๋ถํฐ ์์งํ๋ ๋ฐ์ดํฐ๋ ํํ์ ์์ฑ์ด ๋งค์ฐ ๋ค์ํ๋ค. ์๋ก ๋ค๋ฅธ ํ์์ ๊ฐ๋ ์ฌ๋ฌ ์ข ๋ฅ์ ๋ฐ์ดํฐ๋ฅผ ์ปดํจํฐ๊ฐ ์ดํดํ ์ ์๋๋ก ๋์ผํ ํ์์ ๊ฐ๋ ๊ตฌ์กฐ๋ก ํตํฉํ ํ์๊ฐ ์๋ค.
Pandas Library๋ ์ฌ๋ฌ ์ข ๋ฅ์ class์ ๋ด์ฅ ํจ์๋ก ๊ตฌ์ฑ๋์ด์๋ค.
ํ๊ฒฝ์ค์
Mac OS์์ pyenv, virtual-env ๊ฐ์ ํ๊ฒฝ์ ํ๊ฒฝ์ค์ ์ ํ ๊ฒ์ด๋ค.
virtual-env ์์ฑ ๋ฐ local ์ค์
$ pyenv virtualenv 3.7.1 pandas
$ pyenv local panda
๊ด๋ จ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค์ ์ค์นํ๊ธฐ ์ด์ ์ pip๋ฅผ upgradeํด์ค๋ค.
$ pip install --upgrade pip
pandas : ๋ฐ์ดํฐ ๋ถ์์ฉ
$ pip install pandas
numpy : Numerical Python์ ์ฝ์๋ก ํ์ด์ฌ ๊ธฐ๋ฐ ์์น ํด์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
$ pip install numpy
matplotlib : ๊ทธ๋ํ๋ ์ฐจํธ ๋ฑ ๊ทธ๋ํฝ์ผ๋ก ํํํ๋๋ฐ ์ฌ์ฉํ๋ ํ์ด์ฌ ๊ธฐ๋ฐ 2D ์๊ฐํ ๋๊ตฌ
$ pip install matplotlib
scipy : ๊ณผํ์ฉ ์ฐ์ฐ(๋ฏธ์ ๋ถ, ์ ํ๋์, ํ๋ ฌ ์ฐ์ฐ, ๋ฐฉ์ ์ ๊ณ์ฐ ๋ฑ)์ ํ์ํ ํจํค์ง๋ฅผ ๋ชจ์ ๋์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
$ pip install scipy
scikit-learn : ๋จธ์ ๋ฌ๋ ํ์ต์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค. numpy์ scipy๊ฐ ์ค์น๋ ์ํ์ฌ์ผํ๋ค.
$ pip install -U scikit-learn
seaborn : Matplotlib์ ๊ธฐ๋ฐ์ผ๋ก ๋ค์ํ ์์ ํ ๋ง์ ํต๊ณ์ฉ ์ฐจํธ ๋ฑ์ ๊ธฐ๋ฅ์ ์ถ๊ฐํ ์๊ฐํ ํจํค์ง์ด๋ค. (Seaborn Data)
$ pip install seaborn
BeautifulSoup4 : Beautiful Soup์ HTML ๋ฐ XML ๋ฌธ์๋ฅผ ๊ตฌ๋ฌธ ๋ถ์ํ๊ธฐ์ํ Python ํจํค์ง(์น ์คํฌ๋ํ์ ์ฌ์ฉ)
$ pip install beautifulsoup4
requests : Python์์ HTTP ์์ฒญ์ ๋ณด๋ด๋ ๋ชจ๋
$ pip install requests
$ pip list
Package Version
--------------- ------------
beautifulsoup4 4.9.0
certifi 2020.4.5.1
chardet 3.0.4
cycler 0.10.0
et-xmlfile 1.0.1
idna 2.9
jdcal 1.4.1
joblib 0.14.1
kiwisolver 1.2.0
lxml 4.5.0
matplotlib 3.2.1
numpy 1.18.3
openpyxl 3.0.3
pandas 1.0.3
pip 20.0.2
pyparsing 2.4.7
python-dateutil 2.8.1
pytz 2019.3
requests 2.23.0
scikit-learn 0.22.2.post1
scipy 1.4.1
seaborn 0.10.1
setuptools 39.0.1
six 1.14.0
soupsieve 2.0
urllib3 1.25.9
xlrd 1.2.0
์ค์น๋ฅผ ์๋ฃํ๊ณ ํ์ requirements.txt๋ก ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ฒ์ ์ ๊ด๋ฆฌํ ์ ์๋ค.
$ pip freeze > requirements.txt
DataSet
๋ฐ์ดํฐ ๋ถ์๊ณผ ๋จธ์ ๋ฌ๋ ๊ณต๋ถ ์์ ๋ฐ์ดํฐ์ ์ ์ ๊ณตํ๋ ๊ณณ์ ์์๋๋ฉด ์ข๋ค.
scikit-learn, seaborn ๋ฑ python ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ๊ณต ๋ฐ์ดํฐ์
๊ณต๊ณต ๋ฐ์ดํฐ
ํด์ธ : WorldBank, WTO๋ฑ ๊ตญ์ ๊ธฐ๊ตฌ
๊ตญ๋ด : ๊ณต๊ณต๋ฐ์ดํฐ ํฌํ, ๊ตญ๊ฐํต๊ณํฌํธ
Last updated
Was this helpful?