๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Study/Python

[์˜ค๋Š˜์˜ ํŒŒ์ด์ฌ] ์˜์‚ฌ๊ฒฐ์ •ํšŒ๊ท€๋‚˜๋ฌด๋กœ ๋”ฐ๋ฆ‰์ด ๋ฐ์ดํ„ฐ ์˜ˆ์ธกํ•˜๊ธฐ(2)

by hong- 2022. 1. 26.

๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ

๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ณผ์ •์—์„œ ์ „์ฒ˜๋ฆฌ๋Š” ๋ฐ˜๋“œ์‹œ ๊ฑฐ์ณ์•ผ ํ•˜๋Š” ๊ณผ์ • :  ๋ฐ์ดํ„ฐ ์ •์ œ → ๊ฒฐ์ธก๊ฐ’ ์ฒ˜๋ฆฌ → ์ด์ƒ๊ฐ’ ์ฒ˜๋ฆฌ → ๋ถ„์„๋ณ€์ˆ˜ ์ฒ˜๋ฆฌ ์ˆœ์„œ๋กœ ์ง„ํ–‰


  #1 ํŒŒ์ด์ฌ ๋ฐ์ดํ„ฐ ๊ธฐ๋ณธ ์ •๋ณด ํ™•์ธํ•˜๊ธฐ (info())  

df.info()

 

   ex) test.info()

 

  - dataframe์— info() ๋ฉ”์„œ๋“œ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ํ”ผ์ณ๋“ค์˜ ๊ธฐ๋ณธ์ •๋ณด(๊ฒฐ์ธก์น˜์™€ ๋ฐ์ดํ„ฐ ํƒ€์ž…)๋ฅผ ํ™•์ธ๊ฐ€๋Šฅ

  - ๋ชจ๋ธ๋ง์— ์•ž์„œ ๊ฒฐ์ธก์น˜๊ฐ€ ์žˆ๋‹ค๋ฉด ๊ฒฐ์ธก์น˜๋“ค์„ ์–ด๋–ป๊ฒŒ ๋‹ค๋ค„์•ผํ• ์ง€ ๊ณ ๋ฏผํ•˜๊ณ  ์ฒ˜๋ฆฌํ•˜๋Š” ๊ณผ์ •์ด ํ•„์š”ํ•จ

 


  #2 ํŒŒ์ด์ฌ ๊ฒฐ์ธก์น˜ ์‚ญ์ œ, ๋Œ€์ฒด (dropna, fillna)  

DataFrame.dropna()
DataFrame.fillna()

 

   ex) train = train.dropna()       #๊ฒฐ์ธก์น˜ ์‚ญ์ œ

          test = test.fillna(0)          #0์œผ๋กœ ๋Œ€์ฒด

 

   1) dropna()

  - ๊ฒฐ์ธก์น˜๋ฅผ ๊ฐ–๋Š” ํ–‰์„ DataFrame ๊ฐ์ฒด์—์„œ ์‚ญ์ œ

   2) fillna()

   - ๋ชจ๋“  ๊ฒฐ์ธก์น˜๋ฅผ ์ธ์ž ๊ฐ’์œผ๋กœ ๋Œ€์ฒด