본문 바로가기
DATA/Pandas

Pandas - 데이터프레임 시각화

by jun.s.gi 2022. 11. 27.
728x90

2007년부터 2011년도까지 중국, EU, 미국, 일본, 한국, 멕시코 등의 주요 자동차 생산 대수가 백만대 단위로 저장된 데이터를 활용할 예정 (DataFrame)

path = 'https://github.com/dongupak/DataML/raw/main/csv/'
file = path + 'vehicle_prod.csv'

 

1. 데이터프레임 시각화

특정한 열 하나를 보기위해선 DataFrame['칼럼 이름']을 통해 보았고, 여러 열을 보기위해선 [['칼럼1', '칼럼2', '칼럼3']]과 같이 이중 대괄호를 사용해 보았다.

판다스는 시각화 메소드 plot()메소드를 사용할 수 있다. ( bar, pie, line 등)

df4 = pd.read_csv(file, index_col = 0)
df4['2009'].plot(kind='bar', color=('r','g','b','c','k','orange'))

bar

 

df4['2011'].plot(kind='pie')

pie

df4.plot.line()

2007년부터 2011년까지 나라별 자동차 생산 대수를 그래프로 확인하고 싶을 때 이 방법은 좋은 방법은 아니라고 생각한다.

 

df4.plot.bar()

 

t1 = df4.T # 행과 열의 위치를 바꿔줌 transpose()
t1.plot.line()

df4.T 또는 df4.transpose() 메소드를 통해 데이터프레임의 인덱스와 컬럼의 위치를 바꿀 수 있다.

그 결과 나머지 그래프들 보다 가독성 좋은 그래프가 나온다.

( 중국의 자동차 생산량이 매년 가파르게 증가하고 있으며, 일본의 경우 감소하는 것을 이해할 수 있다.)

728x90