Pandas - 데이터프레임 시각화

728x90

2007년부터 2011년도까지 중국, EU, 미국, 일본, 한국, 멕시코 등의 주요 자동차 생산 대수가 백만대 단위로 저장된 데이터를 활용할 예정 (DataFrame)

path = 'https://github.com/dongupak/DataML/raw/main/csv/'
file = path + 'vehicle_prod.csv'

1. 데이터프레임 시각화

특정한 열 하나를 보기위해선 DataFrame['칼럼 이름']을 통해 보았고, 여러 열을 보기위해선 [['칼럼1', '칼럼2', '칼럼3']]과 같이 이중 대괄호를 사용해 보았다.

판다스는 시각화 메소드 plot()메소드를 사용할 수 있다. ( bar, pie, line 등)

df4 = pd.read_csv(file, index_col = 0)
df4['2009'].plot(kind='bar', color=('r','g','b','c','k','orange'))

df4['2011'].plot(kind='pie')

df4.plot.line()

2007년부터 2011년까지 나라별 자동차 생산 대수를 그래프로 확인하고 싶을 때 이 방법은 좋은 방법은 아니라고 생각한다.

df4.plot.bar()

t1 = df4.T # 행과 열의 위치를 바꿔줌 transpose()
t1.plot.line()

df4.T 또는 df4.transpose() 메소드를 통해 데이터프레임의 인덱스와 컬럼의 위치를 바꿀 수 있다.

그 결과 나머지 그래프들 보다 가독성 좋은 그래프가 나온다.

( 중국의 자동차 생산량이 매년 가파르게 증가하고 있으며, 일본의 경우 감소하는 것을 이해할 수 있다.)

728x90

Pandas - 시계열 자료 분석 DatetimeIndex (0)	2022.12.06
Pandas - 데이터 정제와 결손값 처리 (0)	2022.12.06
Pandas - 인덱싱과 슬라이싱 ( head, tail, loc, iloc ) (1)	2022.11.27
Pandas - csv, DataFrame 구조, 열 생성과 삭제 (0)	2022.11.27
Pandas - 기초, Serise, DataFrame, isna() (0)	2022.11.27

Junsgi