# pandas 라이브러리 불러오기
import pandas as pd
# matplotlib 라이브러리 불러오기
import matplotlib.pyplot as plt
# 10개의 csv 파일의 이름을 리스트로 저장하기
# 예를 들어, 'data1.csv', 'data2.csv', ... , 'data10.csv'라는 파일이 있다면
csv_files = ['data' + str(i) + '.csv' for i in range(1, 11)]
# 10개의 데이터프레임을 저장할 빈 리스트 만들기
dfs = []
# 10개의 csv 파일을 반복문으로 불러오기
for csv_file in csv_files:
# csv 파일을 데이터프레임으로 변환하기
df = pd.read_csv(csv_file)
# 특정값을 중복으로 갖는 열을 추출하기
# 예를 들어, 'name'이라는 열에서 'Kim'이라는 값을 갖는 행만 추출하고 싶다면
df = df[df['name'] == 'Kim']
# 추출된 데이터프레임을 리스트에 추가하기
dfs.append(df)
# 10개의 박스플롯을 그리기 위한 데이터 준비하기
# 예를 들어, 'price'라는 열을 기준으로 박스플롯을 그리고 싶다면
data = [df['price'] for df in dfs]
# 10개의 박스플롯을 그리기
plt.boxplot(data, labels=csv_files)
plt.show()
중복 다량csv 파일처리
2023. 11. 28. 12:29