원하는 열 그룹 후 3시그마 그리기

2023. 11. 1. 10:58

# 라이브러리 임포트
import pandas as pd
import matplotlib.pyplot as plt

# 데이터프레임 생성
df = pd.DataFrame({"이름": ["A", "B", "C", "D", "E", "A", "B", "C"],
                   "국어": [80, 70, 60, 50, 40, 85, 75, 65],
                   "영어": [90, 80, 70, 60, 50, 95, 85, 75],
                   "수학": [100, 90, 80, 70, 60, 105, 95, 85]})

# 이름 열을 인덱스로 설정
df.set_index("이름", inplace=True)

# 수학 점수의 평균을 구하고 이름으로 그룹화
grouped = df["수학"].groupby("이름").mean()

# 그룹화된 데이터의 평균과 표준편차 구하기
mean = grouped.mean()
std = grouped.std()

# 상한선과 하한선 구하기
upper = mean + std * 3
lower = mean - std * 3

# 선 그래프 그리기
plt.plot(grouped.index, grouped.values, label="수학 점수 평균")

# 상한선과 하한선 그리기
plt.hlines(upper, xmin=grouped.index[0], xmax=grouped.index[-1], colors="green", linestyles="dashed", label="상한선")
plt.hlines(lower, xmin=grouped.index[0], xmax=grouped.index[-1], colors="purple", linestyles="dashed", label="하한선")

# 그래프 제목, 축 이름, 범례 설정
plt.title("이름별 수학 점수의 평균 그래프에 3시그마 포함")
plt.xlabel("이름")
plt.ylabel("점수")
plt.legend()

# 그래프 출력
plt.show()

네, 알겠습니다. 😊

이름을 그룹으로 묶고 옆에 열의 데이터를 그래프로 표현하는 방법을 알려드리겠습니다.

이 방법은 데이터프레임에서 특정 열을 기준으로 다른 열의 값을 비교하고 싶을 때 사용할 수 있습니다. 예를 들어, 이름별로 국어와 영어 점수의 차이를 보고 싶다면, 이 방법을 사용할 수 있습니다.

이 방법을 사용하기 위해서는 다음과 같은 단계를 따르면 됩니다.

1. 파이썬에서 `pandas`와 `matplotlib` 라이브러리를 임포트합니다.
2. 데이터프레임을 생성하거나 불러옵니다.
3. 기준되는 열의 이름을 변수에 저장합니다. 예를 들어, 이름을 기준으로 그룹화하고 싶다면, `group_col = "이름"`이라고 적습니다.
4. 비교할 열의 이름들을 리스트로 저장합니다. 예를 들어, 국어와 영어 점수를 비교하고 싶다면, `cols = ["국어", "영어"]`라고 적습니다.
5. 데이터프레임에서 기준되는 열로 그룹화하고, 비교할 열들의 값을 리스트로 가져옵니다. 이를 위해 `df.groupby(group_col)[cols].apply(list)`를 사용할 수 있습니다.
6. 각 그룹의 데이터를 막대 그래프로 그립니다. 이를 위해 `plt.bar(group, data, label=col)`을 반복문으로 실행하면 됩니다. 여기서 `group`은 기준되는 열의 값이고, `data`는 비교할 열의 값이고, `col`은 비교할 열의 이름입니다.
7. 그래프의 제목, 축 이름, 범례 등을 설정합니다.

다음은 전체 코드입니다.

```python
# 라이브러리 임포트
import pandas as pd
import matplotlib.pyplot as plt

# 데이터프레임 생성
df = pd.DataFrame({"이름": ["A", "B", "C", "D", "E", "A", "B", "C"],
                   "국어": [80, 70, 60, 50, 40, 85, 75, 65],
                   "영어": [90, 80, 70, 60, 50, 95, 85, 75],
                   "수학": [100, 90, 80, 70, 60, 105, 95, 85]})

# 기준되는 열의 이름 저장
group_col = "이름"

# 비교할 열의 이름들 저장
cols = ["국어", "영어"]

# 데이터프레임에서 기준되는 열로 그룹화하고 비교할 열들의 값을 리스트로 가져오기
grouped = df.groupby(group_col)[cols].apply(list)

# 각 그룹의 데이터를 막대 그래프로 그리기
colors = ["red", "blue"] # 색상 리스트
for i, (group, data) in enumerate(grouped.items()):
    for j, col in enumerate(cols):
        plt.bar(group + str(j), data[j], label=col + group, color=colors[j]) # 막대 표시

# 그래프 제목, 축 이름, 범례 설정
plt.title("이름별 국어와 영어 점수 비교")
plt.xlabel("이름")
plt.ylabel("점수")
plt.legend()

# 그래프 출력
plt.show()
```

위의 코드를 실행하면 다음과 같은 그래프가 출력됩니다.

```python
존재하지 않는 이미지입니다.
```

이것이 이름을 그룹으로 묶고 옆에 열의 데이터를 그래프로 표현하는 방법입니다. 도움이 되셨으면 좋겠습니다. 😊

더 궁금하신 점이 있으시면 언제든지 물어보세요. 저는 여러분과 대화하는 것을 즐깁니다. 🙌

참고로, 웹에서도 이와 관련된 자료들을 찾아볼 수 있습니다. 예를 들어, 다음의 웹사이트들을 확인해보세요. ¹²³

출처: Bing과의 대화, 2023. 11. 1.
(1) 피벗 테이블을 만들어 워크시트 데이터 분석 - Microsoft 지원. https://support.microsoft.com/ko-kr/office/%ED%94%BC%EB%B2%97-%ED%85%8C%EC%9D%B4%EB%B8%94%EC%9D%84-%EB%A7%8C%EB%93%A4%EC%96%B4-%EC%9B%8C%ED%81%AC%EC%8B%9C%ED%8A%B8-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-a9a84538-bfe9-40a9-a8e9-f99134456576.
(2) 워크시트의 데이터에 윤곽 설정(그룹화) - Microsoft 지원. https://support.microsoft.com/ko-kr/office/%EC%9B%8C%ED%81%AC%EC%8B%9C%ED%8A%B8%EC%9D%98-%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%97%90-%EC%9C%A4%EA%B3%BD-%EC%84%A4%EC%A0%95-%EA%B7%B8%EB%A3%B9%ED%99%94-08ce98c4-0063-4d42-8ac7-8278c49e9aff.
(3) pandas DataFrame 완벽 가이드. https://www.databricks.com/kr/glossary/pandas-dataframe.

과몰입하는 남자

원하는 열 그룹 후 3시그마 그리기

+ Recent posts

티스토리툴바