2023. 5. 29. 23:33ㆍDATA PROGRAMMING/PYTHON
교수님이 시험 결과를 발표하셨는데 점수만 공개하시고 다른 추가적인 정보는 공개하지 않으셨다. 학우들의 전체 성적만 나와 있는 상황에서 시험이 어땠는지 파악하기 위해 파이썬을 활용해 보도록 하자!
파이썬으로 평균, 표준편차, 백분위 구하기 (실습)
본 글에서 수행할 내용은 기초적인 파이썬 문법만 익히고 있다면, 쉽게 따라올 수 있는 난이도이다.
교수님께서 올려주신 시험 성적 자료에는 말 그대로 학번과 시험 성적만 포함하고 있다. 대충 눈대중으로 시험을 잘 봤는지 아닌지 파악할 수 있지만, 정확한 나의 위치는 알기 어렵고 결국 최종 성적은 내가 상위 몇프로 안에 들었는지에 의해 결정되므로 내가 정확히 어느 정도 위치인지가 궁금했다.
다행히도 pdf 파일로 올라온 파일은 드래그가 가능했다.
파이참에 복사 붙여넣기를 해보니 위 사진처럼 학년-점수-학번 순서로 연속해서 쓰였다. 나는 이 중 점수들만 뽑아서 써야하기 때문에 위 정보를 문자열로 저장한 이후 split 함수를 통해 리스트에 저장했다.
total_list = total.split()
이렇게 저장하면 학번과 학년, 학번이 모두 섞인 total 리스트가 완성된다. 이 리스트에서 점수 데이터만 뽑아주기 위해 for 문을 통해 두 자리 혹은 한 자리의 값들을 따로 리스트에 저장해 준다.
score = []
for i in range(len(total_list)):
if len(total_list[i]) == 2 or len(total_list[i]) == 1:
score_1 = int(total_list[i])
score.append(score_1)
이렇게 하면 점수만을 포함한 리스트가 완성된다. 이제 각종 함수를 통해 내가 알고 싶은 값들을 확인해 보자.
print(np.mean(x))
print(np.std(x))
print(np.percentile(x,80))
나는 시험의 평균과 표준편차 그리고 상위 20%의 점수가 몇 점인지 알고 싶었다.
평균은 45점, 표준편차는 22점, 상위 20%의 점수는 64.8점 정도였다. 내 점수가 69점 정도이니 확실히 A+ 안정권에 있는 성적이란 것을 확인할 수 있었다. 눈대중으로 대충 확인하는 것 보다 확실하게 통계치를 내서 확인하니 막연한 불안함은 완전히 사라졌다. 코딩을 배운 걸 실생활에 적용함으로써 코딩이 얼마나 편리한 기술인지 새삼 다시 느끼게 됐다.
'DATA PROGRAMMING > PYTHON' 카테고리의 다른 글
[Python] Class의 정확한 이해와 사용법 (0) | 2023.09.13 |
---|---|
파이썬 NUMPY 이미지 파일 색깔 수정하 (0) | 2023.08.03 |
[파이썬] 클래스가 불균형한 데이터 머신러닝 분류 모델 실습 (0) | 2023.06.04 |
파이썬 Pandas 기초부터 심화까지 - 1 (인덱싱, loc, 결측치) (0) | 2023.05.11 |
PYTHON - 생산 및 운영 관리 OR-Tool 활용 Goldratt Problem 풀기 (0) | 2023.03.26 |