분류 전체보기(91)
-
재귀 조인의 사용
문제 내가 작성한 코드 -- 코드를 입력하세요 SELECT orderNo, status FROM s_orders WHERE orderNo = ANY ( SELECT orderNo FROM s_orderDetails WHERE (productCode in ('S10_1678')) AND (productCode in ('S10_4698')) GROUP BY orderNo ) 이 코드의 결과엔 아무 튜플도 포함되지 않았다. 이유는 무엇일까? productCode가 두 개의 값 모두인 주문을 찾으려면, 해당 주문의 상세 내역에서 productCode가 두 개의 값 중 하나씩 포함되는지 확인해야 하지만, 내 코드에서 서브쿼리의 WHERE 절이 제대로 작동하고 있지 않은것이다. 이에 productCode에 두개의 ..
2023.08.12 -
파이썬 NUMPY 이미지 파일 색깔 수정하
문제: 이미지 픽셀을 변경해주는 함수를 제작해봅시다. 이미지를 Array로 변환합니다. 주어진 시작 좌표와 가로, 세로 길이만큼 원하는 색상으로 변경합니다. 값을 수정한 Array를 이미지로 만들어서 반환합니다. modify_image() 매개변수 이미지: image: PIL.Image() 시작 x좌표: x: int 시작 y좌표: y: int 가로 길이: width: int 세로 길이: height: int 변경할 색상: color: List[int], 반환값 픽셀 변경을 진행한 이미지 내가 처음 작성한 코드 def modify_image(image,x,y,width,height,color) : image_array = np.array(image) image_array[x:x+width][y:y+heig..
2023.08.03 -
SQL 관계 대수식 작성 연습
학과가 ‘컴퓨터’이고, 학년이 3학년인 학생의 학번과 이름을 검색하세요. 학수번호가 ‘C413’인 과목을 등록하여, 성적 ‘A’를 받은 학생의 이름을 검색하세요. ‘Database’ 과목을 등록한 학생의 이름을 검색하세요. ‘Database’ 과목을 등록하여, 성적 ‘A’를 받은 학생의 이름을 검색하세요. ‘Database’와 ‘화일처리’ 과목을 같이 수강한 학생의 학번을 검색하세요. ‘컴퓨터’ 학과의 3학년 학생들 중에 ‘Database’와 ‘화일처리’을 같이 수강한 학생의 학번을 검색하세요. 학수번호가 ‘C413’인 과목을 등록하지 않은 학생의 이름을 검색하세요. ‘Database’ 과목의 기말시험 평균은? 각 학생의 학번과 기말시험 평균을 구하세요. 단 휴학생(수강 등록을 하지 않은 학생)도 포함하..
2023.07.11 -
오버샘플링을 통해 불균형 데이터를 처리, 앙상블 모델로 이진 분류 (오버피팅 문제 처리)
이번 글에서는 과거에 다뤘던 데이터를 조금 더 발전된 방식으로 이진 분류를 해보고자 한다. 문제점에 대해서 짚어 보고 그 부분을 커버하는 모델을 만드는 과정을 설명한 생각이다. [파이썬] 클래스가 불균형한 데이터 머신러닝 분류 모델 실습 오늘은 학교 실습 시간에 주어진 데이터를 분류하는 모형을 만들어 보려고 한다. 데이터에 대한 정보를 보고 분류 모델을 설정할 전략을 짜고 실제로 코드를 작성하여 실습하고 수정해 나가는 dd.honeyreviewer.com 윗글은 단순 오버샘플링을 통해 클래스 불균형을 해결한 이후에 각종 분류모델을 앙상블 하여 높은 f1-score를 얻은 과정을 담은 글이다. 위 모델의 문제점은 test 데이터를 통해서는 좋은 성능을 보였지만, 실제 데이터에서는 그 성능이 떨어지는 모습을..
2023.06.20 -
[파이썬] 클래스가 불균형한 데이터 머신러닝 분류 모델 실습
오늘은 학교 실습 시간에 주어진 데이터를 분류하는 모형을 만들어 보려고 한다. 데이터에 대한 정보를 보고 분류 모델을 설정할 전략을 짜고 실제로 코드를 작성하여 실습하고 수정해 나가는 과정에 대해서 다뤄 보겠다. 불균형한 클래스의 데이터 머신러닝 분류 모델 데이터 확인 Feature(입력 변수)가 1,000개, Train set의 두 클래스 원소의 개수가 10배 정도 차이 나는 데이터다. 우선 데이터를 보고 파악한 내용은 입력변수가 매우 많다는 것과, 클래스가 불균형하다는 것이다. 많은 입력변수를 모두 과하게 사용하려다 보면 오버피팅이나 시간이 너무 오래 걸린다는 문제점이 생길 수 있고, 클래스가 불균형하다면 정확도는 높게 나와도 Recall이나 Precision 값이 낮게 나올 수도 있다. 게다가 위 ..
2023.06.04 -
파이썬을 통해 간단하게 학교 성적 평균, 표준편차, 백분위 구하기
교수님이 시험 결과를 발표하셨는데 점수만 공개하시고 다른 추가적인 정보는 공개하지 않으셨다. 학우들의 전체 성적만 나와 있는 상황에서 시험이 어땠는지 파악하기 위해 파이썬을 활용해 보도록 하자! 파이썬으로 평균, 표준편차, 백분위 구하기 (실습) 본 글에서 수행할 내용은 기초적인 파이썬 문법만 익히고 있다면, 쉽게 따라올 수 있는 난이도이다. 교수님께서 올려주신 시험 성적 자료에는 말 그대로 학번과 시험 성적만 포함하고 있다. 대충 눈대중으로 시험을 잘 봤는지 아닌지 파악할 수 있지만, 정확한 나의 위치는 알기 어렵고 결국 최종 성적은 내가 상위 몇프로 안에 들었는지에 의해 결정되므로 내가 정확히 어느 정도 위치인지가 궁금했다. 다행히도 pdf 파일로 올라온 파일은 드래그가 가능했다. 파이참에 복사 붙여..
2023.05.29