전체 글(53)
-
파이썬 Pandas 기초부터 심화까지 - 1 (인덱싱, loc, 결측치)
오늘은 데이터 프레임을 다루는 대표적인 파이썬의 라이브러리인 Pabdas에 대해 공부해 보려고 한다. PANDAS 기본 학습을 위해 pandas에서 기본적으로 제공하는 train.csv 파일을 이용해 보자. df = pd.read_csv('train.csv') #train.csv가 위치한 경로 지정 !! df df에 csv파일을 읽어 저장해 주면 600행 12열의 데이터 프레임 형태로 출력할 수 있다. 다음은 인덱싱과 슬라이싱에 대해 알아보자. df.loc[0] # Series 형태 df.loc[[0]] # DataFrame 형태 loc[0]를 통해 정보를 불러오면 가장 첫 번째 행을 불러올 수 있고, loc[[0]]을 사용하면 그 행을 데이터프레임 형태로 확인할 수 있다. df['title'] 열에 대..
2023.05.11 -
머신러닝 분류 모델 평가 지표에 대한 모든 것
분류 모델 평가 분류 모델이란? 로지스틱 회귀는 '회귀'라는 이름을 가지고 있지만 일반적인 회귀 모형이 '예측'이라는 역할을 하는 대신 '분류'를 하는 모델이다. 분류(Classification)란 학습 데이터가 주어졌을 때, 해당 학습 데이터의 독립변수들을 이용하여 클래스를 예측하는 것이다. 즉 입력값을 입력하면 특정한 출력값을 배출하는 지도 학습(Supervised Learning)이다. 분류 모델의 성능 평가 모델이 분류를 얼마나 잘 수행했는지를 평가하는 여러 가지 방법과 지표가 있다. 그 내용에 대해 알아보자. 정확도 (Accuracy) 정확도 = (클래스를 올바르게 분류한 데이터의 수) / 전체 데이터의 수 정확도는 일반적으로 가장 많이 사용하는 기준이지만 클래스가 애초에 불균등한 상태라면 문제..
2023.05.07 -
PYTHON - 생산 및 운영 관리 OR-Tool 활용 Goldratt Problem 풀기
Godratt Problem은 가장 기초적인 LP(Linear Problem)이다. 조건들이 간단하기에 대수적 모형을 만드는 과정은 생략하고 엑셀로만 해결하던 LP문제의 최적해를 파이썬 OR-Tool을 이용해 구해보고자 한다. Godratt Problem 파이썬 OR-Tool 풀이 방법 !pip install ortools #OR-tool 설치 from ortools.linear_solver import pywraplp def main(): solver = pywraplp.Solver.CreateSolver('SCIP') p = solver.IntVar(0, 100, 'xp') q = solver.IntVar(0, 50, 'xq') solver.Add(15*p + 10*q
2023.03.26 -
[SQL] TIL 2- SQL 기본적인 함수들 익히기
1. CONCAT(), CONCAT_WS() 여러모로 쓸모가 많을것 같은 함수였다. CONCAT()과 CONCAT_WS()은 간단하게 말하면 칼럼의 내용을 이어주는 함수라고 할 수 있다. 차이점은 CONCAT_WS()는 내용을 이어줄 매개체를 직접 설정해 줄수 있다는 것이다. 예를 들면 CONCAT_WS('-', '안녕', '하세요') 라고 입력시 안녕-하세요로 출력된다. SELECT EmployeeID AS '고객아이디', CONCAT_WS('-', LastName, FirstName) as '고객이름', Notes as '이력' FROM Employees WHERE Notes Like '%econo%' Employees 테이블에서 LastName 컬럼과 FirstName 컬럼의 내용들을 '-'로 묶어..
2023.03.09 -
[SQL] TIL 1 - SQL 기본 다루기
SQL은 데이터베이스를 다루기 위해서 필수적인 도구이다. 오늘은 SQL의 전반적인 기능을 훑어보려고 한다. SQL 기본 다루기 1. SELECT의 전반적인 기능 다루기 SELECT CustomerID AS 'ID', CustomerName AS '고객이름', City AS '도시', Country AS '나라' WHERE City = 'London' or WHERE Country = 'Mexico' ORDER BY CustomerName LIMIT 5 FROM Customers; Customers 테이블에서 City가 London이거나 Country가 Mexico인 사람들을 CustomerName을 기준으로 5개 출력하기위한 코드를 작성하였지만, 에러가 났다. SELECT CustomerID AS 'ID..
2023.01.30