[머신러닝] 로지스틱 회귀(logistic regression)
로지스틱 회귀(logistic regression) 로지스틱 회귀란? 로지스틱 회귀 는 이름은 회귀이지만 분류 모델 이다. 로지스틱 회귀는 선형 회귀 와 마찬가지로 선형 방정식 을 하지만 선형 회귀와 다르게 시그모이드 함수 나 소프트맥스 함수 를 사용하여 클래스 를 예측한다. 로지스틱 회귀로 이진 분류 할 때는 시그모이드 함수 를, 다중 분류 할 때는 소프트맥스 함수 를 사용한다. 데이터 준비 데이터를 준비해 보자. 아래 링크 csv 파일을 사용한다. https://bit.ly/fish_csv_data csv 파일 내용의 일부다. import pandas as pd # 데이터 가져오기 ------------------------------------------------------------------------- fish = pd.read_csv( 'https://bit.ly/fish_csv_data' ) # 입력 데이터 준비 fish_input = fish[[ 'Weight' , 'Length' , 'Diagonal' , 'Height' , 'Width' ]].to_numpy() print (fish_input) # 타깃 데이터 준비 fish_target = fish[ 'Species' ].to_numpy() print (fish_target) # 훈련 , 테스트 세트 나누기 from sklearn.model_selection import train_test_split train_input, test_input, train_target, test_target = train_test_split( fish_input, fish_target, random_state = 42 ) # 데이터 전처리 ( 표준화 ) from sklearn.preprocessing import StandardScaler s