[머신러닝] 다중 회귀
다중 회귀 다중 회귀란? 하나 의 특성으로 선형 회귀 모델 을 훈련 시키는 것을 선형 회귀 라고 부른다. 이때 여러개 의 특성을 사용하는 선형 회귀 를 다중 회귀(multiple regression) 라고 부른다. 선형 회귀(Linear Regression) 아래 마인드 맵에 나와있는 것 처럼 선형 회귀 는 지도 학습 의 대표적인 회귀 알고리즘 이다. (Machine Learning -> Unsupervised Learning -> Linear Regression) 선형 회귀 는 특성과 타깃 사이의 관계를 가장 잘 나타내는 선형 방정식을 찾는다. 특성 이 하나인 경우 어떤 직선을 학습하는 알고리즘이다. 특성 공학이란? 다중 회귀를 사용하기 위해서 3개의 특성(length, height, width)를 사용 할 거다. 이때 3개의 특성을 각각 제곱 하여 추가한다. 또한 각 특성을 서로 곱해서 새로운 특성을 만들 거다. 이처럼 기존 특성을 사용하여 새로운 특성을 만들어내는 작업을 특성 공학(feature engineering) 이라고 부른다. 데이터 준비 CSV 를 불러와서 3개의 특성을 준비하자. pandas 는 데이터 분석 라이브러리다. 넘파이와 비슷한 다차원 배열을 다룰 수도 있고 더 많은 기능을 제공한다. 또한 CSV 파일을 가져와 데이터 프레임 을 만들 수 있다. import pandas as pd df = pd.read_csv( 'https://bit.ly/perch_csv_data' ) perch_full = df.to_numpy() 아래 링크가 CSV 파일의 내용이다. https://raw.githubusercontent.com/rickiepark/hg-mldl/master/perch_full.csv 타깃 데이터