반응형 분류 전체보기22 [2024.08.02] 특성 공학과 규제 특성 공학과 규제 규제는 머신러닝 모델이 훈련 세트를 너무 과도하게 학습하지 못하도록 훼방하는 것을 말한다.(모델이 훈련 세트에 과대적합되지 않도록 만드는 것이다,) 선형 회귀 모델에 규제를 추가한 모델을 릿지와 라쏘 라고 한다.릿지 : 계수를 제곱한 값을 기준으로 규제 적용라쏘 : 계수의 절대값을 기준으로 규제 적용일반적으로 릿지를 조금 더 선호합니다. 릿지 회귀 릿지와 라쏘 모두 sklearn.linear_model 패지키 안에 있다.모델 객체를 만들고 fit()메서드에서 훈련한다음 score()메서드로 평가한다.from sklearn.linear_model import Ridgeridge = Ridge()ridge.fit(train_scaled, train_target)print(ridge.sco.. 2024. 8. 2. [2024.08.01] K-최근접 이웃 회귀, 선형 회귀, 다항 회귀, 다중 회귀 객체생성-> 훈련 Fit -> 평가scroe ->predict 반복중K-최근접 이웃 회귀 *주의 2개의 특성을 이용할때는 자연스럽게 열이 2개인 2차원 배열을 이용했으나, 특성이 1개일때는 수동으로 2차원 배열로 변경해주어야한다. 특성이 1개라 1차원인 상태 reshape() 메서드를 이용하여 2차원 배열로 변경해주었다 결정계수(R^2)K-최근접 이웃 회귀 알고리즘을 구현한 클래스는 KneighborsRegressor이다. from sklearn.neighbors import KNeighborsRegressorknr = KNeighborsRegressor()# k-최근접 이웃 회귀 모델을 훈련합니다knr.fit(train_input, train_target) 결정계수란?다음과 같이 점수가 나왔을.. 2024. 8. 1. [2024.07.31] Numpy를 이용한 배열의 처리 , 데이터 전처리 [문제] 데이터가 새로 들어왔을때, 해당 데이터와 가장 가까운 자료 5개의 거리를 구하여 표시해라.#거리 구하는 방법 : sqrt ( ( x-x1)^2 +(y-y1)^2 ) # 자료 49개로 가정.# 열을 추가해야 정렬을 하더라도 데이터가 모두 같이 움직인다.# 데이터가 리스트가 아니고 넘파이 데이터면 열 추가가 편하다-> import numpy as np 이용하자 test_data=[ [5,4,5] [6,6,10] [3,2,5]] for range(49) #반복하여 거리 구하자 dist_result.append() [내 코드]import matplotlib.pyplot as plt #matplotlib의 pylot 함수를 plt로 줄여서 사용 import numpy as np import ma.. 2024. 7. 31. [C++] 구조체와 클라스의 차이점 C++는 C 언어와의 호환성을 위해 구조체(Struct)를 지원한다. 구조체와 클라스는 큰 차이가 없으나 유일한 차이는구조체는 디폴트 접근지정이 public이고, 클라스의 디폴트 접근지정은 private이라는 점이다. struct Employee{ short id; int age; double wage;}; 2024. 7. 31. 이전 1 2 3 4 5 6 다음 반응형