목록분류 전체보기 (102)
DeseoDeSeo
request (url을 통해서 특정페이지를 요청함)------> client -------------------------------------------------------------------------------------------------------- server DAO를 통해서 DB안에 넣음. client가 로그인(loginservice) 요청하면 servlet -> DAO를 통해서 DB의 데이터와 맞는지 체크함. client가 회원정보수정(updateService) 요청하면 servlet -> DAO를 통해서 DB의 내용을 바꿈. DAO는 model servlet은 controller (중간에서 함.) joinservice, login service.. 등 은 view임. view ->..
스무고개 하듯이 예/ 아니오 질문을 반복하며 학습. 특정 기준(질문, 문제 데이터(특성)에 따라 데이터를 구분하는 모델 분류와 회귀에 모두 사용 가능. root node -> decision node -> leaf node (제일 최상위 질문, 뿌리 노드 ) -> ( 중간 질문, 결정노드 ) -> ( 잎사귀 노드) 깊이 = depth ( 깊이가 깊다 = 규칙이 많다 = 과대 적합? ) Decision boundary (= 결정 경계) : 불순도가 낮을 수록 더 좋은 의사결정나무 최적의 의사결정 나무 : 불순도가 낮아지는 방향 (= 동일한 카테고리끼리 있음.) 불순도 측정 : 지니계수(Gini index)
목표 버섯의 특징을 활용해 독/식용 이진 분류하기 Decision Tree 모델 활용하기 Decision Tree 학습현황 시각화 & 과대적합 제어 (하이퍼 파라미터 튜닝) 특성의 중요도를 파악, 확인하기 (불순한 정도를 파악하는 것: 지니 불순도) import pandas as pd import numpy as np import matplotlib.pyplot as plt # train, test 랜덤 샘플링 도구 from sklearn.model_selection import train_test_split # knn 모델 : from sklearn.neighbors import KNeighborsClassifier # tree 분류 모델 from sklearn.tree import DecisionTr..
Perdonar es poder ir al pasado y volver ileso Perdonar : 용서하다 es : Ser의 3인칭 단수 현재 poder: 할수 있다 ir : 가다 al : a + el pasado :과거 y : 그리고 volver : 돌아오다. ileso: 다치지 않은 용서하는 것은 과거로 가서 상처를 입지 않고 돌아올 수 있다는 것이다.
크기확인 print('훈련용 셋: ', x_train.shape, y_train.shape) print('테스트용 셋: ', x_test.shape, y_test.shape) 문제 개수 만큼 답 개수가 셋팅 되었는가 확인해야함 훈련용 특성의 개수 만큼 테스트용 특성 개수가 셋팅 되었는지 확인해야함. 분리된 데이터 클래스별 개수 확인하기 : 7:3 비율로 데이터 분리, 모델 입장에서 학습을 잘 하려면 다양한 데이터가 필요함. pd.Series(y_train).value_counts() np.unique(y_train, return_counts=True)[1]/112 series 는 1차원 배열이다. np.unique => 배열에서 고유한 값을 찾아냄. ( 2 개의 배열 반환) : 1. 고유한 값들의 배열,..
모델의 신뢰도를 측정하고 성능을 확인하기 위한 개념들 목표 : 일반화 구간을 찾는 것 !! 과대적합 : train학습을 너무 맞춰서 하다보니 규칙이 복잡해져서 test에 대한 성능은 떨어지는 상태 (test예측을 못하는 상태) 과소적합: train 학습이 제대로 되지 않아서 test성능도 떨어지는 상태 (예측을 못하는 상태) 일반화: train에 대한 학습도 적당히 잘되고 test대한 성능도 어느정도 잘 나오는 상태 => 어떤 데이터가 들어와도 예측이 잘 됨. KNN( K-nearest Neighbors) : k-최근접 이웃 알고리즘 , k개의 최근접 이웃 알고리즘 유사한 점이 서로 가까이에서 발견될 수 있다는 가정. 분류와 회귀에 모두 사용 가능. 특정 데이터 포인트와 가장 가까운 이웃 데이터 포인트를..