목록분류 전체보기 (102)
DeseoDeSeo
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/8oyTP/btsr6ZBf5zU/irUh3LvOsMXEWagMvEcank/img.png)
Q :500명의 키와 몸무게, 비만도 라벨을 이용하여 비만을 판단하는 모델을 만들어보자. 머신 러닝 과정을 이해해보자. Panda 및 시각화 import pandas as pd import matplotlib.pyplot as plt 모델 관련해서 불러오는 코드 knn모델 불러오기, 측정 도구 불러오기 from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score 데이터 준비(수집) : ./ 하면 machine learning 폴더임을 알려줌, data = pd.read_csv('./Data/bmi_500.csv', index_col ='Label') data 데이터 정보 확인 : 전체 행, 컬럼의 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/QkKqw/btssfSN1JAc/PnjLKcPaFjF7i7J1CPyZpK/img.png)
탐색적 데이터 분석 (Exploratory Data Analysis , EDA) : 수집한 데이터를 다양한 각도에서 관찰하고 이해하는 과정 ex) ▽ a컬럼 int 데이터 , 0/1 ▽ b컬럼 int데이터, 0/1 ▽ a and b컬럼 int데이터, 0/1 ▽ 결측치 x, 이상치 x 을 확인함. 모델 불러오기 : 분류하는 모델 중 knn 모델을 불러오기 : 머신러닝에 사용되는 도구를 담은 패키지, - 지도/ 비지도 / 강화, 분류/회귀, 평가 공식(기능), 데이터 전처리 하는 기능 들도 담겨있음. from sklearn.neighbors import KNeighborsClassifier from sklearn.met..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bYyqC3/btsrZxkAy52/0rOM2Saq2RYiQkdAHrocvK/img.png)
페이지에 요청하기 위한 용도 import requests as req html 데이터를 만들기 위한 용도 from bs4 import BeautifulSoup as bs Response 403 출력되면 head 추가하기! 네트워크 > f5> 유형이 document찾아서 가장 하단의 user-agent복붙 > head = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'} url ='https://review4.cre.ma/bodyluv.kr/products/reviews?product_code=4..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bg7zw3/btsr9NzgSuI/fWbzC0OwEBS1XLEmtFm9bK/img.png)
- 훈련 데이터와 테스트 데이터 이해하기 - 머신러닝의 일련의 과정 이해하기 - AND연산의 결과를 도출하는 머신러닝 모델 학습하기 데이터 준비 : And 연산 데이터 생성하기 방법1 : 이중리스트[[ ]] 방법2 : 딕셔너리{컬럼명: [ 0,0,,,], 컬럼명:[...],..} data_dic={'A':[0,0,1,1,1,0,1,0], 'B':[0,1,0,1,0,0,1,1], 'A and B':[0,0,0,1,0,0,1,0]} df =pd.DataFrame(data_dic) df 데이터 전처리 ☆ numpy -> 2차원 배열[행] , 배열[행][열], 배열[행,열] ☆ pandas -> 2차원 배열(=DataFrame), DF[행,열]하면 오류 나서 DF.loc[행, 열], df.ilo..
입력된 데이터를 기반으로 기계가 스스로 학습하여 인공지능 성능을 향상시키는 기술 방법 입력 데이터를 이용하여 특성과 패턴을 찾아 학습하고 예측을 수행하는 것. 데이터에 맞춰서 학습하면 -> 모델(알고리즘) 머신러닝이 유용한 분야 - 대량의 데이터에서 통찰을 얻어야하는 문제 - 새로운 데이터에 적응해야하는 유동적인 환경. 1. 지도학습 ( = 교사학습 ) = Supervised Learning) : 데이터에 대한 label(명시적인 답)이 주어진 상태에서 학습시키는 방법( 설명하는 데이터= 문제, 답 데이터) 분류 ( Classification) - 미리 정의된 여러 클래스 레이블(카테고리) 중 하나를 예측하는 것 - 속성값을 입력, 클래스 값을 출력으로 하는 모델 - 이진 분류, 다중 분..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/ra5ie/btsr66licvy/S5VW0FgW5wvFBKH8kNYO20/img.png)
import requests as req from bs4 import BeautifulSoup as bs head = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'} 1. req를 통해서 멜론차트 정보를 요청 res1 = req.get("https://www.melon.com/chart/index.htm", headers = head) res1 2. bs을 통해서 html데이터로 변형 soup = bs(res1.text, "lxml") 3. 노래제목 수집 song = soup.select("#lst50 > td:nth-chi..