목록Python (43)
DeseoDeSeo
브라우저를 자동제어하여 크롤링을 자동화 시키는 라이브러리 - 동적 크롤링을 진행 할 때 사용. - 반드시 한번 설치가 필요. # 라이브러리 설치 pip => 파이썬의 모든 라이브러리를 설치할 수 있는 곳. !pip install selenium # 셀레니움 최신버전 업데이트 !pip install -U selenium # 브라우저의 역할을 해주는 라이브러리 from selenium import webdriver as wb #컴퓨터용 키보드 불러오기 from selenium.webdriver.common.keys import Keys # 선택자의 구분자 역할을 해주는 라이브러리 from selenium.webdriver.common.by import By 1.크롬창을 실행 = web드라이버에게 크롬을 ..
pandas에서 loc, iloc 인덱서를 사용해야 가능 df.loc[행,열] df.iloc[행,열] df.loc[행], df.loc[값:값] => df.loc[행:행] df.iloc[행], df.iloc[값:값] => df.iloc[행:행] 열 데이터 접근 df.loc[:,열], df.loc[:,열:열] df.iloc[:,열 인덱스], df.iloc[:,열 인덱스:열 인덱스] 행, 열 접근 df.loc[시작행:끝행, 시작열: 끝열] df.iloc[시작행 인덱스:끝행 인덱스, 시작열 인덱스: 끝열 인덱스] 인덱싱 설명 numpy가 2차원일때: import numpy as np arr =np.arange(0,10).reshape(2,5) display(arr) #출력하기 위해서 display: 기존의 자료..
Q :500명의 키와 몸무게, 비만도 라벨을 이용하여 비만을 판단하는 모델을 만들어보자. 머신 러닝 과정을 이해해보자. Panda 및 시각화 import pandas as pd import matplotlib.pyplot as plt 모델 관련해서 불러오는 코드 knn모델 불러오기, 측정 도구 불러오기 from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score 데이터 준비(수집) : ./ 하면 machine learning 폴더임을 알려줌, data = pd.read_csv('./Data/bmi_500.csv', index_col ='Label') data 데이터 정보 확인 : 전체 행, 컬럼의 ..
탐색적 데이터 분석 (Exploratory Data Analysis , EDA) : 수집한 데이터를 다양한 각도에서 관찰하고 이해하는 과정 ex) ▽ a컬럼 int 데이터 , 0/1 ▽ b컬럼 int데이터, 0/1 ▽ a and b컬럼 int데이터, 0/1 ▽ 결측치 x, 이상치 x 을 확인함. 모델 불러오기 : 분류하는 모델 중 knn 모델을 불러오기 : 머신러닝에 사용되는 도구를 담은 패키지, - 지도/ 비지도 / 강화, 분류/회귀, 평가 공식(기능), 데이터 전처리 하는 기능 들도 담겨있음. from sklearn.neighbors import KNeighborsClassifier from sklearn.met..
페이지에 요청하기 위한 용도 import requests as req html 데이터를 만들기 위한 용도 from bs4 import BeautifulSoup as bs Response 403 출력되면 head 추가하기! 네트워크 > f5> 유형이 document찾아서 가장 하단의 user-agent복붙 > head = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'} url ='https://review4.cre.ma/bodyluv.kr/products/reviews?product_code=4..
- 훈련 데이터와 테스트 데이터 이해하기 - 머신러닝의 일련의 과정 이해하기 - AND연산의 결과를 도출하는 머신러닝 모델 학습하기 데이터 준비 : And 연산 데이터 생성하기 방법1 : 이중리스트[[ ]] 방법2 : 딕셔너리{컬럼명: [ 0,0,,,], 컬럼명:[...],..} data_dic={'A':[0,0,1,1,1,0,1,0], 'B':[0,1,0,1,0,0,1,1], 'A and B':[0,0,0,1,0,0,1,0]} df =pd.DataFrame(data_dic) df 데이터 전처리 ☆ numpy -> 2차원 배열[행] , 배열[행][열], 배열[행,열] ☆ pandas -> 2차원 배열(=DataFrame), DF[행,열]하면 오류 나서 DF.loc[행, 열], df.ilo..