목록분류 전체보기 (102)
DeseoDeSeo

from selenium import webdriver as wb from selenium.webdriver.common.by import By import time from selenium.webdriver.common.keys import Keys # 파일 시스템을 위한 라이브러리(삭제, 생성) import os # 이미지의 경로를 실제 파일로 저장 from urllib.request import urlretrieve 1. 바탕화면에 폴더를 생성 : 바탕화면에 이미지라는 폴더가 없다면 바탕화면에 이미지라는 폴더를 만들어라. (경로에 원화표시가 있다면 슬래시/로 바꿔줘야한다. ) ◎ is dir => is directory ◎ rm dir => remove directory if not os.path...

from selenium import webdriver as wb from selenium.webdriver.common.by import By import time from selenium.webdriver.common.keys import Keys 1. 크롬 드라이버를 실행해서 네이버 지도 사이트로 이동 driver =wb.Chrome() driver.get("https://map.naver.com/p/") 2. 검색창에 검색어를 입력 : 네이버 지도에서는 ID값이 화면창에 따라서 매번 달라짐. 그래서 class name 사용함. ( = 검색창의 구분자인 id값이 실행 할 때 마다 변한다. ) => 그래서 다른 선택자를 활용해야한다. search = driver.find_element(By.CSS_S..

목표설정 - 붓꽃의 꽃잎의 길이/너비, 꽃받침의 길이/너비 특정 활용해서 3가지 품종을 분류하는 모델을 만들어보자. - knn 모델의 이웃의 숫자를 조절해보자. (k개수를 조절 => 하이퍼 파라미터 튜닝) import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier# 분류 from sklearn.metrics import accuracy_score # 정확도 측정 # train, test를 분리하는 도구 from sklearn.model_selection import train_test_split 붓꽃 데이터 불러오기 from..

브라우저 및 컴퓨터용 키보드. 선택자의 구분자 역할 하는 라이브러리 불러오기 from selenium import webdriver as wb from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.by import By 1. 브라우저를 실행하고 -> 한솥 사이트로 이동 driver = wb.Chrome() driver.get("https://www.hsd.co.kr/menu/menu_list") 2. 상품이름 수집 title = driver.find_elements(By.CSS_SELECTOR,".h.fz_03") for i in title: print(i.text) 3. 상품가격 수집 price = driver.fi..

브라우저를 자동제어하여 크롤링을 자동화 시키는 라이브러리 - 동적 크롤링을 진행 할 때 사용. - 반드시 한번 설치가 필요. # 라이브러리 설치 pip => 파이썬의 모든 라이브러리를 설치할 수 있는 곳. !pip install selenium # 셀레니움 최신버전 업데이트 !pip install -U selenium # 브라우저의 역할을 해주는 라이브러리 from selenium import webdriver as wb #컴퓨터용 키보드 불러오기 from selenium.webdriver.common.keys import Keys # 선택자의 구분자 역할을 해주는 라이브러리 from selenium.webdriver.common.by import By 1.크롬창을 실행 = web드라이버에게 크롬을 ..
pandas에서 loc, iloc 인덱서를 사용해야 가능 df.loc[행,열] df.iloc[행,열] df.loc[행], df.loc[값:값] => df.loc[행:행] df.iloc[행], df.iloc[값:값] => df.iloc[행:행] 열 데이터 접근 df.loc[:,열], df.loc[:,열:열] df.iloc[:,열 인덱스], df.iloc[:,열 인덱스:열 인덱스] 행, 열 접근 df.loc[시작행:끝행, 시작열: 끝열] df.iloc[시작행 인덱스:끝행 인덱스, 시작열 인덱스: 끝열 인덱스] 인덱싱 설명 numpy가 2차원일때: import numpy as np arr =np.arange(0,10).reshape(2,5) display(arr) #출력하기 위해서 display: 기존의 자료..