목록Python (43)
DeseoDeSeo
입력된 데이터를 기반으로 기계가 스스로 학습하여 인공지능 성능을 향상시키는 기술 방법 입력 데이터를 이용하여 특성과 패턴을 찾아 학습하고 예측을 수행하는 것. 데이터에 맞춰서 학습하면 -> 모델(알고리즘) 머신러닝이 유용한 분야 - 대량의 데이터에서 통찰을 얻어야하는 문제 - 새로운 데이터에 적응해야하는 유동적인 환경. 1. 지도학습 ( = 교사학습 ) = Supervised Learning) : 데이터에 대한 label(명시적인 답)이 주어진 상태에서 학습시키는 방법( 설명하는 데이터= 문제, 답 데이터) 분류 ( Classification) - 미리 정의된 여러 클래스 레이블(카테고리) 중 하나를 예측하는 것 - 속성값을 입력, 클래스 값을 출력으로 하는 모델 - 이진 분류, 다중 분..
import requests as req from bs4 import BeautifulSoup as bs head = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'} 1. req를 통해서 멜론차트 정보를 요청 res1 = req.get("https://www.melon.com/chart/index.htm", headers = head) res1 2. bs을 통해서 html데이터로 변형 soup = bs(res1.text, "lxml") 3. 노래제목 수집 song = soup.select("#lst50 > td:nth-chi..
req : 파이썬에서 브라우저의 역할을 대신 함. 클라이언트(사용자) : 특정url에 정보를 요청 서버(웹페이지) : 요청받은 값에 대한 정보를 클라이언트에게 제공 - > 이미지, 동영상, 글자,화면이 html문서로 넘어옴. ( Python의 requests가 하는 건 중간에 넘어오고 있는 html문서 가져오기) import requests as req req 를 통해서 네이버 정보를 요청 ( 괄호 안에는 매개변수 = 무엇을 가지고 올지 적음) response : 응답 코드를 넘겨 받음. (200, 300 : 통신에 성공했습니다.) (400: 클라이언트 요청의 문제가 있다.) (500: 서버의 문제가 있다.) res = req.get("http://www.naver.com") # html의 코드가 넘어온..
- 광범위하게 분산된 방대한 양의 자료를 쉽게 볼 수 있도록 도표나 차트 등으로 정리하는 것. ( 산점도, 막대그래프. 원 그래프, 히스토그램..) import matplotlib.pyplot as plt y = [ 2, 4, 6 ] plt.plot(y) plt.show() x라는 변수 축 범위 지정하지 않으면 자동으로 지정됨. x와 y의 변수개수가 같지 않으면 오류가 난다. plot- 선 그래프(Line plot) 비슷해보이지만 x축의 범위가 다르다. y = [ 2, 4, 6 ] x= [1,2,3] plt.plot(x,y) plt.show() line style (= ls) character description - solid line style -- Dashed line styl..
import pandas as pd c15 = pd.read_csv('2015.csv', encoding='euc-kr', index_col='관서명') c16 = pd.read_csv('2016.csv', encoding='euc-kr', index_col='관서명') c17 = pd.read_csv('2017.csv', encoding='euc-kr', index_col='관서명') c15[c15['구분']=='발생건수'].sum(axis=1) 년도별 발생 건수의 합계 total15 =c15.loc[c15['구분']=='발생건수','살인':].sum(axis=1) total15 total16 =c16.loc[c16['구분']=='발생건수','살인':].sum(axis=1) total16 drop 실행..
concat (= 물리적인 느낌, 인덱스나 컬럼으로 양 옆이나 위 아래로 붙임 ) merge ( = 공통적인 데이터를 기준으로 병합) import pandas as pd df1 = pd.DataFrame({'a':['a0','a1','a2','a3'], 'b':['b0','b1','b2','b3'], 'c':['c0','c1','c2','c3']}, index = [0,1,2,3]) df2 = pd.DataFrame({'a':['a2','a3','a4','a5'], 'b':['b2','b3','b4','b5'], 'c':['c2','c3','c4','c5'], 'd':['d2','d3','d4','d5']}, index = [2,3,4,5]) df3 = pd.DataFrame({'a':['a3','a4'..