본문 바로가기
728x90
반응형

ML3

ML) KNN 이웃 알고리즘 (지도학습) 안녕하세요!! 후르륵짭짭 입니다. 처음으로 머신러닝 알고리즘에 대해서 알아보도록 하겠습니다. 사실 저도 초보자라,,,, 잘 모르지만 ㅎㅎㅎ 그래도 공부한 것을 공유한다 생각하고 귀엽게 봐주셨으면 합니다 ㅎㅎㅎ 이번에 실험으로 사용될 데이터는 저번 시간에 뽑아낸 농구선수의 데이터를 활용하겠습니다. ** KNN 이웃 알고리즘 이란 ** KNN 이웃 알고리즘은 가장 간단한 머신러닝 알고리즘 입니다. 그냥 간단하게 새로운 데이터가 들어 왔을 때, 기존의 훈련 데이터셋에서 가장 가까운 친구들로 정해주는 겁니다. 이것이 K-NN(near Neighbors) 알고리즘 입니다. KNN에는 회귀와 분류가 있는데, 저는 분류만 하도록 하겠습니다. 왜냐하면 회귀와 분류 모두 동일한 방식으로 사용되기 때문입니다. ** IMP.. 2020. 8. 8.
ML) Python으로 크롤링한 것을 엑셀로 만들기 안녕하세요!! 후르륵짭짭 입니다. 머신러닝에 대해서 오랜만에 포스팅 하는데요. (전공 분야는 아니라서,,,, 노력 중 입니다!) 이번에는 Python으로 웹 크롤링 한 것을 보기 쉽게 엑셀 파일로 만드는 방법을 해보도록 하겠습니다. 위와 같이 크롤링을 마쳤다면! 이제 엑셀로 만들어줘야 합니다! 엑셀로 만드는 방법은 어렵지 않아요! 일단 시작하기 전에 import pandas as pd 를 맨 위에 적어주세요! pandas 는 파이썬에서 엑셀 형식의 행과 열로 된 표 형태의 데이터들을 관리하는 라이브러리 입니다. 그냥 단순하게 파이썬에서의 엑셀로 보시면 될 것 같네요. data = pd.DataFrame(배열을 넣어주세요) 그리고 나서 data = pd.DataFrame(배열) 을 넣어주시면 됩니다. pd.. 2020. 7. 13.
ML) Python으로 HTML 파싱하기! 안녕하세요 민나상! 후르륵 짭짭 입니다. 오늘은 머신러닝을 하기 전 준비 단계인 데이터 수집 방법을 배워 볼려고 합니다. 머신 러닝을 공부하기 전에 일반적으로 데이터를 수집하고 그리고 그것을 파일 형태로 저장을 해야합니다. 그럼 Python으로 데이터를 수집하는 방법에 대해서 알아 보도록 합시다. 시작하기 앞서 HTML 파싱에 필요한 라이브러리인 BeautifulSoup를 설치해줘야합니다. Anaconda Prompt를 키시고 pip install beautifulsoup4 pip install requests 를 설치 해줍니다. 그리고 나서 Jupytor NoteBook을 키시고 파일을 생성한 뒤 이렇게 ** import ** 해주세요. import requests from bs4 import Beau.. 2020. 7. 1.
728x90
반응형