일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 썸머스쿨예약
- 전주독서실
- Python
- 코딩
- 문제풀이
- 광주직업학교
- ui
- 패스트캠퍼스
- 파이썬
- 빅데이터
- 자바페스티벌
- 머신러닝
- 스마트인재개발원
- iOS개발강의
- K디지털크레딧
- 딥러닝
- ux
- java
- 바이트디그리
- 코린이
- 자바
- jsp
- 덴디컨설팅
- 내일배움카드
- 메시지시스템
- 서블릿
- 리스트
- 스프링
- 전주스터디카페
- 자바스크립트
- Today
- Total
목록빅데이터 분석 서비스/머신러닝 (6)
멀리 보는 연습
오늘의 TMI는 코로나19 백신 1차를 맞았다는 것이다. 12시가 넘었으니 어제가 되었지만, 나는 화이자 백신을 맞았다. 주변에서 팔을 못쓰게 된다는 짤을 많이 본 상태라서 겁을 많이 먹고 맞고 왔는데, 생각보다 팔팔하다. 내일 아침이 무서울뿐.. 나의 자랑(?) 중 하나가 감기에 잘 걸리지 않는다는 것인데, 내가 그만큼 면역력이 좋다고 믿고 싶고, 부디 내일 아무 탈 없이 지나가길 바란다. 하하.. 다음 주부터는 IoT 수업이 진행됨에 따라 모두 오프라인 등원을 한다. 하지만 다 같이 수업을 들을 수는 없어서 공간을 나누어 2개 반으로 수업이 진행된다. 우리는 7층으로 쫓겨났다. 힝ㅠㅠ 뷰 맛집이라 나름 만족중.. 다음 주 수업을 편하게 들으려면 이번 주까지 배웠던 머신러닝+딥러닝을 복습해야 하는데, ..
4개월을 꽉 채웠다. 개강 초기에는 시간이 지나면 이 분야에 대해 자신감이 생길 줄 알았는데, 배울 수록 더 자신이 없어진다. 호호.. 앞으로 남은 2개월동안 더 열심히 해야겠다. 요즘은 머신러닝과 딥러닝을 거의 하루종일(?) 배우고 있는데, 물음표가 백만개는 떠다닌다. 뼛속부터 문과인 나에게 아주 큰 도전이다. 하루종일 뭔소린지 진짜 모르겠고요..? 아무튼 오늘 복습해볼 내용은 '보스턴 주택 값 예측' 이다. 두둥! import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets import load_boston # 보스턴 주택값 데이터 일단 필요한 툴들을 가져오고, data = load_boston(..
4번째 실습 버섯 데이터 분류. Decision Tree 알고리즘을 활용하여 진행하였고, 처음 접하는 알고리즘이다보니 트리의 최대 깊이, 노드의 최대 개수, 가지치기, 데이터 포인트 최소 개수 등 헷갈리는 개념이 많았다. 그래도 자주 접하다 보면 익숙해질 것이므로 크게 상심하지 말자! Decision Tree(결정트리)란? Tree를 만들기 위해 예/아니오 질문을 반복하며 학습 다양한 앙상블 모델이 존재 분류와 회귀에 모두 사용가능 타깃 값이 한개인 리프 노드를 순수노드라고 한다. 모든 노드가 순수 노드가 될때 까지 학습하면 복잡해지고 과대적합이 된다. 새로운 데이터 포인트가 들어오면 해당하는 노드를 찾아 분류라면 더 많은 클래스를 선택하고, 회귀라면 평균을 구한다. Decision Tree(결정트리) ..
머신러닝 5가지 실습을 마치고, 대략 2주동안 캐글 대회를 진행 중이다. 전자 상거래 물품 배송 예측(분류)을 주제로 진행하고 있는데, 종료되면 이에 대한 후기도 올릴 예정이다. 지금 심정은 굉장히.. 암울.. 멘붕..정도랄까.. 알파벳을 배우자마자 영어 작문을 하는 기분이다. 그래도 열심히 해봐야지.. 1.목표 - 붓꽃의 꽃잎 길이, 꽃잎 너비, 꽃받침 길이, 꽃받침 너비 특징을 활용해 3가지 품종을 분류해보자 import pandas as pd import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier # 하이퍼파라미터 from sklearn import metrics # 예측률 K-Nearest Neighbor..
머신러닝 2번째 실습인 bmi 체질량지수를 통한 실습. 막연하게 머신러닝을 생각했을 땐, 어떻게 학습을 시켜서 어떻게 예측하게 만드나 궁금했는데, 생각보다 간단하게 진행되었다. 바로 7:3으로 나눠서 7을 학습시키고 3을 예측하게 시키는 것! 이번 실습은 500명의 키와 몸무게를 통해서 진행했는데, 앞으로 규모가 더 커지면 500명은 아무것도 아닐 거라는 생각이 들었다. 01. 목표 (문제 정의) - 500명의 키와 몸무게, 비만도 라벨을 이용해 비만을 판단하는 모델을 만들어보자. import pandas as pd import matplotlib.pyplot as plt 02. 데이터 수집 - bmi500.csv 파일 형식의 데이터 파일 가져오기 data = pd.read_csv('data/bmi_50..
1차 프로젝트가 끝난 후 본격적으로 머신러닝을 배우고 있다. 실습 위주로 진행 중인데, 실습 내용을 복습할 겸 정리하면 좋을 것 같아서 하나하나 정리하면서 올려볼 예정이다. 오늘 복습해볼 내용은 서울시 구별 CCTV 현황 분석인데, 복습을 하다보니, 복습이 아니라 새롭게 공부하는 느낌이 들 정도로 유익하다는 생각이 들었다. 그만큼 수업 시간에 놓치는 게 많다는 점ㅠㅠ 하루에 8시간씩 계속 집중하면서 수업듣는 일이 얼마나 어려운지 실감하고 있다. 수료할 때까지 열심히 배워봐야 겠다. 서울시 구별 CCTV 현황 분석하기 - pandas, matplotlib 사용하기 - 서울시 각 구별 CCTV 현황 살펴보기 - 인구대비 CCTV 비율이 높거나 낮은 지역 알아보기 - 각 구별 CCTV 예측치 확인하고 그로부터..