전체 글 34

선형 회귀 (Linear Regression)

*해당 포스팅은 핸즈온 머신러닝(2판) 교재를 공부하며 작성한 글입니다. 안녕하세요! 오늘은 머신러닝의 대표적인 지도학습의 회귀 중 선형 회귀에 대해 알아보겠습니다. 1. 선형 회귀 1-1. 경사 하강법 1-1-1. 학습률 1-1-2. 과정 1-1-3. 경사 하강법의 종류와 문제점 1-2. 규제가 있는 선형 모델 1-3-1. 릿지 회귀 1-3-2. 라쏘 회귀 1-3-3. 엘라스틱넷 1. 선형 회귀 회귀는 지도학습인데 지도학습이란 훈련 데이터로부터 하나의 함수를 유추해내는 방법입니다. 그중 선형 회귀란 데이터들을 가장 잘 대변할 수 있는 "직선"을 찾아 새로운 데이터 값을 넣었을 때의 결괏값을 예측할 수 있도록 하는 것입니다. 이 선형 함수 모델 (초록 점선) 의 식은 다음과 같습니다. H(x)=wx+b ..

머신러닝 2021.03.13

사이킷런 (Scikit-Learn) : 파이썬의 대표적인 머신러닝 패키지

*해당 포스팅은 파이썬 머신러닝 완벽 가이드(권철민 지음) 교재를 공부하며 작성한 글입니다. 오늘은 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 사이킷런의 주요 모듈을 알아보고 그 중 model_selection 모듈과 preprocessing 모듈에 대해 자세히 알아보겠습니다. 데이터 세트는 사이킷런에 내장된 데이터 세트를 사용하였고 알고리즘도 사이킷런의 머신러닝 알고리즘을 사용했습니다. 1. 사이킷런의 주요 모듈 2. model_selection 모듈 2-1. train_test_split() 2-2. 교차 검증 2-3. GridSearchCV 3. preprocessing 모듈 3-1. 데이터 인코딩 3-2. 피처 스케일링과 정규화 1. 사이킷런의 주요 모듈 2. Model_selection ..

머신러닝 2021.03.12

판다스 (Pandas) : 파이썬의 대표적인 데이터 처리 패키지

*해당 포스팅은 파이썬 머신러닝 완벽 가이드(권철민 지음) 교재를 공부하며 작성한 글입니다. 이전 글에서 머신러닝 개발을 위해 이해해야 할 중요 요소인 넘파이와 판다스 중 넘파이를 알아봤습니다. 이번 포스팅에서는 파이썬의 대표적인 데이터 처리 패키지인 판다스에 대해 알아보겠습니다. 1. 판다스란? 2. 데이터프레임과 리스트, 딕셔너리, 넘파이 ndarray 상호 변환 2-1. 리스트, 딕셔너리, ndarray -> 데이터프레임 2-2. 데이터프레임 -> 리스트, 딕셔너리, ndarray 3. 판다스로 데이터프레임 다루기 3-1. 칼럼 데이터 세트 생성과 수정 3-2. 데이터 삭제 3-3. 데이터 선택 및 필터링 3-4. 데이터 정렬, Aggregation함수, GroupBy 4. 판다스로 결손 데이터 처..

머신러닝 2021.03.09

넘파이 (NumPy) : 행렬과 선형대수를 다루는 패키지

*해당 포스팅은 파이썬 머신러닝 완벽 가이드(권철민 지음) 교재를 공부하며 작성한 글입니다. 머신러닝 개발을 위해서는 넘파이와 판다스에 대해 이해하는 것이 매우 중요합니다. 사이킷런의 머신러닝 알고리즘에 입력하기 위한 데이터 처리 대부분이 넘파이와 판다스의 몫일 뿐더러, 넘파이와 판다스에 대한 이해가 충분해야 다른 데이터 분석가의 소스 코드를 이해하고 자신의 것으로 흡수하며 성장해나갈 수 있습니다. 행렬과 선형대수를 다루는 패키지인 넘파이에 대해 먼저 알아보겠습니다. 1. 넘파이란? 2. 넘파이를 활용한 배열 생성 및 크기 조절 2-1. 배열 생성 2-2. 배열의 크기 조절 3. 넘파이를 활용한 인덱싱 3-1. 단일값 추출 3-2. 연속된 값 추출 3-3. 조건에 맞는 값 추출 4. 넘파이의 행렬 정렬 ..

머신러닝 2021.03.08