본문 바로가기

공부한 것

(10)
선형대수 - 1 그냥 가져다 사용하지 않고, 정확한 개념을 알고, 또 잊지 않기 위해 정리하고자 책을 읽으며 개념을 익히고, 파이썬에서는 어떻게 구현하는지를 메모해두려 한다. 읽는 책은 장철원 작가님의 선형대수와 통계학으로 배우는 머신러닝 with 파이썬 리뷰 중 깊이가 없다는 글도 있지만 기본적인 개념을 잡고 거기서 더 나아가는 것은 학습자의 역할이지 그것까지 저자가 떠먹여줄 수는 없다고 생각한다. 책의 목적 자체도 머신러닝을 위해 선형대수와 통계학을 다루는 것이니 필요 이상으로 깊이 파고들 이유도 없을 것 같고. Linear Algebra. 기초적이고도 필수적인 요소...지 아마. 개념은 어렵지 않은데, 막상 이용해서 문제를 풀라거나 응용하거나 하면 벽에 부딪힐지도 모르겠다. Vector, scalar, matrix..
Data Preprocessing 1. 데이터 값으로 NaN, 즉 null은 허용되지 않는다. 2. 문자열 값이 입력으로 허용되지 않아 숫자형으로 변환해야 한다 : feature vectorization / deletion Label Encoding - 카테고리형 피쳐 -> 코드형 숫자값 ex) TV: 1, 냉장고: 2, ... from sklearn.preprocessing import LabelEncoder items = [ 'TV', '냉장고', '전자레인지', '컴퓨터', '선풍기', '믹서', '믹서', '선풍기', ] # LabelEncoder를 객체로 생성한 후, fit()과 transform()으로 레이블 인코딩 수행 encoder = LabelEncoder() encoder.fit(items) labels = encode..
분류와 검증 권철민 작가님의 파이썬 머신러닝 완벽 가이드를 보며 배워가는 중. 실습 코드를 올리는 건 저작권에 걸리겠지...? 분류 대표적인 지도학습 방법 가운데 하나. 학습을 위한 다양한 피처와 분류 결정값인 레이블 데이터로 모델 학습, 별도 테스트 데이터 세트에서 레이블 예측한다. 책에서는 scikit-learn이 기본으로 제공하는 iris dataset으로 실습했다. DecisionTreeClassifier 데이터 세트 분리 : 학습 데이터와 테스트 데이터로 분리 모델 학습 : 학습 데이터 기반 ML 알고리즘 적용, 모델 학습 예측 수행 : 학습된 ML 모델로 테스트 데이터 분류 예측 평가 : 예측 결과값과 테스트 데이터의 실제 결과값 비교해 ML 모델 성능 평가 교차검증 Overfitting; 고정된 학습 데..
여기에는 주로 Coursera 및 Youtube 등에서 공부한 것들을 기록해두려 한다. 자료구조와 알고리즘을 주로 공부하고 있다. "컴퓨팅적 사고"를 위해...