Data Preprocessing
1. 데이터 값으로 NaN, 즉 null은 허용되지 않는다. 2. 문자열 값이 입력으로 허용되지 않아 숫자형으로 변환해야 한다 : feature vectorization / deletion Label Encoding - 카테고리형 피쳐 -> 코드형 숫자값 ex) TV: 1, 냉장고: 2, ... from sklearn.preprocessing import LabelEncoder items = [ 'TV', '냉장고', '전자레인지', '컴퓨터', '선풍기', '믹서', '믹서', '선풍기', ] # LabelEncoder를 객체로 생성한 후, fit()과 transform()으로 레이블 인코딩 수행 encoder = LabelEncoder() encoder.fit(items) labels = encode..