분류 전체보기 썸네일형 리스트형 [R] 인코딩 옵션 추론 및 한글 변환하기 맥에서 설치하는 R은 기본 utf8설정인경우로 데이터 변환을 할 필요가 없지만, 윈도우는 그렇지 않을 수 있기 때문에 데이터 타입 추론과 변환이 필요한 경우가 있다. 이때 readr라이브러리의 guess_encoding 함수를 호출하면 데이터타입 추론이 아래와 같은 결과로 나온다.library(readr) guess_encoding(someday) # A tibble: 1 x 2 encoding confidence 1 ASCII 1 이때, 한국어 데이타의 경우 kormaps2014 라이브러리의 changeCode 함수를 통해 타입을 쉽게 변환할 수 있다.library(kormaps2014) encoded [R] factor 자료형에 대하여 Factor는 인덱스와 같은 제한된 숫자값을 갖고있는 자료형이다. 통계적 모델링(그래프 요소의 순서처리 등)을 위해 주로 사용되고, 같은 value값을 지닌 데이터간의 안정성이 보장되는 이점이 있다. 또, 그만큼 데이터 복사/처리 등이 쉽게 이뤄지지 않으므로 일반적으로 가공과정에서는 사용하지 말것을 권장한다. csv, excel등의 데이터를 R데이터 타입으로 변환하거나 생성할때 stringAsFactors 옵션을 통해 해당 데이터를 Factor로 다룰것인지 옵션을 줄 수 있다.credit_rating 이전 1 2 3 4 다음