본문 바로가기

Data

[R] 인코딩 옵션 추론 및 한글 변환하기

맥에서 설치하는 R은 기본 utf8설정인경우로 데이터 변환을 할 필요가 없지만, 윈도우는 그렇지 않을 수 있기 때문에 데이터 타입 추론과 변환이 필요한 경우가 있다. 이때 readr라이브러리의 guess_encoding 함수를 호출하면 데이터타입 추론이 아래와 같은 결과로 나온다.
library(readr)
guess_encoding(someday)

# A tibble: 1 x 2
  encoding confidence
           
1 ASCII             1

이때, 한국어 데이타의 경우 kormaps2014 라이브러리의 changeCode 함수를 통해 타입을 쉽게 변환할 수 있다.

library(kormaps2014)
encoded <- changeCode(someday, from="ASCII", `="CP949")


'Data' 카테고리의 다른 글

[SVM] 2. svm 사이의 최대 거리값 찾기  (0) 2019.03.19
[SVM] 1. yi(x·w+b) >= 1 도출하기  (0) 2019.03.19
[R] factor 자료형에 대하여  (0) 2019.02.12