텍스트 데이터에 대해 Konlpy 태깅 작업을 하던 중 에러가 발생.
Mecab, Kkma, Okt 태깅 작업에서는 해당 에러가 발생하지 않았지만 Komaran 을 적용할 때만 발생.
찾아본 결과 텍스트 내의 \n 등의 문자등을 인식하지 못해 발생하는 것.
다른 태깅들은 자동으로 제외를 시켜주지만 Komaran은 자동으로 처리를 해주지 않아 발생하는 것으로 보임.
replace 함수를 통해 해당 문자를 바꿔주었지만 여전히 에러.
텍스트를 직접 확인해보니 replace 적용이 되지 않은 상태였다.
replace 적용을 위해 해당 칼럼을 str 를 처리하고 replace 하는 방식이 필요.
문자열로 변환한 다음 처리했더니 에러 없이 적용이 되는 것으 확인할 수 있음.
'Python > Software' 카테고리의 다른 글
MongoDB를 위한 Robo 3T 설치 및 open Shell (0) | 2021.10.26 |
---|---|
MongoDB 설치 on M1 (0) | 2021.10.26 |
공공데이터 API 수집 + Python + Firebase 저장 (0) | 2021.10.21 |