阅读rstudio Linux系统上的中国文件时,我遇到了一个问题。
如下错误。
dt <- read.csv(file = "/home/..../aa-0912.csv", header = T , sep=",")
Error in make.names(col.names, unique = TRUE) :
invalid multibyte string at '<be><ba><b5><c3><c8><cb>'
此csv文件由rstudio写入窗口系统上的w / o指定的编码,如下:
write.csv(file = "/home/.../aa-0912.csv", data)
我可以在窗口中正确读取,但是当我复制我的Linux系统上这个文件的read.csv不起作用。
在Linux上的语言环境是:
Sys.getlocale()
[1] "LC_CTYPE=en_US.UTF-8;LC_NUMERIC=C;LC_TIME=en_US.UTF-8;LC_COLLATE=en_US.UTF-8;LC_MONETARY=en_US.UTF-8;LC_MESSAGES=en_US.UTF-8;LC_PAPER=en_US.UTF-8;LC_NAME=C;LC_ADDRESS=C;LC_TELEPHONE=C;LC_MEASUREMENT=en_US.UTF-8;LC_IDENTIFICATION=C"
The locale on Window is :
LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252
我想读通过编码=“UTF-8”的数据,但我得到了类似的错误消息。
任何帮助吗?