如何阅读在Linux rstudio中国(How to read chinese in rstudi

2019-10-19 05:07发布

阅读rstudio Linux系统上的中国文件时,我遇到了一个问题。

如下错误。

dt <- read.csv(file = "/home/..../aa-0912.csv", header = T , sep=",")

Error in make.names(col.names, unique = TRUE) : 
  invalid multibyte string at '<be><ba><b5><c3><c8><cb>'

此csv文件由rstudio写入窗口系统上的w / o指定的编码,如下:

write.csv(file = "/home/.../aa-0912.csv", data)

我可以在窗口中正确读取,但是当我复制我的Linux系统上这个文件的read.csv不起作用。

在Linux上的语言环境是:

Sys.getlocale()

[1] "LC_CTYPE=en_US.UTF-8;LC_NUMERIC=C;LC_TIME=en_US.UTF-8;LC_COLLATE=en_US.UTF-8;LC_MONETARY=en_US.UTF-8;LC_MESSAGES=en_US.UTF-8;LC_PAPER=en_US.UTF-8;LC_NAME=C;LC_ADDRESS=C;LC_TELEPHONE=C;LC_MEASUREMENT=en_US.UTF-8;LC_IDENTIFICATION=C"

The locale on Window is :
LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252

我想读通过编码=“UTF-8”的数据,但我得到了类似的错误消息。

任何帮助吗?

Answer 1:

我不知道这是回答你的问题。

我会尽量尽可能通用,以便在任何语言有困难的人可能有一个解决方案:

首先在终端local -a地方会显示您的系统上所有可用的语言环境。

一旦你找到该区域设置正确的语言环境,然后在RStudio:

Sys.setlocale("LC_ALL","fr_FR.utf8") 

对不起,我似乎并没有在我的系统上的任何中国的语言环境。 其他人有同样的问题: 在这里和这里

有也看看?Sys.setlocale在R.



文章来源: How to read chinese in rstudio on Linux