我使用R键读取旧的名气数据库中的数据。 这工作得很好,一般,但阅读的描述,当我得到意想不到的编码回来。 例如:
a <- "\U3e34653c"
# is supposed to be
"ä"
我想iconv
我解决这个问题的自我,但尽管尝试多种可能性我是不是能够得到它显示在一个适当的方式。 我的语言环境:en_US.UTF-8。 有没有解决更换(子)这样的字符串的方法吗?
我使用R键读取旧的名气数据库中的数据。 这工作得很好,一般,但阅读的描述,当我得到意想不到的编码回来。 例如:
a <- "\U3e34653c"
# is supposed to be
"ä"
我想iconv
我解决这个问题的自我,但尽管尝试多种可能性我是不是能够得到它显示在一个适当的方式。 我的语言环境:en_US.UTF-8。 有没有解决更换(子)这样的字符串的方法吗?
尝试用不同的编码字符串,打开文件? 李嘉图提出,也许Latin1的? 如果没有可能其他一些异国风味:
f <- file( "myfile.db" , encoding = "Latin-1" )
dat <- readLines( f )
你可以链接到一些数据?
(通过ODBC和RODBC包)中提取数据从SQL Server,当我有一个相同的问题。 我通过更改ODBC驱动程序的设置,把所有的字符串为Unicode解决它。
更具体地说,我使用的实际技术ODBC驱动程序的SQL Server,并在“高级语言设置”可以指定“将文本类型为Unicode”与“多字节文本编码”设置为UTF-8的选项。