我们已经观察到,当我们在存储Avro的格式的数据,它的字节流转换为二进制,由于所有的评论被转换为“从解串器”。
我们发现此问题的JIRA错误为好,少确认,这个问题已经有0.13版本解决。 我们使用的蜂巢1.1(Cloudera的)。 但是,我们仍然面临的问题。
吉拉: - https://issues.apache.org/jira/browse/HIVE-6681
https://www.bountysource.com/issues/1320154-describe-on-a-table-returns-from-deserializer-for-column-comments-instead-of-values-supplied-in-create-table
但是,当我们改变输入和输出格式,以正常文本(显式指定),列描述可以保留,但是,现在看来,这是在这样的情况下,其实际的Avro功能丧失。 所以不能用下面的代码。
- 下面是一个使用文本输入和输出格式
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'