我如何编译一个蜂巢UDF(How do I compile a Hive UDF)

2019-06-25 11:09发布

我试图编译这个UDF:

package com.dataminelab.hive.udf;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;
import java.security.*;

/**
 * Calculate md5 of the string
*/
public final class Md5 extends UDF {

    public Text evaluate(final Text s) {
        if (s == null) {
            return null;
        }
        try {
            MessageDigest md = MessageDigest.getInstance("MD5");
            md.update(s.toString().getBytes());
            byte[] md5hash = md.digest();
            StringBuilder builder = new StringBuilder();
            for (byte b : md5hash) {
            builder.append(Integer.toString((b & 0xff) + 0x100, 16).substring(1));
            }
            return new Text(builder.toString());
            } catch (NoSuchAlgorithmException nsae) {
            System.out.println("Cannot find digest algorithm");
            System.exit(1);
        }
        return null;
    }
}

试图用编译:

javac Md5.java

但我得到:

Md5.java:2: package org.apache.hadoop.hive.ql.exec does not exist
import org.apache.hadoop.hive.ql.exec.UDF;
                                     ^
Md5.java:3: package org.apache.hadoop.io does not exist
import org.apache.hadoop.io.Text;

我认为这些都是一个jar文件的地方,但我不知道在哪里的Hadoop安装他们,所以我不能将它们添加到我的类路径。 有谁知道的默认位置,或如何发现的?

Answer 1:

以下为我的作品,但我怀疑的细节会根据您的安装和你的源代码确实有所不同:

export CLASSPATH=/usr/lib/hive/lib/hive-exec-0.9.0.15.jar:/usr/lib/hadoop/hadoop-core.jar


Answer 2:

你已经包含了形式$ HIVE_HOME / lib目录/蜂房SERDE的罐子 - 在classpath *罐子 - 罐子*和$ HIVE_HOME / lib目录/蜂房EXEC。?



Answer 3:

加蜂房0.4.1 JAR文件的lib



文章来源: How do I compile a Hive UDF