连接两个嵌套结构PCollection,我们需要做的加入之前UNNEST的PCollection,为获得挑战(参见我的其他计算器的情况下链接 )。 所以,想知道如何UNNEST的PCollection。 这将是很好的,如果有一个人给理念无论是加入两个嵌套表或如何UNNEST PCollections。
我刚才提到的,我们有PTransform“UNNEST”( 链接 )从嵌套一个unnesting集合。 但我不能找到任何净样品。 不过,我只是试图通过下面的步骤来实现它转换嵌套的集合,但仍无法获得UNNEST集合中最后一个。
1)PCollection empCollection = ReadCollection(); 2)使用帕尔函数转换从PCollection(com.google.api.services.bigquery.model.TableRow)到PCollection(org.apache.beam.sdk.values.Row)的值3)定义的架构象下面架构项目= 。Schema.builder()addInt32Field( “ID”)addStringField( “名称”)建()。 。。架构雇员= Schema.builder()addStringField( “EMPNO”)addStringField( “empName”)addArrayField( “项目”,FieldType.row(项目))建立(); 4)使用UNNEST变换到UNNEST嵌套集合
PCollection<Row> pcColl = targetRowCollection.apply(Unnest.<Row>create().withFieldNameFunction(new SerializableFunction<java.util.List<java.lang.String>, java.lang.String>() {
@Override
public java.lang.String apply(java.util.List<java.lang.String> input) {
return String.join("+", input);
}
}));
5)使用帕尔函数转换从PCollection(org.apache.beam.sdk.values.Row)至PCollection的值(com.google.api.services.bigquery.model.TableRow)
能有人帮我,用这种UNNEST转换到UNNEST收集从嵌套集合转换。