zipWith Scala中（在多个SEQ映射）(zipWith (mapping over mul

2019-06-26 10:50发布

站内文章 / 移动开发

31 0

再贱就再见

女 | 书童

私信

假设我有

val foo : Seq[Double] = ...
val bar : Seq[Double] = ...

我希望以产生SEQ其中巴兹（ⅰ）= FOO（ⅰ）+巴（i）中。我能想到的办法之一是

val baz : Seq[Double] = (foo.toList zip bar.toList) map ((f: Double, b : Double) => f+b)

然而，这种感觉既丑陋和低效 - 我要两到seqs列表（与惰性列表爆炸）转换，创建的元组这个临时列表中，只有映射了它，并让它成为GCed。也许流解决偷懒的问题，但在任何情况下，这种感觉就像不必要的丑陋。在口齿不清，地图功能将多个序列映射结束。我会写

(mapcar (lambda (f b) (+ f b)) foo bar)

而没有临时名单将随时随地创建。有Scala中的一个地图，超多列表功能，或拉链与解构组合真的“正确”的方式做到这一点？

Answer 1:

你想要的功能被称为zipWith ，但它不是标准库的一部分。这将是在2.8（更新：显然不是，见注释）。

foo zipWith((f: Double, b : Double) => f+b) bar

见这Trac的车票。

Answer 2:

在斯卡拉2.8：

val baz = (foo, bar).zipped map (_ + _)

它适用于以同样的方式两个以上操作数。也就是说，你可以再与跟进：

(foo, bar, baz).zipped map (_ * _ * _)

Answer 3:

好吧，那，缺乏拉链，是Scala的2.7 SEQ缺乏。斯卡拉2.8有一个深思熟虑的集设计，更换特别的方式出现在2.7集合走过来的（请注意，他们没有一次全部建立，有统一的设计）。

现在，当你想避免创建临时集合，你应该使用Scala的上2.7“投影”或“视图”上的Scala 2.8。这会给你一个集合类型，其中某些指令，特别是地图，flatMap和过滤，是不严谨的。在斯卡拉2.7，列表的投影流。在斯卡拉2.8，还有一个序列的SequenceView，但有一个zipWith正确的，在序列，你甚至不会需要它。

话虽如此，如前所述，JVM优化处理临时对象的分配，并在服务器模式下运行时，运行时优化会带来奇迹。所以，不要过早优化。试验将运行条件的代码 - 如果你还没有计划在服务器模式下运行它，然后重新考虑，如果代码预计将长时间运行，和租期，提高何时/何/如果需要的话。

编辑

什么是真正将是可在斯卡拉2.8是这样的：

(foo,bar).zipped.map(_+_)

Answer 4:

懒列表不是一个列表的副本 - 它更像是一个单独的对象。在一个慵懒的拉链实现的情况下，每次被问下一个项目时，它从两个输入列表中抓住一个项目，从他们创建一个元组，你再与模式匹配在打散元组您的拉姆达。

所以从来不需要开始对它们进行操作之前创建整个输入列表（S）的完整副本。它归结为一个非常相似的分配模式，在JVM上运行的任何应用程序 - 大量的非常短暂的，但小拨款，其中JVM优化处理的。

更新：要明确，你需要使用流（惰性列表）不会列出。 Scala的流有工作偷懒的方法拉链，所以你不应该将东西放进名单。

理想的情况是你的算法应该能够在两个无限流工作没有吹起来的（假设它不会做任何folding ，当然，只是读取并生成流）。

Answer 5:

当面对类似的任务，我增加了以下皮条客到Iterable S：

implicit class IterableOfIterablePimps[T](collOfColls: Iterable[Iterable[T]]) {
  def mapZipped[V](f: Iterable[T] => V): Iterable[V] = new Iterable[V] {
    override def iterator: Iterator[V] = new Iterator[V] {
      override def next(): V = {
        val v = f(itemsLeft.map(_.head))
        itemsLeft = itemsLeft.map(_.tail)
        v
      }

      override def hasNext: Boolean = itemsLeft.exists(_.nonEmpty)

      private var itemsLeft = collOfColls
    }
  }
}

有了这个，你可以这样做：

val collOfColls = List(List(1, 2, 3), List(4, 5, 6), List(7, 8, 9))
collOfColls.mapZipped { group =>
  group // List(1, 4, 7), then List(2, 5, 8), then List(3, 6, 9)
}

请注意，您应该谨慎考虑嵌套传递的集合型Iterable ，因为tail和head将被反复调用它。所以，理想情况下，你应该通过Iterable[List]或其他集合快速tail和head 。

此外，此代码预计同样大小的嵌套集合。这是我的使用情况，但我怀疑这是可以改善，如果需要的话。

Answer 6:

更新：它已经指出（在评论），这个“答案”并没有真正解决所提出的问题。这个回答将每一个组合映射超过foo和bar ，产生N×M个元素，而不是分钟（M，N）的要求。所以，这是错误的 ，但为后人留下了，因为这是很好的信息。

要做到这一点，最好的办法是flatMap联合map 。代码事实胜于雄辩：

foo flatMap { f => bar map { b => f + b } }

这将产生一个Seq[Double] ，正如你所期望的。这种模式是如此普遍，斯卡拉实际上包括一些语法的魔术实现它：

for {
  f <- foo
  b <- bar
} yield f + b

或者，也可以使用：

for (f <- foo; b <- bar) yield f + b

在for { ... }语法真的是做到这一点的最惯用的方式。您可以继续添加发电机条款（例如b <- bar必要）。因此，如果它突然变为3 Seq是你们等必须映射过来，你可以很容易地与你的要求一起扩展您的语法（套用一句话）。

文章来源: zipWith (mapping over multiple Seq) in Scala

标签： scala functional-programming higher-order-functions

再贱就再见

女 | 书童

私信

收藏的人(0)

Ta的文章更多文章

0条评论

还没有人评论过~