Skip to content

GitLab

Explore

Sign in

Primary navigation

Project

S

spark
- Activity
- Members
- Labels
- Issues
- Issue boards
- Milestones
- Wiki
- Releases
- Model registry
- Environments
- Incidents

Snippets Groups Projects

1c67c7df

Commit 1c67c7df authored 12 years ago by Stephen Haberman

Downloads
- Patches
- Plain Diff

Add a shuffle parameter to coalesce.

This is useful for when you want just 1 output file (part-00000) but
still up the upstream RDD to be computed in parallel.

parent ca4d083e

No related branches found

No related tags found

No related merge requests found

Changes 5

Hide whitespace changes

Inline Side-by-side

Showing

core/src/main/scala/spark/RDD.scala 9 additions, 1 deletion

core/src/main/scala/spark/RDD.scala
core/src/main/scala/spark/api/java/JavaDoubleRDD.scala 6 additions, 0 deletions

core/src/main/scala/spark/api/java/JavaDoubleRDD.scala
core/src/main/scala/spark/api/java/JavaPairRDD.scala 7 additions, 1 deletion

core/src/main/scala/spark/api/java/JavaPairRDD.scala
core/src/main/scala/spark/api/java/JavaRDD.scala 6 additions, 0 deletions

core/src/main/scala/spark/api/java/JavaRDD.scala
core/src/test/scala/spark/RDDSuite.scala 5 additions, 1 deletion

core/src/test/scala/spark/RDDSuite.scala

with 33 additions and 3 deletions

Loading

0% Loading or .

You are about to add 0 people to the discussion. Proceed with caution.

Finish editing this message first!

Please register or sign in to comment