Hvor gemmes kortlæggerens mellemliggende data?

Indholdsfortegnelse:

Hvor gemmes kortlæggerens mellemliggende data?
Hvor gemmes kortlæggerens mellemliggende data?
Anonim

Oputtet fra Mapper (mellemliggende data) er lagret på det lokale filsystem (ikke HDFS) for hver enkelt Mapper-dataknude. Dette er typisk en midlertidig mappe, som kan konfigureres af Hadoop-administratoren.

Hvor gør MapReduce mellemliggende data?

  • Mapper-outputtet (mellemliggende data) gemmes på det lokale filsystem (IKKE HDFS) for hver enkelt mapper-knudepunkt. …
  • jeg tror, at dette er parameteren, der skal ændres for at ændre den mellemliggende dataplacering.
  • mapreduce.cluster.local.dir.
  • Håber dette hjælper.

Hvor gemmes kortlæggerens output?

9) Hvor er Mapper-output gemt? De mellemliggende nøgleværdidata for mapper-outputtet vil blive gemt på lok alt filsystem for mapper-noder. Denne mappeplacering er indstillet i konfigurationsfilen af Hadoop Admin.

Hvad er mellemliggende data i MapReduce?

Mellemliggende datafiler er genereret af kort og reducerer opgaver i en mappe (placering) på den lokale disk. … Outputfiler genereret af kortopgaverne, der tjener som input til reduceringsopgaverne. Midlertidige filer genereret af reduceringsopgaverne.

Hvor er output fra mapper skrevet i Hadoop?

I Hadoop er outputtet fra Mapper lagret på lokal disk, da det er mellemoutput. Det er ikke nødvendigt at gemme mellemliggende datapå HDFS fordi: dataskrivning er dyrt og involverer replikering, hvilket yderligere øger omkostningerne og tid.

Anbefalede: