Kuidas kaardistajad ja reduktorid töötavad?

Sisukord:

Kuidas kaardistajad ja reduktorid töötavad?
Kuidas kaardistajad ja reduktorid töötavad?

Video: Kuidas kaardistajad ja reduktorid töötavad?

Video: Kuidas kaardistajad ja reduktorid töötavad?
Video: Täielik Reduxi tööriistakomplekt + RTK päringukursus algajatele | Redux 2 tunni pärast! 2024, November
Anonim

Vasendaja või kaarditöö väljund (võtmeväärtuste paarid) on reduktorisse sisend Reduktor saab võtme-väärtuste paari mitmelt kaarditöölt. Seejärel koondab redutseerija need vahepealsed andmekorteežid (vahepealsed võtmeväärtuste paarid) väiksemaks korteeži või võtmeväärtuse paaride komplektiks, mis on lõplik väljund.

Mida kaardistajad ja redutseerijad teevad?

Hadoop Mapper on funktsioon või ülesanne, mida kasutatakse faili kõigi sisendkirjete töötlemiseks ja väljundi genereerimiseks, mis töötab reduktori sisendina See loob väljundi, tagastades uue võtme-väärtuse paarid. … Sisendkirjete võtme-väärtuste paarina töötlemisel genereerib kaardistaja ka mõned väikesed andmeplokid.

Mis vahe on kaardistajal ja reduktoril?

Mis on peamine erinevus kaardistaja ja reduktori vahel? Kaardistamisülesanne on töötluse esimene faas, mis töötleb iga sisendkirjet (RecordReaderist) ja genereerib vahepealse võtme-väärtuspaari. Vähendamismeetodit kutsutakse iga võtme/väärtuste loendi paari jaoks eraldi.

Kuidas arvutate kaardistajate ja redutseerijate arvu?

See sõltub sellest, kui palju südamikke ja kui palju mälu teil igal alluval on. Üldiselt peaks üks kaardistaja saama 1–1,5 protsessorituuma Nii et kui teil on 15 tuuma, saab ühe sõlme kohta käitada 10 kaardistajat. Nii et kui teil on Hadoopi klastris 100 andmesõlme, saate klastris käitada 1000 kaardistajat.

Kuidas kaardistamisfunktsioon töötab?

Mapper on funktsioon, mis töötleb sisendandmeid Kaardistaja töötleb andmeid ja loob mitu väikest andmetükki. Kaardistamisfunktsiooni sisend on (võti, väärtus) paaride kujul, kuigi MapReduce'i programmi sisend on fail või kataloog (mis on salvestatud HDFS-i).

Soovitan: