Parketifail on hdfs-fail, mis peab sisaldama faili metaandmeid. See võimaldab jagada veerud mitmeks failiks ja kasutada ühte metaandmete faili, mis viitab mitmele parketifailile. Metaandmed sisaldavad faili salvestatud andmete skeemi.
Kuidas parketifaili jaoks skeemi luua?
Parketi näidisandmete skeemi loomiseks tehke järgmist:
- Logige sisse kasti Haddop/Hive.
- See genereerib skeemi standardväljundis järgmiselt: --------------- [~] parketitööriistade skeem abc.parquet. sõnum hive_schema { …
- Kopeerige see skeem faili, milles on. parkett/. par laiend.
Kas parkett toetab skeemi arengut?
Skeemi ühendamine
Nagu Protocol Buffer, Avro ja Thrift, Parquet toetab ka skeemi arengut Kasutajad saavad alustada lihtsast skeemist ja lisada järk-järgult rohkem veerge skeemi vastav alt vajadusele. Sel viisil võivad kasutajad saada mitu erineva, kuid vastastikku ühilduva skeemiga Parketi faili.
Kas parketifailidel on andmetüübid?
Parketifaili andmetüübid vastavad teisendusandmete tüüpidele, mida andmeintegratsiooniteenus kasutab andmete teisaldamiseks platvormide vahel. Parketi skeem, mille parketti faili lugemiseks või kirjutamiseks määrate, peab olema väiksemate tähtedega.
Mis on parketiviili struktuur?
Parketifailid koosnevad rearühmadest, päisest ja jalusest Iga rearühm sisaldab andmeid samadest veergudest. Igas rearühmas salvestatakse samad veerud: see struktuur on hästi optimeeritud nii kiire päringu jõudluse kui ka madala I/O jaoks (minimeerib skannitavate andmete hulka).