Parquetフォーマットとは?
ぱーけっとふぉーまっと
列指向で圧縮効率が高いビッグデータ向けファイル形式だよ。
『Parquetフォーマット』はデータを列ごとにまとめて圧縮するファイルの形式で データの量を小さくしながら速く分析できるように作られているよ。
つかいかた・れいぶん
CSVをParquetに変えただけでファイルのサイズが大きく減って分析も速くなった。
このことばを シェア
さいごの こうしん: