大量データを扱う際に気にするといい(かもしれない)チェックポイント

いままで教えてもらったことを忘れないうちに軽くメモっておく。MB単位のデータだったら気にする必要はそんなに無いと思うけどGB以上になってくるといろいろ考えること増えるのよね。

ざっくりいうと並列度を上げるとかまとめて処理するとかそういう方向になるのかな。

上記のことをやるとどうしても方式が複雑になるしコードの可読性が下がるのは避けられないと思うけど、大量データを処理するには必要なんだよね。