SQL Server データ暗号化とバックアップ圧縮率
データ暗号化をした場合圧縮率が下がるという情報があったため検証してみました。Microsoftの情報では以下の通り記載されています。
バックアップの圧縮 (SQL Server) | Microsoft Docs
暗号化されたデータは、暗号化されていない同等のデータより、圧縮比率が大幅に下がります。
前提
- SQL Server 2017
- Transparent Data Encryption (TDE)を使用
- 対象データは一般的なDBデータ約100GB
結果
以下パターンで試してみました。元データに対する比率で結果を示します。(だいたいの値です)
- 暗号化なし、バックアップ圧縮なし :100%
- 暗号化なし、バックアップ圧縮あり :20%
- 暗号化あり、バックアップ圧縮あり :90%
まとめ
思っていた以上に暗号化による圧縮率低下がみられました。ただ、暗号化の仕組みを考えれば当然かと思われます。暗号化されていない平文では、人間が意図して格納した意味のあるデータなので、規則性が出やすくその分圧縮率が高くなります。暗号化するとその規則性が乏しくなるため圧縮率が低くなります。