Mejorar el uso de los respaldos diarios en el servidor del cliente
Basado en el espacio en disco duro ocupado por los respaldos de Archimex la estrategia de respaldos ocupada actualmente no es muy buena optimizando el uso del disco duro:
4.3G rsnapshot/daily.0
922M rsnapshot/daily.1
922M rsnapshot/daily.2
922M rsnapshot/daily.3
922M rsnapshot/daily.4
921M rsnapshot/daily.5
921M rsnapshot/daily.6
917M rsnapshot/monthly.0
910M rsnapshot/monthly.1
1.7G rsnapshot/monthly.10
3.3G rsnapshot/monthly.11
905M rsnapshot/monthly.2
901M rsnapshot/monthly.3
896M rsnapshot/monthly.4
3.7G rsnapshot/monthly.5
1.8G rsnapshot/monthly.6
1.8G rsnapshot/monthly.7
1.8G rsnapshot/monthly.8
1.8G rsnapshot/monthly.9
921M rsnapshot/weekly.0
920M rsnapshot/weekly.1
918M rsnapshot/weekly.2
Creo que el origen principal de este problema es por las siguientes 2 razones:
- Se está comprimiendo el respaldo de la base de datos y los archivos en un archivo comprimido, esto hace imposible optimizar el uso de espacio en disco con alguna estrategia de rsync o similar ya que los hash de cada archivo son únicos.
- La forma en como se está haciendo el respaldo de la base de datos de postgresql incluye en un solo archivo la información necesaria para restaurar toda la base de datos, esto también hace que el hash cambie y no se pueda utilizar rsync para optimizar el uso de disco duro.
Aquí dejo algunas posibles soluciones a implementar para mejorar esto: