مفهموم Deduplication
همانطور که در شکل پایین مشاهده می شود، در مرحله اول دیتایی که تا حالا ذخیره نشده است به روی ذخیره ساز رفته و عمل رایت انجام می شود. سپس در مرحله دوم مقداری از دیتاها تکراری می باشند (دیتاهای آبی رنگ)، در مرحله سوم دیتاهایی که تکراری هستند روی ذخیره ساز رایت نمی شوند و در مرحله چهارم فقط دیتاهای جدید ذخیره می شوند.
همانطور که در شکل بالا نشان داده شده است و در مقدمه توضیح داده شد، Deduplication عملی می باشد که طی آن ذخیره سازی دیتا را بصورت هوشمند انجام می دهد. بدین معنی که دیتاهای تکراری ذخیره نمی شود و همچنین برای Backup گیری نیز از آنها نسخه پشتیبان تهیه نمی شود، به این دلیل که یکبار این عمل صورت پذیرفته است. استفاده از deduplication باعث می شود حجم بیشتری برای ذخیره سازی و Backup برای سازمان باقی بماند. همچنین هنگام Replication بین دو سایت استفاده از این تکنولوژی باعث می شود پهنای باند کمتری اشغال شود و عمل Replication با سرعت بالاتری انجام گردد.
برای عمل Deduplication از الگوریتم های مختلفی استفاده می شود که در زیر نام برده شده است:
- File-level deduplication
- Fixed-size block deduplication
- Variable-size block deduplication
چانک های تکراری بصورت Hash درآمده و در یک جدول ذخیره می شوند (index میشوند)، و از این جدول برای مقایسه دیتاهای تکراری در آینده استفاده می شود. واحد مقایسه فایل ها می تواند در سطح فایل و یا Sub-file باشد.
دیدگاهتان را بنویسید