•  unsoreh-light

Розподілені файлові системи

Підсумок розподілених файлових систем

Цілі

Розподілені файлові системи?

А. розподілена файлова система , як правило, забезпечують a в ідеалі POSIX сумісний інтерфейс файлової системи. Це найбільша частина його визначення, оскільки створення кластера вузлів, які зберігають дані в розподіленому порядку, можна досягти багатьма різними способами, але створення такого, що забезпечує доступ до придатний для використання Інтерфейс файлової системи складний. Зазвичай вважається файлова система файлів місцевийі тому багато програм припускають швидкий доступ до неї, не звертаючи уваги на можливі проблеми із затримкою, які можуть виникнути у файловій системі за підтримки віддалених даних. Дуже мало програм розрізняють локальні та віддалені файлові системи.

Обмін файлових систем на розподілену можна вважати формою зворотна сумісність ... у випадку, якщо ви хочете розгорнути додаток у хмарному середовищі, яке покладається на доступ до файлової системи для свого рівня даних, хмара має надати інтерфейс файлової системи, який може довільно копіюватися на різних машинах. Однак в окремому випадку користувача це також можна розглядати як спосіб зменшення управління накладними витратами ... замість відстеження резервних копій даних з кожного окремого сервера, який ви запускаєте, ви можете відстежувати стан файлової системи мережі та планувати резервне копіювання на ньому.

Якщо вам не потрібен суворий доступ до семантики файлових систем, інтерфейс зберігання розподілених об'єктів є більш простим і таким переносний та універсальний як файлова система з меншим навантаженням на синхронізацію в мережі, оскільки об’єкт зберігання сам по собі не містить метаданих. Деяке програмне забезпечення для зберігання об’єктів пропонує інтерфейс файлової системи, побудований зверху.

Заокруглюйте

Так як наша мета ні великі дані, ми ігноруємо такі рішення, як HDFS.

Ось деякі результати порівняльного результату у таблиці, вони не охоплюють усі файлові системи, і на цьому етапі можуть бути застарілими, а вf2fs можливо, проскочило кешування результатів :)

Пропускна здатність

FS seq rread rrw files create read append rename delete
raw 78793 1.0409e6 89958 179483 17300.0 23550.0 14408.0 4677 5373
zfs 102121 1.3985e6 92391 198410 29180.0 4470.0 18980.0 4695 8468
f2fs 2.064e6 1.455e6 101674 184495 28320.0 10950.0 16890.0 4233 3912
xtreemefs 159310 29117 29468 1690 510.0 1190.0 520.0 274 330
glusterfs 178026 17222 18152 5681 4380.0 7620.0 3110.0 413 1076
beegfs 79934 103006 85983 24867 9830.0 12660.0 10470.0 2889 3588
orangefs 330781 54735 41611 5523 5120.0 7020.0 6130.0 638 1989

IOPS

FS seq rread rrw files create read append
raw 76 266440 22489 44870 4430 6028 3688
zfs 99 358000 23097 49602 7470 1146 4860
f2fs 2064 372524 25418 46123 7250 2803 4325
xtreemefs 155 7279 7366 422 131 306 134
glusterfs 173 4305 4537 1420 1123 1951 798
beegfs 78 25751 21495 6216 2518 3242 2682
orangefs 323 13683 10402 1380 1310 1979 1571

Ресурси

FS CPU (Server) CPU (Client) RAM (Server) RAM (Client)
xtreemefs 100 25 300 201
glusterfs 100 50 92 277
beegfs 80 80 42 31
orangefs 15 75 60 20

Дані

Ось дані контрольних показників

Регулятори sysctl були налаштовані на максимальну пропускну здатність, але вони, мабуть, були б марними і, ймовірно, спотворювали контрольні показники, оскільки в гетерогенній мережі ці регулятори застосовуються не завжди, і все одно вони є залежно від мережі , тому навіть якщо вони застосовуються, можуть виникнути інші вузькі місця.

Додаткові порівняння, з Вікіпедії, з морських водоростей.

Теги дописів: