Підсумок розподілених файлових систем
Можливість зберігати дані та метадані
Стійкість до збоїв окремих вузлів
Гнучкість розширювати або зменшувати мережу в будь -який час
Вміння дуже бігати низька пам’ять серверів
А. розподілена файлова система , як правило, забезпечують a в ідеалі POSIX сумісний інтерфейс файлової системи. Це найбільша частина його визначення, оскільки створення кластера вузлів, які зберігають дані в розподіленому порядку, можна досягти багатьма різними способами, але створення такого, що забезпечує доступ до придатний для використання Інтерфейс файлової системи складний. Зазвичай вважається файлова система файлів місцевийі тому багато програм припускають швидкий доступ до неї, не звертаючи уваги на можливі проблеми із затримкою, які можуть виникнути у файловій системі за підтримки віддалених даних. Дуже мало програм розрізняють локальні та віддалені файлові системи.
Обмін файлових систем на розподілену можна вважати формою зворотна сумісність ... у випадку, якщо ви хочете розгорнути додаток у хмарному середовищі, яке покладається на доступ до файлової системи для свого рівня даних, хмара має надати інтерфейс файлової системи, який може довільно копіюватися на різних машинах. Однак в окремому випадку користувача це також можна розглядати як спосіб зменшення управління накладними витратами ... замість відстеження резервних копій даних з кожного окремого сервера, який ви запускаєте, ви можете відстежувати стан файлової системи мережі та планувати резервне копіювання на ньому.
Якщо вам не потрібен суворий доступ до семантики файлових систем, інтерфейс зберігання розподілених об'єктів є більш простим і таким переносний та універсальний як файлова система з меншим навантаженням на синхронізацію в мережі, оскільки об’єкт зберігання сам по собі не містить метаданих. Деяке програмне забезпечення для зберігання об’єктів пропонує інтерфейс файлової системи, побудований зверху.
Так як наша мета ні великі дані, ми ігноруємо такі рішення, як HDFS.
OpenAFS : це не правильно розподілена файлова система, оскільки вона є федеративним що означає, що збої в роботі одного вузла можуть спричинити збої.
MinFS : MinFS - це драйвер запобіжника для MinIO, який є прямим розподіленим сховищем об’єктів із кодуванням стирання, але це, схоже, не дешево для ресурсів.
xtreemefs : XtreemeFS досягає стійкості з еквівалентом RAID0 по мережі
Глустерф: проста настройка, але погана продуктивність
ceph : складніше налаштовувати (і керувати), але з дуже хорошою (і настроюваною) продуктивністю
ящірки : гідна продуктивність, низький початковий об'єм пам'яті, але великий під великим навантаженням
orangefs : мінімальний обсяг, як модуль ядра, так і модуль термофіксатора, очікування на v3 асинхронних метаданих
яловичини : низький простір, модуль ядра (але модуль термофіксатора не підтримується), найкраща продуктивність
морські водорості : зручне зберігання об’єктів за допомогою модуля термофіксатора
Ось деякі результати порівняльного результату у таблиці, вони не охоплюють усі файлові системи, і на цьому етапі можуть бути застарілими, а вf2fs
можливо, проскочило кешування результатів :)
FS
seq
rread
rrw
files
create
read
append
rename
delete
raw
78793
1.0409e6
89958
179483
17300.0
23550.0
14408.0
4677
5373
zfs
102121
1.3985e6
92391
198410
29180.0
4470.0
18980.0
4695
8468
f2fs
2.064e6
1.455e6
101674
184495
28320.0
10950.0
16890.0
4233
3912
xtreemefs
159310
29117
29468
1690
510.0
1190.0
520.0
274
330
glusterfs
178026
17222
18152
5681
4380.0
7620.0
3110.0
413
1076
beegfs
79934
103006
85983
24867
9830.0
12660.0
10470.0
2889
3588
orangefs
330781
54735
41611
5523
5120.0
7020.0
6130.0
638
1989
FS
seq
rread
rrw
files
create
read
append
raw
76
266440
22489
44870
4430
6028
3688
zfs
99
358000
23097
49602
7470
1146
4860
f2fs
2064
372524
25418
46123
7250
2803
4325
xtreemefs
155
7279
7366
422
131
306
134
glusterfs
173
4305
4537
1420
1123
1951
798
beegfs
78
25751
21495
6216
2518
3242
2682
orangefs
323
13683
10402
1380
1310
1979
1571
FS
CPU (Server)
CPU (Client)
RAM (Server)
RAM (Client)
xtreemefs
100
25
300
201
glusterfs
100
50
92
277
beegfs
80
80
42
31
orangefs
15
75
60
20
Ось дані контрольних показників
Регулятори sysctl були налаштовані на максимальну пропускну здатність, але вони, мабуть, були б марними і, ймовірно, спотворювали контрольні показники, оскільки в гетерогенній мережі ці регулятори застосовуються не завжди, і все одно вони є залежно від мережі , тому навіть якщо вони застосовуються, можуть виникнути інші вузькі місця.
Додаткові порівняння, з Вікіпедії, з морських водоростей.