Pagganap ng Disk Array Storage Systems sa Single Host Connection

Sa pangkalahatan, ang mga disk o disk array ay may pinakamahusay na pagganap sa isang senaryo ng koneksyon sa host. Karamihan sa mga operating system ay batay sa mga eksklusibong file system, na nangangahulugang ang isang file system ay maaari lamang pag-aari ng isang operating system. Bilang resulta, pareho ang operating system at application software ay nag-optimize ng data read and write para sa disk storage system batay sa mga katangian nito. Nilalayon ng pag-optimize na ito na bawasan ang mga oras ng pisikal na paghahanap at bawasan ang mga oras ng pagtugon sa mekanikal na disk. Ang mga kahilingan ng data mula sa bawat proseso ng programa ay pinangangasiwaan ng operating system, na nagreresulta sa na-optimize at maayos na mga kahilingan sa pagbasa at pagsulat ng data para sa disk o disk array. Ito ay humahantong sa pinakamahusay na pagganap ng storage system sa setup na ito.

Para sa mga disk array, bagama't may idinagdag na karagdagang RAID controller sa pagitan ng operating system at ng mga indibidwal na disk drive, ang kasalukuyang RAID controllers ay pangunahing namamahala at nagbe-verify ng mga pagpapatakbo ng disk fault tolerance. Hindi sila nagsasagawa ng data request merge, reordering, o optimization. Ang mga controller ng RAID ay idinisenyo batay sa pagpapalagay na ang mga kahilingan ng data ay nagmumula sa isang host, na na-optimize at pinagsunod-sunod na ayon sa operating system. Ang cache ng controller ay nagbibigay lamang ng direkta at computational na mga kakayahan sa buffering, nang walang queuing data para sa pag-optimize. Kapag ang cache ay mabilis na napuno, ang bilis ay agad na bumababa sa aktwal na bilis ng mga pagpapatakbo ng disk.

Ang pangunahing function ng RAID controller ay lumikha ng isa o higit pang malalaking fault-tolerant na disk mula sa maraming disk at pagbutihin ang pangkalahatang bilis ng pagbasa at pagsulat ng data gamit ang tampok na pag-cache sa bawat disk. Ang read cache ng RAID controllers ay makabuluhang nagpapahusay sa pagganap ng pagbasa ng disk array kapag ang parehong data ay nabasa sa loob ng maikling panahon. Ang aktwal na maximum na bilis ng pagbasa at pagsulat ng buong hanay ng disk ay nalilimitahan ng pinakamababang halaga sa bandwidth ng host channel, pagkalkula ng pag-verify ng controller ng CPU at mga kakayahan sa pagkontrol ng system (RAID engine), bandwidth ng channel ng disk, at pagganap ng disk (ang pinagsamang aktwal na pagganap ng lahat ng mga disk). Bukod pa rito, ang hindi pagkakatugma sa pagitan ng batayan ng pag-optimize ng mga kahilingan sa data ng operating system at ang format ng RAID, tulad ng laki ng block ng mga kahilingan sa I/O na hindi umaayon sa laki ng segment ng RAID, ay maaaring makabuluhang makaapekto sa pagganap ng disk array.

Mga Pagkakaiba-iba ng Pagganap ng Traditional Disk Array Storage System sa Maramihang Host Access

Sa maraming senaryo ng pag-access sa host, bumababa ang pagganap ng mga array ng disk kumpara sa mga koneksyon sa solong host. Sa mga small-scale disk array storage system, na karaniwang may iisa o kalabisan na pares ng disk array controllers at limitadong bilang ng mga konektadong disk, ang pagganap ay apektado ng hindi maayos na daloy ng data mula sa iba't ibang host. Ito ay humahantong sa tumaas na oras ng paghahanap ng disk, impormasyon sa header at buntot ng segment ng data, at fragmentation ng data para sa pagbabasa, pagsasanib, pagkalkula ng pag-verify, at mga proseso ng muling pagsulat. Dahil dito, bumababa ang performance ng storage habang mas maraming host ang nakakonekta.

Sa malakihang disk array storage system, ang pagkasira ng performance ay iba sa mga small-scale disk arrays. Gumagamit ang malalaking sistemang ito ng istruktura ng bus o istruktura ng paglipat ng cross-point para ikonekta ang maraming subsystem ng storage (mga disk array) at kasama ang malalaking kapasidad na mga cache at mga module ng koneksyon sa host (katulad ng mga channel hub o switch) para sa mas maraming host sa loob ng bus o switching istraktura. Ang pagganap ay higit na nakadepende sa cache sa mga application sa pagpoproseso ng transaksyon ngunit may limitadong bisa sa mga senaryo ng multimedia data. Bagama't ang mga panloob na disk array subsystem sa mga malalaking sistemang ito ay gumagana nang medyo independyente, ang isang solong lohikal na yunit ay binuo lamang sa loob ng isang disk subsystem. Kaya, ang pagganap ng isang solong lohikal na yunit ay nananatiling mababa.

Sa konklusyon, ang mga maliliit na disk array ay nakakaranas ng pagbaba ng pagganap dahil sa hindi maayos na daloy ng data, habang ang malalaking disk array na may maraming independiyenteng disk array subsystem ay maaaring suportahan ang mas maraming host ngunit nahaharap pa rin sa mga limitasyon para sa mga multimedia data application. Sa kabilang banda, ang mga sistema ng imbakan ng NAS batay sa tradisyunal na teknolohiya ng RAID at paggamit ng mga protocol ng NFS at CIFS upang magbahagi ng storage sa mga panlabas na user sa pamamagitan ng mga koneksyon sa Ethernet ay nakakaranas ng mas kaunting pagkasira ng pagganap sa maraming kapaligiran ng pag-access sa host. Ang mga sistema ng imbakan ng NAS ay nag-o-optimize ng paghahatid ng data gamit ang maramihang parallel na paglilipat ng TCP/IP, na nagbibigay-daan para sa maximum na nakabahaging bilis na humigit-kumulang 60 MB/s sa isang solong NAS storage system. Ang paggamit ng mga koneksyon sa Ethernet ay nagbibigay-daan sa data na mahusay na maisulat sa disk system pagkatapos ng pamamahala at muling pagsasaayos ng operating system o data management software sa manipis na server. Samakatuwid, ang disk system mismo ay hindi nakakaranas ng makabuluhang pagkasira ng pagganap, na ginagawang angkop ang NAS storage para sa mga application na nangangailangan ng pagbabahagi ng data.


Oras ng post: Hul-17-2023