Sa mabilis na pagtaas ng mga application ng AI, na pinangungunahan ng mga modelo tulad ng ChatGPT, ang pangangailangan para sa kapangyarihan sa pag-compute ay tumataas. Para matugunan ang dumaraming computational demands sa panahon ng AI, ang H3C Group, sa ilalim ng payong ng Tsinghua Unigroup, ay naglabas kamakailan ng 11 bagong produkto sa H3C UniServer G6 at HPE Gen11 series sa 2023 NAVIGATE Leader Summit. Ang mga bagong produkto ng server na ito ay lumikha ng isang komprehensibong matrix para sa AI sa iba't ibang mga sitwasyon, na nagbibigay ng isang malakas na pinagbabatayan na platform para sa paghawak ng napakalaking data at mga algorithm ng modelo, at pagtiyak ng sapat na supply ng mga mapagkukunan ng AI computing.
Diverse Product Matrix para Matugunan ang Iba't-ibang Pangangailangan sa AI Computing
Bilang isang pinuno sa matalinong pag-compute, ang H3C Group ay malalim na nakatuon sa larangan ng AI sa loob ng maraming taon. Noong 2022, nakamit ng H3C ang pinakamataas na rate ng paglago sa Chinese accelerated computing market at nakaipon ng kabuuang 132 world-first ranking sa internationally renowned AI benchmark na MLPerf, na nagpapakita ng malakas nitong teknikal na kadalubhasaan at mga kakayahan.
Gamit ang isang advanced na arkitektura ng computing at mga kakayahan sa pamamahala ng kapangyarihan ng matalinong computing na binuo sa pundasyon ng intelligent computing, binuo ng H3C ang flagship na intelligent computing na H3C UniServer R5500 G6, na partikular na idinisenyo para sa malakihang pagsasanay sa modelo. Ipinakilala rin nila ang H3C UniServer R5300 G6, isang hybrid na computing engine na angkop para sa malakihang inference/training scenario. Ang mga produktong ito ay higit na nakakatugon sa magkakaibang mga kinakailangan sa pag-compute sa iba't ibang mga sitwasyon ng AI, na nagbibigay ng komprehensibong saklaw ng AI computing.
Flagship ng Intelligent Computing na Dinisenyo para sa Malaking Pagsasanay ng Modelo
Pinagsasama ng H3C UniServer R5500 G6 ang lakas, mababang paggamit ng kuryente, at katalinuhan. Kung ikukumpara sa nakaraang henerasyon, nag-aalok ito ng tatlong beses ang computational power, na binabawasan ang oras ng pagsasanay ng 70% para sa GPT-4 na malalaking senaryo ng pagsasanay sa modelo. Naaangkop ito sa iba't ibang sitwasyon ng negosyo ng AI, tulad ng malawakang pagsasanay, pagkilala sa pagsasalita, pag-uuri ng larawan, at pagsasalin ng makina.
Lakas: Sinusuportahan ng R5500 G6 ang hanggang 96 na mga core ng CPU, na naghahatid ng 150% na pagtaas sa pangunahing pagganap. Nilagyan ito ng bagong NVIDIA HGX H800 8-GPU module, na nagbibigay ng 32 PFLOPS ng computational power, na nagreresulta sa 9x na pagpapabuti sa malakihang bilis ng pagsasanay sa AI ng modelo at 30x na pagpapabuti sa malakihang pagganap ng AI inference ng modelo. Bukod pa rito, sa suporta ng PCIe 5.0 at 400G networking, ang mga user ay maaaring mag-deploy ng mas mataas na pagganap ng AI computing clusters, na nagpapabilis sa pag-aampon at paggamit ng AI sa mga negosyo.
Intelligence: Sinusuportahan ng R5500 G6 ang dalawang configuration ng topology, matalinong umaangkop sa iba't ibang sitwasyon ng AI application at nagpapabilis ng malalim na pag-aaral at mga siyentipikong computing application, na lubos na nagpapahusay sa paggamit ng mapagkukunan ng GPU. Salamat sa multi-instance GPU feature ng H800 module, ang isang H800 ay maaaring hatiin sa 7 GPU instance, na may posibilidad na hanggang 56 GPU instance, bawat isa ay may independiyenteng computing at memory resources. Ito ay makabuluhang pinahuhusay ang flexibility ng AI resources.
Mababang Carbon Footprint: Ganap na sinusuportahan ng R5500 G6 ang liquid cooling, kabilang ang liquid cooling para sa parehong CPU at GPU. Sa isang PUE (Power Usage Effectiveness) na mas mababa sa 1.1, pinapagana nito ang "cool computing" sa init ng computational surge.
Ito ay nagkakahalaga ng pagbanggit na ang R5500 G6 ay kinilala bilang isa sa "Nangungunang 10 Outstanding High-Performance Server ng 2023" sa "2023 Power Ranking para sa Computational Performance" sa paglabas nito.
Hybrid Computing Engine para sa Flexible na Pagtutugma ng Pagsasanay at Mga Hinihingi sa Inference
Ang H3C UniServer R5300 G6, bilang susunod na henerasyong AI server, ay nag-aalok ng mga makabuluhang pagpapahusay sa mga detalye ng CPU at GPU kumpara sa hinalinhan nito. Ipinagmamalaki nito ang pambihirang pagganap, matalinong topology, at pinagsamang computing at mga kakayahan sa imbakan, na ginagawa itong angkop para sa deep learning model training, deep learning inference, at iba pang AI application scenario, flexible na tumutugma sa pagsasanay at inference computing na mga pangangailangan.
Natitirang Pagganap: Ang R5300 G6 ay tugma sa pinakabagong henerasyon ng NVIDIA enterprise-grade GPU, na nagbibigay ng 4.85x na pagpapabuti sa pagganap kumpara sa nakaraang henerasyon. Sinusuportahan nito ang iba't ibang uri ng mga AI acceleration card, tulad ng mga GPU, DPU, at NPU, upang matugunan ang mga heterogenous na computing power na kinakailangan ng AI sa iba't ibang mga sitwasyon, na nagbibigay-kapangyarihan sa panahon ng intelligence.
Intelligent Topology: Ang R5300 G6 ay nag-aalok ng limang GPU topology setting, kabilang ang HPC, parallel AI, serial AI, 4-card direct access, at 8-card direct access. Ang walang katulad na kakayahang umangkop na ito ay lubos na nagpapahusay sa kakayahang umangkop sa iba't ibang mga sitwasyon ng aplikasyon ng user, matalinong naglalaan ng mga mapagkukunan, at humihimok ng mahusay na pagpapatakbo ng kapangyarihan sa pag-compute.
Pinagsamang Pag-compute at Imbakan: Ang R5300 G6 ay may kakayahang umangkop sa mga AI acceleration card at intelligent na mga NIC, na pinagsasama ang mga kakayahan sa pagsasanay at paghihinuha. Sinusuportahan nito ang hanggang 10 double-width na GPU at 24 na LFF (Large Form Factor) na mga hard drive slot, na nagpapagana ng sabay-sabay na pagsasanay at inference sa isang server at nagbibigay ng cost-effective na computing engine para sa development at testing environment. Sa storage capacity na hanggang 400TB, ganap nitong natutugunan ang storage space na kinakailangan ng AI data.
Sa pagsulong ng AI boom, patuloy na binabago at hinahamon ang kapangyarihan sa pag-compute. Ang paglabas ng mga susunod na henerasyon na mga server ng AI ay nagmamarka ng isa pang milestone sa pangako ng H3C Group sa teknolohiyang "likas na katalinuhan" at ang tuloy-tuloy na pagmamaneho nito para sa ebolusyon ng intelligent computing.
Tumitingin sa hinaharap, ginagabayan ng "Cloud-Native Intelligence" na diskarte, ang H3C Group ay sumusunod sa konsepto ng "meticulous pragmatism, endowing the era with intelligence." Patuloy nilang linangin ang matabang lupa ng matalinong pag-compute, tuklasin ang malalim na antas ng AI application scenario, at pabilisin ang pagdating ng isang matalinong mundo na may handa sa hinaharap, madaling ibagay na kapangyarihan sa pag-compute.
Oras ng post: Hul-04-2023