Strategi Menciptakan Pendekatan Seimbang Bangun Kesiapan Infrastruktur AI
Keberhasilan penerapan dan pengoperasian sistem artificial intelligence (AI) sangat bergantung pada infrastruktur yang mendasarinya, yang sering kali merupakan komponen yang paling tidak dipahami namun paling penting dari ragam AI.
Menurut Vanguard, infrastruktur merupakan salah satu tantangan terberat bagi pengawasan TI dan merupakan faktor yang paling sering diidentifikasi yang berkontribusi terhadap pengabaian proyek AI di antara berbagai organisasi. Tidak ada pendekatan yang cocok untuk semua orang.
Tekanan pada manajer TI saat ini sangat besar saat mereka menavigasi dan mengatasi berbagai pertimbangan yang saling bertentangan dari berbagai pemangku kepentingan. Pada saat yang sama, permintaan akan lebih banyak dan terus berlanjut pada aplikasi perusahaan. Segala sesuatu mulai dari sistem pemrosesan transaksi online tradisional hingga aplikasi berbasis cloud yang sangat interaktif memproses lebih banyak data dan menuntut lebih banyak daya komputasi CPU.
Dengan latar belakang ini, kritis dan relevansi adopsi AI di seluruh organisasi menuntut pendekatan kolaboratif dan holistik terhadap perencanaan – khususnya, fokusnya harus pada apakah infrastruktur yang ada sesuai dengan tujuannya dan apakah peningkatan memberikan pengembalian investasi yang berarti.
Dengan demikian, organisasi dapat menghindari perluasan sumber daya mereka yang terbatas secara berlebihan dan sebagai gantinya, menyalurkan upaya mereka dengan cara yang berarti dan strategis yang sepenuhnya mewujudkan potensi penuh AI.
"AI tidak mencakup hanya pada satu beban kerja atau kasus penggunaan; AI mencakup berbagai tugas, mulai dari inferensi rutin hingga pelatihan model yang kompleks dan intensif data. AI telah menjadi alat penting bagi banyak organisasi di berbagai industri, yang mendorong inovasi, efisiensi, dan keunggulan kompetitif," jelas Peter Chambers, Managing Director APAC, AMD.
Komponen penting untuk mendukung AI meliputi komputasi berdaya tinggi, penanganan data yang efisien, dan jaringan yang andal. Namun, tidak semua beban kerja AI membutuhkan tingkat sumber daya yang sama. Sering kali, prosesor (CPU) dapat mengelola beban kerja AI yang lebih kecil, sementara aplikasi yang lebih terspesialisasi – seperti model pelatihan skala besar – memerlukan akselerator canggih (misalnya, GPU).
Seiring dengan terus berkembangnya beban kerja AI, bisnis perlu menekankan perlunya strategi infrastruktur yang hemat biaya. Data center yang mengoperasikan beban kerja AI mengonsumsi energi dalam jumlah besar. Tim arsitektur perusahaan harus memilih prosesor hemat energi, berinvestasi dalam solusi pendinginan, dan menerapkan praktik berkelanjutan untuk membantu mengelola biaya operasional.
Infrastruktur AI yang tangguh memerlukan visibilitas ke sumber daya komputasi, penyimpanan, dan jaringan. Tim I&O harus melengkapi pusat data dengan alat observabilitas untuk membantu bisnis memahami pola penggunaan dan membantu memastikan infrastruktur dapat ditingkatkan seiring dengan meningkatnya permintaan AI.
Pentingnya memilih CPU dan GPU yang tepat untuk melayani beban kerja AI. Perusahaan yang menggunakan prosesor EPYC generasi kelima terbaru AMD dan akselerator Instinct untuk memodernisasi data center, akan memperoleh kemampuan untuk menggunakan daya yang diperkirakan 71% lebih sedikit dan server yang sekitar 87% lebih sedikit dibandingkan dengan melanjutkan dengan prosesor lama dari pesaing.
Hal ini memberi CIO fleksibilitas untuk memanfaatkan penghematan ruang dan daya atau menambah kinerja untuk tugas TI sehari-hari sambil memberikan kinerja AI yang mengesankan.
Pada akhirnya, CIO harus meminta tim dalam mengambil pendekatan yang pragmatis. Pendekatan ini mengharuskan pengakuan bahwa AI bukanlah entitas tunggal. Beban kerja dan kasus penggunaan AI sangat beragam: gabungan dari beban kerja mandiri (baik besar maupun kecil), kasus penggunaan, dan fungsi dalam beban kerja lainnya.(*)