A KOTAK ABU-ABU bangunan di pinggiran San Jose menampung deretan mesin yang berkedip-kedip. Jalinan kabel warna-warni menghubungkan server kelas atas, peralatan jaringan, dan sistem penyimpanan data. Unit AC besar berputar di atas kepala. Kebisingan memaksa pengunjung untuk berteriak.
Bangunan itu milik Equinix, sebuah perusahaan yang menyewakan ruang pusat data. Peralatan di dalamnya milik perusahaan dari perusahaan raksasa hingga startup, yang semakin banyak menggunakannya untuk menjalankan kecerdasan buatan (AI) sistem. Itu AI demam emas, didorong oleh kecanggihan luar biasa dari sistem “generatif” seperti ObrolanGPT, seorang pembicara virtual terkenal, berjanji untuk menghasilkan banyak keuntungan bagi mereka yang memanfaatkan potensi teknologi. Namun, seperti pada hari-hari awal demam emas, hal itu sudah menghasilkan keuntungan bagi penjual beliung dan sekop yang diperlukan.
Pada 24 Mei Nvidia, yang mendesain semikonduktor pilihan bagi banyak orang AI server, mengalahkan perkiraan pendapatan dan laba analis untuk tiga bulan hingga April. Ia mengharapkan penjualan $11 miliar pada kuartal saat ini, setengah dari apa yang diprediksi Wall Street. Karena harga sahamnya melonjak sebesar 30% keesokan harinya, nilai pasar perusahaan mencapai $1trilyun. Chief executive Nvidia, Jensen Huang, menyatakan pada tanggal 29 Mei bahwa dunia berada pada “titik kritis era komputasi baru”.

Perusahaan chip lain, dari sesama desainer seperti AMD untuk produsen seperti TSMC dari Taiwan, telah tersapu di AI kegembiraan. Begitu juga dengan penyedia infrastruktur komputasi lainnya—yang mencakup semuanya, mulai dari kabel warna-warni, unit AC yang berisik, dan ruang lantai pusat data hingga perangkat lunak yang membantu menjalankan AI model dan mengumpulkan data. Indeks dengan bobot yang sama dari 30 perusahaan semacam itu telah meningkat sebesar 40% sejak ObrolanGPTpeluncuran pada bulan November, dibandingkan dengan 13% untuk teknologi berat NASDAQ indeks (lihat grafik). “Tumpukan teknologi baru sedang muncul,” simpul Daniel Jeffries dari AI Aliansi Infrastruktur, kelompok lobi.
Sepintas lalu, para AI gubbins tampaknya jauh lebih menarik daripada “model bahasa besar” yang cerdik di balik ObrolanGPT dan deretan saingannya yang berkembang pesat. Tetapi sebagai pembuat model dan pembuat aplikasi yang membonceng model-model itu bersaing untuk mendapatkan bagian dari masa depan AI pai, mereka semua membutuhkan daya komputasi di sini dan saat ini—dan banyak lagi.
Terbaru AI sistem, termasuk jenis generatif, jauh lebih intensif komputasi daripada yang lama, apalagi non-AI aplikasi. Amin Vahdat, ketua AI infrastruktur di Google Cloud Platform, lengan komputasi awan raksasa internet, mengamati bahwa ukuran model telah tumbuh sepuluh kali lipat setiap tahun selama enam tahun terakhir. GPT-4, versi terbaru yang mendukung ObrolanGPT, menganalisis data menggunakan mungkin 1trn parameter, lebih dari lima kali lipat dari pendahulunya. Ketika model tumbuh dalam kompleksitas, kebutuhan komputasi untuk melatihnya juga meningkat.
Sekali dilatih, AIs membutuhkan lebih sedikit kapasitas penguraian angka untuk digunakan dalam proses yang disebut inferensi. Tetapi mengingat berbagai aplikasi yang ditawarkan, inferensi akan, secara kumulatif, juga menuntut banyak pemrosesan. Microsoft memiliki lebih dari 2.500 pelanggan untuk layanan yang menggunakan teknologi dari OpenAIMengobrolGPTpenciptanya, yang hampir setengahnya dimiliki oleh raksasa perangkat lunak itu. Itu naik sepuluh kali lipat sejak kuartal sebelumnya. Perusahaan induk Google, Alphabet, memiliki enam produk dengan 2 miliar pengguna atau lebih secara global—dan berencana untuk meningkatkannya dengan generatif AI.
Pemenang paling jelas dari lonjakan permintaan daya komputasi adalah pembuat chip. Produk perusahaan seperti Nvidia dan AMD, yang mendesain chip dan membuatnya di pengecoran seperti TSMC, sangat diminati, terutama dari penyedia komputasi awan besar yang paling berkuasa AI aplikasi. AI dengan demikian merupakan keuntungan bagi perancang chip, karena mendapat manfaat dari chip yang lebih kuat (yang cenderung menghasilkan margin lebih tinggi), dan lebih banyak lagi. UBSsebuah bank, menghitungnya dalam satu atau dua tahun ke depan AI akan meningkatkan permintaan chip spesialis yang dikenal sebagai unit pemrosesan grafis (GPUs) sebesar $10 miliar-15 miliar.
Akibatnya, pendapatan pusat data tahunan Nvidia, yang menyumbang 56% dari penjualannya, bisa berlipat ganda. AMD mengeluarkan yang baru GPU akhir tahun ini. Meskipun itu adalah pemain yang jauh lebih kecil di GPU-desain permainan dari Nvidia, skala AI booming berarti bahwa perusahaan siap untuk mendapatkan keuntungan “bahkan jika itu hanya mendapatkan ampas” dari pasar, kata Stacy Rasgon dari Bernstein, seorang pialang. Fokus pada startup desain chip AI, seperti Cerebras dan Graphcore, mencoba membuat nama untuk diri mereka sendiri. PitchBook, penyedia data, menghitung sekitar 300 perusahaan semacam itu.
Secara alami, beberapa rejeki nomplok juga akan bertambah ke produsen. Pada bulan April TSMCbosnya, CC Wei, berbicara dengan hati-hati tentang “peningkatan kenaikan AI-permintaan terkait”. Investor agak lebih antusias. Harga saham perusahaan naik 10% setelah pendapatan terbaru Nvidia, menambahkan sekitar $20 miliar ke kapitalisasi pasarnya. Penerima manfaat yang kurang jelas juga termasuk perusahaan yang mengizinkan lebih banyak chip untuk dikemas ke dalam satu unit pemrosesan. Besi, sebuah perusahaan Belanda, membuat alat yang membantu menyatukan chip. Menurut Pierre Ferragu dari New Street Research, firma analis lainnya, perusahaan Belanda tersebut menguasai tiga perempat pasar untuk ikatan presisi tinggi. Harga sahamnya telah melonjak lebih dari setengah tahun ini.
UBS memperkirakan itu gpuIni membuat sekitar setengah biaya khusus AI server, dibandingkan dengan sepersepuluh untuk server standar. Tapi itu bukan satu-satunya peralatan yang diperlukan. Untuk bekerja sebagai satu komputer, pusat data GPUKita juga perlu berbicara satu sama lain.
Itu, pada gilirannya, membutuhkan peralatan jaringan yang semakin canggih, seperti sakelar, router, dan chip spesialis. Pasar kit semacam itu diperkirakan akan tumbuh sebesar 40% setiap tahun dalam beberapa tahun mendatang, menjadi hampir $9 miliar pada tahun 2027, menurut 650 Group, sebuah perusahaan riset. Nvidia, yang juga melisensikan kit semacam itu, menyumbang 78% dari penjualan global. Tetapi pesaing seperti Arista Networks, sebuah perusahaan California, juga mendapat perhatian dari investor: harga sahamnya naik hampir 70% dalam setahun terakhir. Broadcom, yang menjual chip spesialis yang membantu jaringan beroperasi, mengatakan bahwa penjualan tahunan semikonduktor semacam itu akan meningkat empat kali lipat pada tahun 2023, menjadi $800 juta.
Itu AI booming juga kabar baik bagi perusahaan yang merakit server yang masuk ke pusat data, catat Peter Rutten dari IDC, perusahaan riset lain. Grup Dell’Oro, satu lagi firma analis, memprediksi bahwa pusat data di seluruh dunia akan meningkatkan pangsa server yang didedikasikan untuk AI dari kurang dari 10% hari ini menjadi sekitar 20% dalam lima tahun, dan bagian kit dari belanja modal pusat data untuk server akan meningkat dari sekitar 20% hari ini menjadi 45%.
Ini akan menguntungkan produsen server seperti Wistron dan Inventec, keduanya dari Taiwan, yang memproduksi server yang dibuat khusus terutama untuk penyedia cloud raksasa seperti Amazon Web Services (AWS) dan Microsoft Azure. Pabrikan yang lebih kecil juga harus melakukannya dengan baik. Bos Wiwynn, pembuat server Taiwan lainnya, baru-baru ini mengatakan hal itu AI-Proyek terkait menyumbang lebih dari setengah dari buku pesanan mereka saat ini. Super Micro, sebuah perusahaan Amerika, mengatakan bahwa dalam tiga bulan hingga April AI produk menyumbang 29% dari penjualannya, naik dari rata-rata 20% dalam 12 bulan sebelumnya.
Semua ini AI perangkat keras memerlukan perangkat lunak khusus untuk beroperasi. Beberapa dari program ini berasal dari perusahaan perangkat keras; Platform perangkat lunak Nvidia, disebut CUDAmemungkinkan pelanggan memanfaatkannya secara maksimal GPUs, misalnya. Perusahaan lain membuat aplikasi yang memungkinkan AI perusahaan mengelola data (Datagen, Pinecone, Scale AI) atau host model bahasa besar (HuggingFace, Replicate). PitchBook menghitung sekitar 80 startup semacam itu. Lebih dari 20 telah meningkatkan modal baru sepanjang tahun ini; Pinecone menghitung Andreessen Horowitz dan Tiger Global, dua raksasa modal ventura, sebagai investor.
Seperti halnya perangkat keras, pelanggan utama untuk sebagian besar perangkat lunak ini adalah raksasa cloud. Bersama-sama Amazon, Alphabet, dan Microsoft berencana untuk melakukan belanja modal sekitar $120 miliar tahun ini, naik dari $78 miliar pada tahun 2022. Sebagian besar dari itu akan digunakan untuk memperluas kapasitas cloud mereka. Meski begitu, permintaan untuk AI komputasi sangat tinggi bahkan mereka berjuang untuk mengikutinya.
Itu telah menciptakan celah bagi para penantang. Dalam beberapa tahun terakhir IBMNvidia dan Equinix sudah mulai menawarkan akses ke GPUs “sebagai layanan”. AIStartup cloud yang terfokus juga berkembang biak. Pada bulan Maret, salah satunya, Lambda, mengumpulkan $44 juta dari investor seperti Gradient Ventures, salah satu unit ventura Google, dan Greg Brockman, salah satu pendiri OpenAI. Kesepakatan itu menghargai perusahaan sekitar $ 200 juta. Pakaian serupa, CoreWeave, mengumpulkan $221 juta pada bulan April, termasuk dari Nvidia, dengan nilai $2 miliar. Brannin McBee, salah satu pendiri CoreWeave, berpendapat bahwa fokus pada layanan pelanggan dan infrastruktur dirancang berdasarkan AI membantunya bersaing dengan raksasa awan.
Kelompok terakhir dari AI-pemenang infrastruktur paling dekat dengan menyediakan sekop yang sebenarnya: tuan tanah pusat data. Saat permintaan komputasi awan melonjak, properti mereka terisi penuh. Pada paruh kedua tahun 2022 tingkat kekosongan pusat data mencapai 3%, rekor terendah. Spesialis seperti Equinix atau saingannya, Digital Realty, semakin bersaing dengan manajer aset besar, yang ingin menambahkan pusat data ke portofolio properti mereka. Pada tahun 2021 Blackstone, raksasa pasar swasta, membayar $10 miliar QTS Realty Trust, salah satu operator pusat data terbesar di Amerika. Pada bulan April Brookfield, saingan Kanada Blackstone yang telah banyak berinvestasi di pusat data, membeli Data4, sebuah perusahaan pusat data Perancis.
Pertumbuhan lanjutan dari AI-tumpukan infrastruktur masih bisa berjalan melawan kendala. Salah satunya adalah energi. Seorang investor besar di pusat data mencatat bahwa akses ke listrik, di mana pusat data adalah pengguna yang luar biasa, diperkirakan akan memperlambat pengembangan pusat data baru di hub seperti Virginia utara dan Silicon Valley. Blok potensial lainnya adalah pergeseran dari luas AI model dan inferensi berbasis cloud ke sistem yang lebih kecil yang membutuhkan lebih sedikit daya komputasi untuk melatih dan dapat menjalankan inferensi pada ponsel cerdas, seperti kasus Google yang baru-baru ini meluncurkan versi Pa-nya yang diperkecil.LM model.
Tanda tanya terbesar tergantung pada kelanggengan ledakan AI itu sendiri. Terlepas dari popularitas ObrolanGPT dan sejenisnya, kasus penggunaan yang menguntungkan untuk teknologi tersebut masih belum jelas. Di Silicon Valley, hype bisa berubah menjadi kekecewaan. Nilai pasar Nvidia melonjak pada tahun 2021 GPUs ternyata sempurna untuk menambang bitcoin dan mata uang kripto lainnya, kemudian runtuh saat ledakan kripto berubah menjadi bangkrut.
Dan jika teknologinya memenuhi tagihan transformatifnya, regulator dapat menekannya. Pembuat kebijakan di seluruh dunia, khawatir tentang generatif AIpotensi untuk menghilangkan pekerjaan atau menyebarkan informasi yang salah, sudah menjadi pagar pembatas. Memang, pada 11 Mei anggota parlemen di UE mengusulkan seperangkat aturan yang akan membatasi chatbots.
Semua faktor pembatas ini mungkin melambat AIpenyebaran, dan dengan demikian meredam prospek AI-perusahaan infrastruktur. Tapi mungkin hanya sedikit. Sekalipun generatif AI ternyata tidak setransformatif seperti yang diklaim oleh para pendukungnya, hampir pasti akan lebih berguna daripada kripto. Dan masih banyak lainnya, non-generatif AIs yang juga membutuhkan banyak daya komputasi. Tidak kurang dari larangan global pada generatif AI, yang tidak terlihat, kemungkinan besar akan menghentikan demam emas. Dan selama semua orang bergegas, pedagang beliung dan sekop akan menguangkan. ■
Untuk terus mengikuti berita terbesar dalam bisnis dan teknologi, daftar ke Bottom Line, buletin khusus pelanggan mingguan kami.