Berusaha sekuat tenaga untuk membangun chip AWS khusus Amazon sedang mengejar Microsoft dan Google dalam AI generatif

Fokus pada

  • 1 Dengan Microsoft dan Google memimpin di bidang kecerdasan buatan generatif, Amazon juga mengejar. Dilaporkan bahwa perusahaan tersebut diam-diam merancang dua chip di Austin, Texas, untuk melatih dan mempercepat kecerdasan buatan generatif. .
  • 2 Dua chip khusus yang dikembangkan oleh Amazon, Inentia dan Trainium, menawarkan kepada pelanggan Amazon Cloud Services AWS alternatif dari GPU Nvidia yang semakin sulit didapat untuk melatih model bahasa besar.
  • 3 Dominasi AWS dalam komputasi awan merupakan keuntungan besar bagi Amazon. AWS adalah penyedia komputasi awan terbesar di dunia, menguasai 40% pasar pada tahun 2022.
  • 4 Analis yakin chip khusus Amazon dapat memberikan keunggulan dalam kecerdasan buatan generatif dalam jangka panjang.

Di dua ruangan kecil di gedung perkantoran sederhana di Austin, Texas, beberapa karyawan Amazon merancang dua jenis microchip untuk melatih dan mempercepat kecerdasan buatan generatif. Dua chip khusus, dengan nama kode Inentia dan Trainium, menawarkan kepada pelanggan Amazon Web Services alternatif dari prosesor grafis Nvidia untuk melatih model bahasa besar. Saat ini, semakin sulit dan mahal untuk mendapatkan prosesor grafis Nvidia.

"Seluruh dunia menginginkan lebih banyak chip untuk AI generatif, apakah itu unit pemrosesan grafis atau desain Amazon sendiri," kata CEO AWS Adam Selipsky dalam wawancara bulan Juni. Saya pikir kami lebih mungkin daripada perusahaan lain di dunia untuk memberikan pelanggan kami kemampuan yang diinginkan semua orang.”

Namun, perusahaan lain bergerak lebih cepat, menggelontorkan lebih banyak uang, dan meminjam dari ledakan AI. Ketika OpenAI meluncurkan ChatGPT November lalu, Microsoft mendapat banyak perhatian karena menghosting chatbot AI yang eksplosif. Microsoft dilaporkan menginvestasikan $13 miliar di OpenAI. Microsoft dengan cepat menambahkan model kecerdasan buatan generatif ke produknya sendiri dan mengintegrasikannya ke dalam Bing pada bulan Februari.

Pada bulan yang sama, Google meluncurkan model bahasa besarnya sendiri, Bard, dan kemudian menginvestasikan $300 juta dalam pesaing OpenAI, Anthropic.

Baru pada bulan April tahun ini Amazon mengumumkan model bahasa besarnya sendiri, Titan, dan pada saat yang sama meluncurkan layanan yang disebut Bedrock untuk membantu pengembang menggunakan kecerdasan buatan generatif untuk meningkatkan kemampuan perangkat lunak.

"Amazon tidak terbiasa mengejar pasar, tapi menciptakannya," kata Chirag Dekate, wakil presiden dan analis Gartner. "Saya pikir untuk pertama kalinya dalam waktu yang lama, mereka melihat saya dirugikan dan sekarang aku mencoba untuk mengejar."

Meta juga baru-baru ini merilis model bahasa besarnya sendiri Llama 2, pesaing ChatGPT sumber terbuka yang sekarang tersedia untuk pengujian di cloud publik Microsoft Azure.

Chip mewakili "Diferensiasi Sejati"

Dalam jangka panjang, chip khusus Amazon dapat memberikan keunggulan dalam kecerdasan buatan generatif, kata Decatur. “Menurut saya perbedaan sebenarnya adalah kemampuan teknis yang mereka miliki, karena Microsoft tidak memiliki Trainium atau Interentia,” jelasnya.

Gambar: AWS mulai memproduksi chip kustom Nitro pada tahun 2013, yang saat ini merupakan chip AWS terbesar

Kembali pada tahun 2013, AWS diam-diam mulai memproduksi chip khusus dengan perangkat keras khusus yang disebut Nitro. Amazon mengungkapkan bahwa Nitro saat ini merupakan chip AWS dengan kapasitas terbesar, dan setidaknya ada satu di setiap server AWS, dengan total penggunaan lebih dari 20 juta.

Pada 2015, Amazon mengakuisisi Annapurna Labs, sebuah startup chip Israel. Kemudian pada tahun 2018, Amazon meluncurkan Graviton, sebuah chip server yang didasarkan pada arsitektur Arm desainer chip Inggris, pesaing CPU x86 dari raksasa seperti AMD dan Nvidia.

"Arm chip dapat mewakili sebanyak 10% dari total penjualan server, dan sebagian besar dari itu akan datang dari Amazon," kata Stacy Rasgon, seorang analis senior di Bernstein Research. Jadi di sisi CPU, mereka telah melakukan hal yang cukup baik. kerja bagus."

Juga di tahun 2018, Amazon meluncurkan chip yang berfokus pada kecerdasan buatan. Dua tahun lalu, Google merilis Tensor Processor Unit (TPU) pertamanya. Microsoft belum mengumumkan Athena, chip kecerdasan buatan yang dikembangkannya dengan AMD.

Amazon memiliki lab pada sebuah chip di Austin, Texas, tempat ia mengembangkan dan menguji Trainium dan Inferentia. Matt Wood, wakil presiden produk perusahaan, menjelaskan fungsi kedua chip tersebut.

Dia berkata: "Pembelajaran mesin dibagi menjadi dua tahap berbeda ini. Jadi, Anda perlu melatih model pembelajaran mesin, lalu melakukan inferensi pada model yang dilatih ini. Dibandingkan dengan cara lain untuk melatih model pembelajaran mesin di AWS, Tradium di Harga/ rasio kinerja telah ditingkatkan sekitar 50%.”

Trainium memulai debutnya pada tahun 2021, menyusul peluncuran Interentia generasi kedua pada tahun 2019. Interentia memungkinkan pelanggan untuk "menyediakan inferensi pembelajaran mesin berbiaya rendah, throughput tinggi, latensi rendah, yang merupakan semua prediksi yang Anda dapatkan saat memberi isyarat ke dalam model AI generatif, semua itu diproses, lalu Anda mendapatkan tanggapan," kata Wood. "

Namun, untuk saat ini, GPU Nvidia masih menjadi raja yang tak terbantahkan dalam hal model pelatihan. Pada bulan Juli, AWS meluncurkan perangkat keras akselerasi AI baru berdasarkan Nvidia H100.

"Dalam 15 tahun terakhir, Nvidia telah membangun ekosistem perangkat lunak besar di sekitar chipnya yang tidak dimiliki oleh perusahaan lain. Saat ini, pemenang terbesar dalam AI adalah Nvidia," kata Rasgon.

Gambar: Chip khusus Amazon, dari kiri ke kanan adalah Inferentia, Trainium, dan Graviton

Amazon memiliki keunggulan komputasi awan

Namun, dominasi AWS dalam komputasi awan merupakan keuntungan besar bagi Amazon.

"Amazon tidak memerlukan perhatian ekstra, perusahaan sudah memiliki basis penginstalan cloud yang sangat kuat. Yang perlu mereka lakukan hanyalah memikirkan cara menggunakan kecerdasan buatan generatif untuk membuat pelanggan saat ini berkembang menjadi gerakan penciptaan nilai."

Saat memilih kecerdasan buatan generatif antara Amazon, Google, dan Microsoft, jutaan pelanggan AWS mungkin tertarik ke Amazon karena mereka sudah terbiasa dengan Amazon dan menjalankan aplikasi lain serta menyimpan data di sana.

“Ini masalah kecepatan," jelas Mai-Lan Tomsen Bukovec, wakil presiden teknologi di AWS. "Seberapa cepat perusahaan ini dapat mengembangkan aplikasi AI generatif ini, terserah mereka untuk memulai dengan data di AWS terlebih dahulu dan menjalankannya dengan alat komputasi dan pembelajaran mesin yang kami sediakan."

Menurut data yang diberikan oleh Gartner, AWS adalah penyedia komputasi awan terbesar di dunia, menguasai 40% pasar pada tahun 2022. Meskipun laba operasi Amazon menurun dari tahun ke tahun selama tiga kuartal berturut-turut, AWS masih menyumbang 70% dari laba operasi Amazon senilai $7,7 miliar pada kuartal kedua. AWS secara historis memiliki margin operasi yang jauh lebih tinggi daripada Google Cloud.

Selain itu, AWS memiliki portofolio alat pengembang yang terus berkembang yang berfokus pada kecerdasan buatan generatif. Swami Sivasubramanian, wakil presiden AWS untuk database, analitik, dan pembelajaran mesin, berkata: "Mari kita memutar balik waktu, bahkan kembali ke sebelum ChatGPT. Ini tidak seperti yang terjadi setelah itu. , kami tiba-tiba membuat rencana dengan tergesa-gesa, karena Anda tidak dapat mendesain chip baru secepat itu, apalagi membangun layanan dasar dalam dua hingga tiga bulan.”

Bedrock memberi pelanggan AWS akses ke model bahasa besar yang dikembangkan oleh Anthropic, Stability AI, AI21 Labs, dan Amazon Titan. "Kami tidak percaya bahwa satu model akan menguasai dunia, kami ingin pelanggan kami memiliki model tercanggih dari berbagai vendor karena mereka akan memilih alat yang tepat untuk pekerjaan yang tepat," kata Sivasubramanian.

Foto: Di AWS Chip Lab di Austin, Texas, karyawan Amazon sedang mengembangkan chip kecerdasan buatan khusus

Salah satu penawaran AI terbaru dari Amazon adalah AWS HealthScribe, layanan yang diluncurkan pada bulan Juli untuk membantu dokter menggunakan kecerdasan buatan generatif untuk menyusun ringkasan kunjungan pasien. Amazon juga memiliki pusat pembelajaran mesin, SageMaker, yang menyediakan algoritme, model, dan layanan lainnya.

Alat penting lainnya adalah CodeWhisperer, yang menurut Amazon memungkinkan pengembang menyelesaikan tugas rata-rata 57 persen lebih cepat. Tahun lalu, Microsoft juga melaporkan bahwa alat pengkodeannya, GitHub Copilot, telah meningkatkan produktivitas.

Pada bulan Juni tahun ini, AWS mengumumkan pendirian pusat inovasi kecerdasan buatan generatif senilai $100 juta. CEO AWS Selipsky berkata: "Kami memiliki banyak pelanggan yang menginginkan teknologi kecerdasan buatan generatif, tetapi mereka belum tentu tahu apa artinya ini bagi mereka dalam konteks bisnis mereka sendiri. Oleh karena itu, kami akan memperkenalkan solusi Solusi arsitek, insinyur, ahli strategi, dan ilmuwan data, bekerja dengan mereka secara pribadi."

CEO Jassy secara pribadi memimpin tim untuk membangun model bahasa yang besar

Sementara AWS sejauh ini berfokus terutama pada pengembangan alat daripada membangun pesaing ChatGPT, email internal yang bocor baru-baru ini mengungkapkan bahwa CEO Amazon Andy Jassy secara langsung mengawasi tim pusat baru, yang juga membangun model bahasa besar yang dapat diskalakan.

Selama panggilan pendapatan kuartal kedua, Jassy mengatakan bahwa "porsi substansial" dari bisnis AWS sekarang didorong oleh kecerdasan buatan dan lebih dari 20 layanan pembelajaran mesin yang didukungnya, yang pelanggannya termasuk Philips, 3M, Old Mutual, dan HSBC.

Ledakan kecerdasan buatan telah menimbulkan sejumlah masalah keamanan, dengan perusahaan khawatir tentang karyawan yang memasukkan informasi hak milik ke dalam data pelatihan yang digunakan oleh model bahasa besar publik.

"Saya tidak dapat memberi tahu Anda berapa banyak perusahaan Fortune 500 yang telah saya ajak bicara yang telah menonaktifkan ChatGPT," kata Selipsky, CEO AWS. Apa pun yang Anda lakukan, model apa pun yang Anda gunakan, itu akan berada di lingkungan cloud pribadi virtual Anda yang terisolasi. Itu akan dienkripsi, itu akan memiliki kontrol akses AWS yang sama."

Untuk saat ini, Amazon hanya mempercepat dorongannya ke AI generatif, mengklaim bahwa "lebih dari 100.000" pelanggan saat ini menggunakan pembelajaran mesin di AWS. Meskipun itu adalah sebagian kecil dari jutaan pelanggan AWS, analis mengatakan hal itu dapat berubah.

"Kami tidak melihat perusahaan mengatakan: Oh, tunggu, Microsoft sudah memimpin dalam AI generatif, ayo keluar, mari ubah strategi Infrastruktur kami, pindahkan semuanya ke Microsoft. Jika Anda sudah menjadi pelanggan Amazon, kemungkinan besar Anda akan menjelajahi Ekosistem Amazon secara lebih luas." (Teks / Jinlu)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)