CTO Google Cloud, Will Grannis Memprediksi 3 Gen AI di Tahun 2024

 

Artificial Intelligence

Google setiap tahun google melakukan refleksi
untuk memprediksi perubahan khususnya perubahan besar yang dibawa oleh AI ke
dalam perusahaan, budaya global, dan dunia yang lebih luas. Tujuannya untuk
mempertimbangkan apa yang diperlukan untuk memanfaatkan AI secara maksimal di
organisasi, institusi dan perusahaan.

Will Grannis, CTO Google Cloud, berbagi
prediksinya tentang hal-hal yang diperlukan untuk memanfaatkan gen AI secara
maksimal tahun ini, dan cara melakukannya dengan aman, terjamin, berkelanjutan,
dan secara kreatif.

Bagi organisasi di mana pun, kegembiraan
AI pada tahun 2023 dengan cepat memberi jalan pada sesuatu yang lebih menarik
dan bermanfaat: hasil bisnis yang didukung AI yang penting. Alasannya mencakup
kemajuan terkini dalam kemampuan AI di seluruh tumpukan komputasi yang
memungkinkan organisasi di industri, geografi, atau fase pertumbuhan apa pun
untuk mengakses potensi yang biasanya hanya dimiliki segelintir orang. Dengan
banyaknya orang yang bekerja dengan kemampuan baru ini, diharapkan banyak
inovasi dan hasil. 

Rangkaian model seperti Gemini dari Google
adalah ekspresi terkuat dari terobosan awal AI generatif, yang memungkinkan
manusia dan perangkat berinteraksi dalam bahasa alami manusia. Komputer yang
dipandu oleh dorongan manusia mensintesis data dalam jumlah yang tak
terbayangkan untuk mencerna informasi, membuat prediksi, membantu tugas, atau
membuat konten baru, mulai dari teks hingga gambar hingga kode komputer baru.
Gemini mengambil langkah lebih jauh dari sebelumnya sebagai model multimoda
asli pertama di dunia. 

Catatan:

Gemini adalah model bahasa besar
multimodal yang dikembangkan oleh Google DeepMind, yang berfungsi sebagai
penerus LaMDA dan PaLM 2. Terdiri dari Gemini Ultra, Gemini Pro, dan Gemini
Nano, diumumkan pada 6 Desember 2023, diposisikan sebagai pesaing GPT-4 OpenAI.
Google mengumumkan Gemini, model bahasa besar (LLM) yang dikembangkan oleh anak
perusahaan Google DeepMind, dalam event keynote Google I/O pada 10 Mei 2023,
yang juga diluncurkan CEO Google Sundar Pichai

Gemini dikatakan unik karena tidak dilatih
pada korpus teks saja dan dirancang untuk menjadi multimodal , artinya dapat
memproses beberapa jenis data secara bersamaan, termasuk teks, gambar, audio,
video, dan kode komputer. Program ini dikembangkan sebagai kolaborasi antara
DeepMind dan Google Brain, dua cabang Google yang telah digabungkan menjadi
Google DeepMind pada bulan sebelumnya

Setelah momen “wow” di tahun 2023, banyak
perusahaan menghadapi pertanyaan, “Apa pengaruhnya bagi bisnis kita, dan berapa
biayanya?” Sebagai chief technology officer Google Cloud, Will Grannis memahami
arah perkembangan teknologi (konvergensi asisten AI, platform, dan
infrastruktur), dan bagaimana beberapa organisasi terkemuka di dunia telah
memanfaatkannya. Secara umum, Grannis melihat tiga pilar utama yang akan
memengaruhi cara perusahaan memahami, menerapkan, dan menggunakan gen AI pada
tahun 2024: ekonomi dan energi, keberadaan dan akses, serta kepercayaan dan
keamanan. 

Ekonomi dan energi

Kelangsungan hidup gen AI dalam suatu
perusahaan seringkali berpusat pada biaya-biaya utama, baik dari segi finansial
maupun lingkungan hidup. Eksekusi yang disiplin akan memuaskan kehidupan
finansial bisnis dan semakin pentingnya kepatuhan terhadap peraturan dan
kewarganegaraan perusahaan.

Gen AI menggunakan komputasi yang sangat
besar, dengan biaya dan tantangan sosial seputar penggunaan energi. Pelanggan
akan memerlukan pengetahuan tentang cara pengelolaan energi untuk pusat data
dan fleksibilitas untuk mengoptimalkan produksi menggunakan wilayah dan zona
yang paling bersih . Hal ini kemungkinan besar akan mempengaruhi praktik
penulisan perangkat lunak dan mungkin menerapkan penganggaran karbon sebagai
bagian dari praktik pengembang. Pelanggan ingin kami melanjutkan upaya
keberlanjutan yang signifikan , dan dapat dipastikan bahwa permintaan dan
pentingnya generasi AI yang berkelanjutan akan meningkat pada tahun 2024.  

Model bahasa besar, atau LLM , yang
mendukung AI memerlukan pelatihan yang efisien, penyesuaian, inferensi, dan
manajemen siklus hidup. Kurva biaya menuntut pelaksanaan yang terfokus dan
berprinsip, terutama seiring dengan meningkatnya skala proyek. Itulah salah
satu alasan mengapa kami membangun infrastruktur AI yang dioptimalkan untuk
mendukung Vertex, platform AI andalan kami.   

Google memasukkan AI ke dalam penelusuran
pada tahun 2015. Dengan merasakan langsung tantangan perluasan AI ini — dan
mengetahui bahwa secara historis, 50% atau lebih biaya perangkat lunak adalah
pemeliharaan, termasuk penyempurnaan — menjadikan efisiensi sebagai prioritas
awal kami. Jadi kami mengembangkan Tensor Processing Units (TPU), yaitu chip
khusus yang menangani beban kerja AI, termasuk gen AI, dengan biaya yang jauh
lebih rendah dan penggunaan energi yang lebih baik . Menjadi pengelola dana
investasi pelanggan yang langka dan pasokan energi global yang terbatas
merupakan prioritas yang tidak dapat dinegosiasikan bagi semua organisasi
modern.   

Keberadaan dan akses

Bagi banyak orang, pengalaman pertama
dengan gen AI akan berupa produk seperti alat untuk mengubah database lama
menjadi produk baru dan lebih canggih, asisten untuk membantu mengelola
kehidupan kerja Anda, atau bot yang menawarkan jawaban berkualitas tinggi atas
pertanyaan medis. Semua ini bertumpu pada paradigma komputasi baru yang
menggunakan lebih banyak data, dari lebih banyak sumber, dan dengan cara yang
lebih fleksibel. Informasi dalam penagihan rumah sakit, misalnya, dapat
dikumpulkan untuk mengetahui tren kesehatan nasional atau digunakan untuk
melacak berapa lama waktu yang dibutuhkan untuk memberikan layanan di berbagai
lokasi, untuk mengetahui kekurangan perawat.

Hal semacam ini akan mungkin terjadi
dengan menggunakan model dan alat dasar yang tepat , bahkan dalam organisasi
dengan staf dan sumber daya yang terbatas. Karena gen ini sudah ada dan ada di
mana-mana, gen AI tidak berarti model, melainkan pengalaman yang bermanfaat dan
mungkin ajaib.

Ada juga permasalahan dalam memastikan gen
AI dapat diakses dan bermanfaat bagi semua orang di pasar, tidak hanya untuk
beberapa perusahaan raksasa. Alat dan platform harus memungkinkan siapa saja
untuk memulai AI secara efisien dan bertanggung jawab , dan hal ini harus mudah
ditemukan dan ditampilkan. Beberapa hal akan menjadi kabur, termasuk
perpindahan yang lebih mulus antara lingkungan eksperimen berbasis web ke
lingkungan yang kuat dan mendukung platform dengan keamanan dan jaminan yang
kuat.

Selain itu, gen AI akan mengubah banyak
perangkat lunak dari produk generik menjadi produk yang disesuaikan dengan
kebutuhan dan budaya setiap perusahaan, bahkan beradaptasi dengan pekerja dan
pelanggan individu. Membumikan dan menyempurnakan LLM dengan data perusahaan
yang dipatenkan memungkinkan konteks dan pengetahuan yang ada di perusahaan
untuk mempertajam kinerja suatu model. Pengenalan teknik “ penyesuaian
parameter yang efisien ” akan membuat penyesuaian ini jauh lebih realistis
untuk organisasi yang lebih luas.

Kita akan melihat kemajuan pesat dalam
penyulingan, ansambel, dan federasi (semua cara yang muncul untuk mempertajam
keluaran model dengan lebih baik) serta alat pembuat konten baru yang akan
membuka pengembangan bagi lebih banyak pekerja. Organisasi-organisasi di
industri yang memiliki regulasi ketat, seperti keuangan dan layanan kesehatan,
cenderung mengambil pendekatan yang lebih terkendali dibandingkan bisnis
seperti game dan media.

Kepercayaan dan keamanan

Yang mendasari seluruh gangguan pada
generasi AI adalah kebutuhan mendasar manusia dan organisasi akan kepercayaan
terhadap penyedia layanan yang bertanggung jawab . Contoh layanan kesehatan di
atas adalah ide yang menarik, namun hal ini memperkuat kebutuhan akan enkripsi
data yang menyeluruh dan keamanan yang ditingkatkan AI untuk mengakses data di
beberapa lokasi sekaligus, termasuk cloud dan sistem lokal yang berbeda, serta
pemantauan biaya yang efektif.

Kemajuan terbaru kami yang berbasis di
Gemini dalam hal produktivitas, deteksi ancaman, dan respons membawa gen AI ke
garis depan keamanan perusahaan. Hal ini justru menggarisbawahi kenyataan bahwa
ancaman tidak akan hilang dan mungkin akan memperoleh kemampuan yang didukung
AI. Keamanan juga memerlukan alat AI generasinya sendiri , yang mampu mengenali
dan menjelaskan ancaman dengan cara yang benar-benar baru. Model bahasa khusus
domain kami, Sec-Palm 2 , dilatih dalam berbagai kasus penggunaan keamanan, yang
mampu mengenali skrip yang berpotensi berbahaya secara instan dan mengingatkan
tim akan ancaman aktif.

Sama seperti seseorang memutuskan apakah
akan memercayai apa yang mereka lihat, dengar, dan baca berdasarkan
perbandingan dengan apa yang mereka alami sebelumnya, organisasi juga akan
mulai mengindeks apa yang mereka ketahui. Mereka kemudian dapat menjadikan
pengetahuan dan data lebih mudah diakses dan berguna dalam penciptaan
pengalaman, efisiensi, dan diferensiasi yang bertindak sebagai perpanjangan
tangan terpercaya atas kredibilitas yang telah mereka peroleh dengan susah
payah.

Memulai pada tahun 2024

Kita sekarang berada pada tingkat baru
yang luar biasa dalam interaksi manusia-komputer. Ini semakin kuat bahkan
semakin mudah digunakan, baik untuk pengembang individu maupun perusahaan. Kami
yakin hal ini bukan berarti mengakhiri lapangan kerja, namun akan memberikan
tuntutan baru terhadap kreativitas, kolaborasi, dan penemuan manusia yang
sepadan dengan tantangan yang dihadapi dunia saat ini.

Pada tahun-tahun mendatang dan seterusnya,
kita akan melihat gen AI menjadi lebih berguna, dengan transparansi yang lebih
besar mengenai cara kerja, biaya, dan cara terbaik menerapkannya untuk
menciptakan pengalaman terobosan. Dengan cara ini, hype akan memberi jalan pada
nilai dan kesenangan yang tulus.

Banyak bisnis telah dimulai, dan yang
lainnya ingin terlibat dengan AI. Ada banyak cara untuk belajar, mulai dari
ikhtisar video dan dasar-dasar industri serta tutorial pelatihan atau kelas dan
sertifikasi. Keterlibatan bisa sesederhana mencoba solusi out-of-the-box untuk
kolaborasi atau dalam meningkatkan kinerja call center. Setelah Anda dan
organisasi Anda melihat betapa mudahnya untuk memulai, saya yakin kreativitas
Anda akan membuka lebih banyak kasus penggunaan dan pengalaman yang memajukan
kita semua.

Oleh Will Grannis, CTO Google Cloud
seperti yang disarikan catatannya pada google cloud.

Sumber: terasacademy.com

You might also like