Jakarta –
Google I/O 2024 resmi digelar pada Rabu pagi WIB (15/05/2024). Selama sesi keynote, raksasa pencarian internet ini mengumumkan beberapa inovasi dan proyek yang akan membentuk masa depan teknologi.
Berbeda dengan tahun-tahun sebelumnya, Google I/O 2024 akan fokus pada pembahasan teknologi kecerdasan buatan (AI) yang dikembangkan perusahaan. Salah satu tema yang paling ditekankan adalah Gemini.
Sundar Pichai, kepala optimasi mesin pencari Google dan Alphabet, saat membuka konferensi utama Google I/O 2024 yang diadakan dengan gaya campuran, “Google sepenuhnya berada di era Gemini.
Sejak diumumkan di Google I/O 2023, Gemini terus berkembang. Dua bulan lalu, Google memperkenalkan Gemini 1.5 Pro, yang dapat memproses 1 juta token dalam satu permintaan.
Perusahaan yang berbasis di Mountain View berupaya agar Gemini dapat digunakan oleh lebih banyak pengguna. Saat ini, lebih dari 1,5 juta pengembang menggunakan model Gemini untuk membangun aplikasi AI generasi berikutnya.
“Kami telah secara efektif membangun kemampuan Gemini ke dalam produk kami. Hari ini kami meninjau Penelusuran, Foto, Ruang Kerja, Android, dan lainnya,” kata Sundar Pinchai.
Pada konferensi utama Google I/O 2024, dilakukan 9 pengumuman penting yaitu: 1. Gemini
Google mengumumkan bahwa Gemini 1.5 Flash menawarkan alternatif berkecepatan tinggi dan hemat biaya untuk Gemini 1.5 Pro, namun tetap sangat efisien. Pada saat yang sama, Gemini 1.5 Pro juga telah ditingkatkan untuk memberikan kualitas jawaban yang lebih baik di berbagai bidang seperti terjemahan, logika, pemrograman, dll.
Google mengumumkan 1 juta jendela konteks untuk Gemini Advanced, yang membantu konsumen mendapatkan dukungan AI untuk dokumen berukuran besar, seperti PDF hingga 1.500 halaman atau 100 email. Saat ini, Google mengatakan Gemini 1.5 Pro dan Gemini 1.5 Flash sedang mencari dua juta jendela untuk pengembang di daftar tunggu Google AI Studio.
Tak kalah menariknya, Google mengumumkan multimodalitas Gemini Nano. Model ini dirancang untuk dijalankan pada ponsel pintar dan telah diperluas untuk memahami gambar, teks, dan bahasa lisan.
Berbicara tentang Gemma, keluarga model Gemini juga tumbuh lebih besar dengan peluncuran Gemma 2, yang dioptimalkan untuk 27B TPU dan GPU. Tak hanya itu, Google mengumumkan PaliGemma yang telah ditambahkan ke keluarga model Gemma.
2. Proyek Astra
Google DeepMind telah meluncurkan proyek Astra, yang diharapkan dapat mengubah masa depan asisten AI dengan kemampuan memahami video. Tujuan dari proyek Astra adalah untuk mengembangkan agen AI umum yang dapat membantu dalam kehidupan sehari-hari.
Selama demonstrasi, model penelitian ini menunjukkan kemampuannya dengan Mengidentifikasi objek yang mengeluarkan suara, mengubah simbol, dan menjelaskan kode yang ditampilkan di monitor dan mencari objek yang hilang.
Proyek Astra juga menunjukkan potensi perangkat yang dapat dikenakan seperti kacamata pintar, yang dapat menganalisis diagram, menyarankan perbaikan, dan menghasilkan respons cerdas terhadap rangsangan visual. Ke depan, Gemini akan menggunakan kemampuan pemahaman video Project Astra untuk membentuk masa depan asisten AI.
3. Integrasi AI di Google Penelusuran
Kecerdasan buatan akan diintegrasikan ke hampir semua produk Google, mulai dari pencarian jangka panjang hingga Android 15. Khusus untuk pengguna AS, kini mereka dapat menggunakan ulasan AI dalam hasil pencarian, tidak terbatas pada Search Labs.
Pengguna dapat menyesuaikan ikhtisar AI mereka dengan menyederhanakan bahasa atau mengelompokkannya menjadi lebih detail. Hal ini khususnya berguna jika pengguna masih baru terhadap topik tersebut, atau jika Anda menyederhanakan sesuatu untuk memuaskan rasa ingin tahu anak-anak.
Google berjanji bahwa tinjauan AI-nya akan membantu menjawab pertanyaan yang lebih kompleks. Misalnya, Anda mungkin mencari studio yoga atau pilates baru dan menginginkan studio yang populer di kalangan penduduk setempat, nyaman untuk perjalanan Anda, dan menawarkan diskon untuk anggota baru 4. Gambar 3
Mode ini menghasilkan gambar dengan kualitas tertinggi dengan detail gambar yang semakin sedikit untuk menghasilkan gambar yang lebih realistis. Imagen 3 telah meningkatkan kemampuan bahasa alami untuk lebih memahami perintah pengguna dan maksud di baliknya.
Format ini dapat memecahkan salah satu tantangan terbesar bagi generator gambar AI, yaitu teks, dan Google mengatakan Imagen 3 adalah yang terbaik untuk merender gambar. Hanya saja Imagen 3 belum tersedia secara luas, ini tersedia sebagai pratinjau pribadi dalam Image FX untuk pembuat tertentu. Model ini akan segera tersedia di Vertex AI dan orang-orang dapat mendaftar ke daftar tunggu.
5. VIO (generator teks-video)
Veo dapat merekam video 1080p berkualitas tinggi selama lebih dari satu menit. Menurut Google, model tersebut dapat lebih memahami bahasa alami untuk membuat video yang lebih mencerminkan visi pengguna. Veo juga memahami terminologi film seperti “time-lapse” sehingga Anda dapat membuat video dalam berbagai format dan memberi pengguna kendali atas hasil akhirnya.
6. SintID
Di era produksi AI, kami melihat banyak perusahaan fokus pada multimodalitas model AI. Untuk memastikan alat penandaan AI-nya kompatibel, Google memperluas SynthID (teknologi penandaan air gambar AI) ke dua mode baru, teks dan video. Selain itu, Google menerapkan tanda air SynthID pada video yang diproduksi oleh Veo.7. Mintalah gambarnya
Jika Anda pernah menghabiskan waktu berjam-jam menelusuri feed untuk menemukan gambar, Google memiliki solusi kecerdasan buatan. Dengan Gemini, pengguna dapat menggunakan obrolan Google Foto untuk menemukan gambar yang mereka cari.
Fitur ini disebut Tanya Foto. Google telah mengumumkan bahwa fitur tersebut akan diluncurkan akhir musim panas ini, dengan kemampuan tambahan di masa depan.
Dalam contoh yang diberikan oleh Google, pengguna ingin melihat kemajuan putrinya sebagai perenang dari waktu ke waktu, jadi dia meminta Google Foto dan secara otomatis mengemas sorotan untuknya.8. AI di Android
Circle to Search yang sebelumnya hanya dapat melakukan penelusuran Google dengan men-scroll gambar, video, dan teks di layar ponsel, kini dapat “membantu siswa mengerjakan pekerjaan rumahnya”. Menurut Google, fitur tersebut akan bekerja dengan berbagai topik mulai dari matematika hingga fisika, dan pada akhirnya akan mampu menangani masalah kompleks seperti rumus simbolik, diagram, dan banyak lagi.
Gemini juga menggantikan Google Assistant, yang akan menjadi asisten AI default di ponsel Android dan dapat diakses dengan menahan tombol power. Menurut Google, Gemini akan diterapkan di banyak layanan dan aplikasi, dukungan multimodal berdasarkan permintaan.
Kemampuan multimodal Gemini Nano juga diaktifkan oleh fungsi TalkBack Android, memberikan masukan yang lebih deskriptif untuk pengguna tunanetra atau tunanetra.
Emini Nano memantau dan mendeteksi pola percakapan yang mencurigakan dan meminta pengguna untuk “menutup telepon dan melanjutkan” atau “menutup telepon”. Fitur ini dijanjikan akan tersedia pada akhir tahun ini.9. Google Ruang Kerja
Dengan semua pembaruan Gemini, Google Workspace mendapatkan lebih banyak integrasi kecerdasan buatan. Awalnya, sidebar Gemini untuk Gmail, Dokumen, Drive, Slides, dan Spreadsheet akan diperbarui ke Gemini 1.5 Pro.
Gmail untuk seluler kini memiliki tiga fitur baru yang berguna: Ringkasan, Pertanyaan dan Jawaban Gmail, dan Balasan Cerdas Kontekstual. Fitur ringkasan sesuai dengan namanya – fitur ini merangkum serangkaian email yang mendukung Gemini. Fitur ini akan tersedia untuk pengguna mulai bulan ini.
Fitur Pertanyaan Gmail memungkinkan pengguna mengobrol dengan Gemini tentang status email mereka dalam aplikasi seluler Gmail. Misalnya saja, seorang pengguna meminta Gemini untuk membandingkan harga perbaikan atap berdasarkan harga dan ketersediaan. Gemini kemudian mengumpulkan data dari berbagai kotak surat dan menampilkannya kepada pengguna.
Terakhir, fitur Bantu Saya Menulis Gmail dan Dokumen telah didukung untuk bahasa Spanyol dan Portugis, yang akan hadir di desktop dalam beberapa minggu mendatang. Lihat “Alat Google untuk membuat puisi, apa sajakah itu?” Video. (Afrika/Afrika)