Domarta –
Read More : Kisah Pedagang Atribut Persija Rintis Bisnis Sejak SMP
Kecerdasan buatan (AI) sekarang dapat membuat gambar yang realistis, menulis novel, pekerjaan akhir rumah untuk mendorong pengkodean. Tetapi penelitian terbaru menunjukkan bahwa sebagian besar model AI tidak dapat berupa item sederhana yang disebut jam analog.
Penyelidik Edinburgh menguji kemungkinan Model Bahasa Multimodal Besar (LLM) untuk menjawab pertanyaan berdasarkan foto Bell dan Kalender. Studi ini menunjukkan bahwa LLM mengalami kesulitan melakukan tugas sederhana ini.
Tim peneliti menguji model GPT-4-O1 milik Openai, pemilik Googini Anthropic 3.2, Instruksi Meta Instruksi, Instruktur QWEN2-VL7B dan MiniCPM-V 2.6 untuk model.
Mereka menguji model AI ini menggunakan berbagai analog analog, dari jam Romawi, jam dengan beberapa warna dial, dan bahkan lonceng yang tidak memiliki detik. Mereka juga menggunakan citra Kaliner yang berusia 10 tahun.
Dalam kasus gambar keranjang, peneliti memohon dengan model AI, waktu mana yang ditampilkan pada arloji pada gambar. Dalam hal gambar program, pertanyaan sederhana, seperti Tahun Baru pada minggu pada hari apa dan pertanyaan kompleks, seperti 153 hari setahun.
Model AI yang diuji secara umum memiliki kinerja yang buruk. Model AI ini dapat dengan benar membaca jam analog kurang dari 25%dan mengalami kesulitan membaca jam dengan perjalanan Romawi, lonceng bergaya dan jam tanpa detik. Menurut para ilmuwan, masalah ini dapat terjadi karena mendeteksi searah jarum jam dan interpretasi sudut pada permukaan jam.
“Kebanyakan orang dapat belajar waktu dan memiliki kalender usia tertinggi,” kata Rhhite Saxon dari penemuan Edinburgh, yang melakukan penelitian ini, dikutip oleh Gizodo, Selasa (18.02.2025).
“Defisit ini harus efektif karena sistem AI berhasil diintegrasikan dalam dunia nyata yang sensitif terhadap waktu, seperti teknologi otomatis dan tambahan,” tambahnya.
Google Gemini 2.0 memperoleh hasil tertinggi ketika diminta untuk membaca jam, sedangkan GPT-O1 dapat mengakhiri kalender dengan akurasi 80%. Meskipun demikian, model AI paling sukses dalam menyelesaikan tugas kalender masih membuat kesalahan sekitar 20%. Lihat Video “Video: Alasan Opensi Tolak Penawaran 97 $ M Eloon Musk” (VPP / VMP)