
Peneliti telah berhasil mengembangkan sistem AI yang mampu menyelesaikan soal matematika di tingkat sekolah dasar, a laporan baru (terbuka di tab baru) menegaskan.
Secara tradisional, sementara model AI mahir memanipulasi bahasa untuk merumuskan kalimat, penalaran multi-langkah yang diperlukan untuk memecahkan masalah matematika telah menjadi langkah yang terlalu jauh.
Namun, para peneliti di OpenAI (perusahaan di balik model bahasa GPT-3 (terbuka di tab baru)) mengatakan bahwa mereka telah melatih model untuk mengenali kesalahannya sendiri, yang berarti model tersebut dapat menilai ulang berulang kali hingga menemukan solusi yang dapat diterapkan.
Dalam pengujian, sistem AI mampu memecahkan masalah yang hampir sama banyaknya dengan sampel anak-anak berusia antara sembilan dan dua belas tahun. Anak-anak mendapat skor 60% pada tes yang diambil dari OpenAI basis data (terbuka di tab baru)sedangkan sistem AI mendapat skor 55%.
AI mengambil matematika
Meskipun soal matematika sekolah dasar cukup sederhana untuk diselesaikan dengan mudah oleh kebanyakan orang, OpenAI mengatakan kedatangan model AI yang mampu menyelesaikan bahkan tantangan matematika dasar merupakan langkah maju yang besar dan akan membuka sejumlah peluang.
“Salah satu tantangan signifikan dalam penalaran matematis adalah kepekaan yang tinggi terhadap kesalahan individu,” jelas para peneliti. “Model autoregresif, yang menghasilkan setiap token solusi dengan token, tidak memiliki mekanisme untuk memperbaiki kesalahannya. Solusi yang menyimpang dari jalur dengan cepat menjadi tidak dapat dipulihkan.”
OpenAI mengatasi masalah ini dengan melatih sekumpulan pemverifikasi, yang perannya adalah mengevaluasi jawaban yang dihasilkan oleh model AI. Pemverifikasi ini diberi 100 solusi potensial, semuanya dihasilkan oleh model, dan kemudian ditugaskan untuk menentukan apakah ada solusi yang benar.
“Memberikan argumen yang benar dan mengenali yang salah adalah tantangan utama dalam mengembangkan AI yang lebih umum,” tambah OpenAI. “[Grade school] masalah secara konseptual sederhana, namun satu kesalahan halus sudah cukup untuk menggagalkan seluruh solusi. Mengidentifikasi dan menghindari kesalahan semacam itu adalah keterampilan penting untuk dikembangkan model kami.”
Perusahaan yakin sistem verifikasi yang memungkinkan sistem AI-nya memecahkan masalah matematika sederhana dengan akurasi relatif akan menjadi semakin penting karena AI diterapkan pada domain yang lebih kompleks.
Dalam kombinasi dengan kemajuan di bidang semikonduktor (terbuka di tab baru)yang akan memungkinkan model AI yang berkali-kali lebih besar (dan karena itu lebih mampu) daripada saat ini, kemampuan untuk mengubah cara AI mendekati suatu masalah dapat terbukti transformatif.
Lihat juga daftar kami tentang hosting awan terbaik (terbuka di tab baru) jasa, hosting logam telanjang terbaik (terbuka di tab baru) dan hosting server khusus terbaik (terbuka di tab baru).