AI Google InkSight: Mengubah Tulisan Tangan Jadi Digital

Profile
Mila karmeliyah

5 November 2024

AI Google InkSight: Mengubah Tulisan Tangan Jadi Digital

Teknologi lama seperti pena dan kertas kini makin canggih dengan sentuhan digital. Google Research menciptakan sistem AI bernama InkSight yang bisa mengubah foto tulisan tangan jadi teks digital yang bisa diedit. Ini bisa mengubah cara jutaan orang mencatat dan menyimpan ide.

InkSight ini adalah langkah besar dalam menghubungkan tulisan tangan dengan catatan digital. Meski catatan digital punya banyak keuntungan—mudah dicari, disimpan di awan, dan diedit—menurut peneliti, banyak orang masih lebih suka mencatat dengan pena dan kertas.

mi

Bagaimana sistem AI baru Google memahami tulisan tangan manusia lebih baik dari sebelumnya

“Catatan digital makin populer karena gampang disimpan, diedit, dan dicari,” jelas Andrii Maksai, kepala proyek di Google Research. “Tapi, tetap ada perbedaan besar dengan mencatat pakai pena dan kertas, yang masih jadi favorit banyak orang.”

Yang bikin InkSight unik adalah caranya memahami tulisan tangan. Sebelumnya, sistem hanya menelusuri garis tulisan. Tapi InkSight bisa benar-benar membaca dan menyalin teks dengan alami.

Hasilnya keren banget. Dalam uji coba, 87% hasil InkSight dianggap akurat, dan 67% hampir sama dengan tulisan digital buatan manusia. Sistem ini bisa bekerja meski ada pencahayaan buruk, latar berantakan, atau teks yang sebagian tertutup.

"Ini pertama kalinya kita bisa menghapus teks tulisan tangan dari foto dengan berbagai latar," kata para peneliti. InkSight juga bisa memproses sketsa dan gambar sederhana, walau masih ada beberapa batasan.

jay

Mengapa tulisan tangan masih penting di era digital, dan bagaimana AI dapat membantu melestarikannya

Teknologi ini muncul di waktu yang pas untuk mengubah cara manusia dan komputer berinteraksi. Walaupun teknologi digital udah maju banget, menulis tangan masih punya tempat penting buat daya ingat dan pemahaman. Banyak riset yang bilang, menulis tangan bikin orang lebih ingat dan paham dibandingkan mengetik, jadi nggak heran kalau ini jadi tantangan di dunia pendidikan dan profesional.

Menurut Maksai, “Tujuan kami adalah membuat catatan tulisan tangan bisa jadi digital tanpa kehilangan detail goresannya, jadi orang bisa menikmati manfaat digital tanpa harus pakai stylus.”

Manfaatnya lebih dari sekadar praktis. Misalnya, siswa tetap bisa pakai tulisan tangan yang mereka suka, tapi tetap bisa dicari dan diatur secara digital. Para profesional juga bisa lebih mudah memasukkan sketsa atau catatan rapat ke alur kerja digital mereka. Bahkan, peneliti dan sejarawan bisa mendigitalkan dokumen lama dengan lebih gampang.

Yang paling penting, InkSight juga bisa bantu mendigitalkan tulisan tangan dalam bahasa-bahasa yang jarang punya representasi digital. Menurut Dr. Claudiu Musat, teknologi ini membuka peluang untuk lebih banyak pengenal tulisan tangan daring, terutama untuk bahasa-bahasa yang dulu sulit diwakili dalam format digital.

Dari terobosan hingga aplikasi dunia nyata: Arsitektur teknis dan masa depan pencatatan digital

Teknologi InkSight ini punya desain yang simpel tapi pintar. Dibuat pakai komponen yang sudah banyak tersedia, seperti Google Vision Transformer (ViT) dan model bahasa mT5, jadi nggak perlu bikin dari nol. Teknologi ini menunjukkan gimana AI bisa canggih dengan menggabungkan alat yang sudah ada.

Google udah merilis versi publiknya, tapi tetap dikasih batasan keamanan. Sistem ini nggak bisa bikin tulisan tangan dari nol, untuk mencegah potensi penyalahgunaan, seperti pemalsuan.

Memang masih ada kekurangan. Sistem ini baru bisa proses teks per kata, bukan langsung satu halaman penuh, dan kadang kesulitan dengan tulisan yang lebar atau tebal. Tapi dibandingkan kemampuannya yang lain, kekurangan ini nggak begitu masalah.

Teknologi ini sudah bisa dicoba di Hugging Face, jadi orang bisa lihat langsung gimana tulisan tangan mereka diubah ke bentuk digital. Responsnya bagus, banyak yang suka karena karakter tulisan tetap ada walau sudah jadi digital.

Berbeda dari kebanyakan AI yang tujuannya menggantikan pekerjaan manusia, InkSight justru menambah manfaat tulisan tangan dengan kekuatan digital. Teknologi ini membantu, bukannya menggantikan, cara manusia menulis. Pada akhirnya, inovasi utama InkSight adalah kemampuannya untuk membantu tanpa menghilangkan sentuhan pribadi yang bikin tulisan tangan terasa “manusiawi.”

Sumber dari: venturebeat

What do you think?

Reactions