TY - JOUR AU - Vania, Stella AU - Sutanto, Patrick AU - Sutanto, Ricky AU - Santoso, Joan PY - 2023/04/13 Y2 - 2024/03/29 TI - Ekstraksi Partitur Balok Monofonik untuk Instrumen Flute dengan CRNN dan CRF JF - INSYST: Journal of Intelligent System and Computation JA - INSYST VL - 5 IS - 1 SE - Articles DO - 10.52985/insyst.v5i1.218 UR - https://jurnal.istts.ac.id/index.php/INSYST/article/view/218 SP - 01 - 09 AB - <p>Notasi partitur balok bukanlah notasi yang mudah dibaca oleh pemula dalam dunia musik. Di sinilah <em>Optical Music Recognition</em> (OMR) dapat berperan. OMR merupakan sebuah pembelajaran mengenai komputer yang dapat mengenali objek dalam partitur balok. Dengan adanya program yang menerapkan OMR dan memberikan output dengan format yang mudah dipahami oleh pengguna, maka pemula dalam dunia musik dapat terbantu dalam membaca partitur not balok. Karya ilmiah ini dibuat dengan pendekatan <em>deep learning</em> dalam beberapa arsitektur. Dataset yang digunakan adalah Camera-PrIMuS yang terdiri dari dataset gambar sebaris partitur musik dan juga ground-truth per objek pada gambar yang bersangkutan. Arsitektur yang digunakan adalah CRNN, CRNN-CRF, dan <em>Attention</em>. Dari ketiga arsitektur tersebut, hasil terbaik diperoleh pada aristektur <em>Attention</em> dengan <em>symbol error rate</em> (SER) sekitar 9%, diikuti dengan CRNN dengan SER sekitar 84%, dan CRNN-CRF yang berdasarkan hasil uji coba tidaklah cocok untuk OMR dengan nilai loss yang tidak kunjung turun dalam proses training. Arsitektur <em>Attention</em> secara garis besar terdiri dari blok <em>encoder</em> dan <em>decoder</em>. <em>Encoder</em> berfungsi untuk menerima input gambar dan melakukan encoding terhadap gambar tersebut. Hasil encoding kemudian diterima oleh decoder yang berperan untuk melakukan <em>decoding</em> dan memprediksi <em>sequence</em> selanjutnya berdasarkan hasil encoding dari <em>encoder</em>. Dalam implementasinya program dapat menerima input berupa gambar selembar partitur penuh yang agak miring, maka program juga akan melakukan <em>skew-correction</em> dan pemotongan gambar per baris agar input dari pengguna dapat diproses oleh model. Output dari model yang masih berupa label-label prediksi akan diproses kembali agar menghasilkan not angka dan file MIDI yang relatif lebih mudah untuk dipahami oleh pengguna.</p> ER -