Pergeseran Frekuensi Dasar Sinyal Gamelan Menggunakan Phase Vocoder Ghea Ardy Prayogo W, Yoyon K Suprapto Jurusan Teknik Elektro FTI - ITS tidak hanya digunakan untuk hiburan, tetapi dapat digunakan sebagai alat terapi. Gamelan dapat membantu tahap sebelum mencapai keadaan Samadhi Meditasi. Melalui media musik, orang dapat membuat pemurnian berpikir, pemurnian hati dan jiwa yang mengarah ke penyembuhan psikologis[1]. Di Indonesia, tidak banyak orang memiliki alat musik gamelan sendiri sehingga sulit bagi mereka yang ingin memainkan alat musik tersebut ataupun melakukan analisa terhadapnya. Namun, di jaman modern ini perkembangan teknologi cukup pesat. Suara alat musik gamelan dapat direkam kemudian dilakukan analisa ataupun dimainkan. Alat musik gamelan dibuat secara manual menggunakan tangan. Pembuatnya mengatur tiap nada pada instrumen berdasarkan perasaan mereka sendiri. Akibatnya, frekuensi nada yang dihasilkan terkadang tidak standar. Yang dimaksudkan dengan tidak standar yaitu frekuensi dasar pada instrumen gamelan sedikit berbeda dari satu gamelan ke gamelan yang lain. Tabel 1 menunjukkan frekuensi dasar nada gamelan (saron) pada beberapa set gamelan. Masing – masing notasi memiliki rentang frekuensi yang berbeda. Dari Tabel 1, dapat disimpulkan bahwa frekuensi nada saron tidak standar. Hal ini dipengaruhi oleh pembuatan gamelan yang dilakukan secara manual berdasarkan perasaan masing – masing pembuatnya. Kekerasan memukul gamelan, gaya memukul dan posisi sebelah mana yang dipukul juga mempengaruhi frekuensi pada gamelan. Sehingga frekuensi pada nada gamelan dapat berbeda satu sama lain.
ABSTRAK
Gamelan merupakan salah satu alat musik tradisional Indonesia yang semakin diterima di kancah internasional. Alat musik gamelan dibuat secara manual menggunakan tangan. Pembuatnya mengatur tiap nada pada instrumen berdasarkan perasaan mereka sendiri. Akibatnya, frekuensi nada yang dihasilkan terkadang berbeda satu sama lain. Terdapat dua jenis nada gamelan, yaitu pelog dan slendro. Untuk menghitung frekuensi dasar tiap tangga nadanya, digunakan rumus frequency scaling. Namun seringkali frekuensi dasar pada gamelan berbeda dengan frekuensi hasil perhitungan tersebut. Untuk mengatasi permasalahan tersebut digunakan metode pitch shifting. Pitch shifting menggeser frekuensi dasar tanpa merubah durasi dari sinyal tersebut. Salah satu metode pitch shifting yang digunakan dalam penelitian ini ialah metode phase vocoder. Phase vocoder melakukan konversi dari domain waktu kedalam domain frekuensi yang memperbolehkan modifikasi terhadap fasanya pada domain frekuensi. Kemudian sinyal dikembalikan kedalam domain waktu dan dilakukan proses resampling untuk mengembalikan durasi dan menggeser frekuensinya. Dalam penelitian ini, digunakan metode phase vocoder dan phase vocoder baru. Dari percobaan yang telah dilakukan didapatkan hasil, bahwa terjadi penurunan amplitudo yang signifikan terhadap metode phase vocoder dibandingkan metode phase vocoder baru. Dilakukan percobaan terhadap instrumen gamelan jenis pelog dan slendro. Didapatkan hasil error sebesar 40,98% untuk instrumen slendro dan 36,18% untuk instrumen pelog dengan metode phase vocoder. Sedangkan Untuk metode phase vocoder baru didapat error 14,46% pada instrumen pelog dan 22.33% untuk instrumen slendro.
Tabel 1.1 Frekuensi dasar nada saron dari beberapa set gamelan[1] Gamelan Gamelan Fundamental Frequency (Hz) Notation (c) Set 1 Set 2 Set 3 Set 4 Min Max 1 528 528 504 539 504 539 2 610 610 574 610 574 610
Kata Kunci: Frekuensi Dasar, Pitch Shifting, Gamelan, Phase Vocoder I. PENDAHULUAN
3
703
703
688
703
688
703
5 6
797 915
792 922
792 926
799 926
792 915
799 926
Pada alat musik gamelan terdapat dua jenis tangga nada, yaitu slendro dan pelog. Nada slendro memiliki lima nada, sedangkan pada pelog memiliki tujuh nada. Frekuensi dasar tiap nada gamelan dapat dihitung menggunakan rumus perpindahan tangga nada. Akan tetapi pada kenyataannya banyak frekuensi dasar gamelan yang tidak sesuai dengan perhitungan, dikarenakan pembuatan gamelan yang manual. Untuk mendapatkan frekuensi dasar nada gamelan yang sesuai dengan perhitungan, perlu dilakukan pergeseran frekuensi
G
amelan merupakan salah satu alat musik tradisional Indonesia yang semakin diterima di kancah internasional. Banyak musisi kelas dunia sudah menerima konsep musik timur seperti komponis Perancis Claude Achille Debussy, musisi Hungaria Bella Bartok, musisi US Colin Mc Phee, musisi Tamagawa Backet Wheeler. Gamelan menekankan berulang-ulang dalam karakter yang sering membuat rasa bosan dan mengantuk. Musik gamelan 1
terhadap nada gamelan. Metode yang dapat menangani masalah tersebut adalah pitch shifting. Pitch Shifting menggeser frekuensi dasar nada ke frekuensi dasar nada yang lebih tinggi maupun ke frekuensi dasar nada yang lebih rendah. Metode yang digunakan dalam penelitian ini ialah Phase Vocoder. Terdapat dua metode yang digunkan, yaitu metode Phase Vocoder dan Phase Vocoder baru sebagai metode alternatif. Metode phase vocoder dan phase vocoder baru diaplikasikan kedalam suara gamelan untuk dilakukan pergeseran frekuensinya. II.
fj 2
1.
Mengenal Frekuensi Dasar Kebanyakan nada merupakan nada yang kompleks yaitu terdiri atas satu atau lebih frekuensi didalamnya. Frekuensi paling dasar dalam sebuah nada biasa disebut sebagai fundamental frequency atau frekuensi dasar. Frekuensi dasar ini merupakan komponen paling penting dikarenakan frekuensi inilah yang menentukan pitch dari keseluruhan nada[2]. Pitch merupakan tinggi atau rendahnya sebuah suara atau nada yang berhubungan langsung dengan frekuensi dari gelombang suara[3]. Nada khususnya memiliki frekuensi – frekuensi tambahan didalamnya yang merupakan kelipatan dari frekuensi dasarnya. Frekuensi – frekuensi tersebut dinamakan dengan harmonics, keberadaannya dapat menentukan kualitas dari nada tersebut. Gambar 2.4 menunjukkan frekuensi dasar dan harmonics yang dijumlahkan sehingga menghasilkan sebuah gelombang suara yang kompleks. Meskipun frekuensi dasar umumnya lebih dominan dari harmonics yang dibawanya, akan tetapi terkadang juga bisa tidak.
c 1200 log(
(2.4)
atau
fj 2
n 1200
fi
(2.5)
Perpindahan jarak cent musik pada gamelan pelog dapat dihitung dengan persamaan (2.6). m
f j 2 8 fi atau n
f j 2 1200 f i
(2.6)
III. METODE YANG DIUSULKAN A. Phase Vocoder Pada penelitian ini ditemukan dua metode phase vocoder. Kedua metode yang digunakan dalam penelitian ini ialah phase vocoder dan phase vocoder baru.perancangan sistem penelitian ini melalui beberapa tahapan, gambar 2.1 ialah blok diagram metode phase vocoder. Tahapan yang dilakukan metode ini dijabarkan secara sederhana seperti berikut : 1. Sinyal Asli Digunakan jenis musik gamelan akustik. Peralatan dari berbagai gamelan dimainkan dan direkam tiap – tiap suara yang dihasilkan dari lempeng yang dipukul sekali 2. Hitung Faktor Pergeseran Faktor pergeseran ini didapatkan dengan cara melakukan perhitungan nilai cent dengan menggunakan perhitungan frequency scaling. Sehingga jika dilakukan pergeseran sebesar 240 cent pada sinyal gamelan slendro,
Nada dasar alat musik barat seperti piano atau gitar memiliki 12 tingkatan, sehingga jarak cent musik antar notasi terdekatnya adalah 1200/12 atau sama dengan 100 cent. Perpindahan jarak cent musik pada alat musik barat dapat dihitung dengan persamaan (2.2) dan persamaan (2.3).
fj 2
fi ) fj
f j 2 fi
Frequency Scaling Ada dua satuan yang biasa digunakan untuk mengukur jarak antar notasi musik yaitu Hertz dan cent music (Edward1994). Dalam musik harmonik sering dijumpai beberapa istilah seperti octave, fifth dan masih banyak lagi. Octave dapat ditemui apabila frekuensi dasar sebuah notasi musik dua kali bila dibandingkan dengan frekuensi dasar notasi lainnya. Rasionya 1:2 dan faktornya dua kali dan jarak cent musiknya 1200 cent [1].
m 12
(2.3)
m 5
2.
fi ) fj
fi
Dalam hal ini C adalah jarak cent, fi dan fj adalah frekuensi dasar notasi i dan j. fi adalah frekuensi awal sedangkan fj adalah frekuensi akhir. m adalah jarak skala notasi i ke j, sedangkan n adalah penambahan/pengurangan frekuensi yang diinginkan. Sedangkan untuk gamelan memiliki nada dasar yang berbeda. Gamelan memiliki dua jenis nada dasar yaitu pelog dan slendro. Slendro memiliki 5 tingkatan notasi, sedangkan pelog memiliki 8 tingkatan notasi. Sehingga jarak cent music antar notasi pada gamelan jenis pelog adalah 1200/8 atau 150 cent. Dan jarak cent music antar notasi gamelan jenis slendro adalah 1200/5 atau 240 cent. Perpindahan jarak cent musik pada gamelan slendro dapat dihitung dengan persamaan (2.4) dan persamaan (2.5).
TEORI PENUNJANG
c 1200 log(
n 1200
(2.2)
fi
atau
2
maka faktor pergeserannya adalah = 1.1487. Hal serupa berlaku pada sinyal gamelan pelog. 3. Pembagian Sinyal kedalam Frame Proses ini melakukan pemotongan terhadap sinyal masukan. Potongan frame berukuran window (diset = 1024), masing – masing frame overlap satu sama lain berukuran hop (diset = 256) untuk mendapatkan 75% overlap. nilai potongan frame pertama memotong sinyal dari sampel 1 hingga sampel 1024. Sedangkan nilai potongan frame kedua memotong sinyal dari sampel 257 hingga sampel 1280 dan seterusnya
Gambar 2.2 Windowing pada frame 5.
FFT Frame Proses ini melakukan transformasi fourier pada tiap potongan frame. Transformasi fourier digunakan untuk melakukan konversi sinyal dari domain waktu kedalam domain frekuensi. Contoh hasil FFT yang telah diabsolutkan dapat dilihat pada gambar 2.3
Gambar 2.3 FFT absolut pada frame 6.
Pengaturan Fasa Pengaturan fasa dilakukan karena metode phase vocoder membutuhkan informasi fasa untuk meningkatkan keakurasian estimasi frekuensi pada tiap frame. Namun informasi fasa yang diperoleh dari hasil fft merupakan fft terbungkus (wrapped) yang mengindikasikan fasa berada dalam range –pi/pi. Untuk menggunakan informasi fasa, dapat dilakukan teknik yang disebut unwrapping.
Gambar 2.1 Blok diagram metode phase vocoder
4.
Windowing Proses ini melakukan windowing pada tiap potongan sinyal dalam matriks. Umumnya menggunakan window hanning yang dapat menjaga nilai amplitudo tanpa mengabaikan kualitas dari frekuensi yang dihasilkan. Contoh windowing ditunjukkan pada gambar 2.2
Langkah – langkahnya adalah sebagai berikut. a) Dapatkan fasa dari hasil frame fft b) Cari selisih fasa dari frame satu dan lainnya. c) Petakan kedalam range –pi / pi d) Dapatkan frekuensi sebenarnya e) Dapatkan fase akhir 3
Sinyal Masukan
7.
IFFT & Windowing Setelah melakukan pengaturan fase pada tiap frame, maka frame tersebut dikembalikan kembali dalam bentuk domain waktu dengan menggunakan Invers Fast Fourier Transform. Kemudian dilakukan windowing untuk menghaluskan sinyal. Hasil proses IFFT dan windowing dapat dilihat pada gambar 2.4
Tentukan Nilai Faktor
Hitung Panjang Sinyal Input
Buat Matriks Penampung Potongan Frame
I=0 : hop : (panjang sinyal input - window)
Windowing Frame
FFT Frame
Pengaturan Fasa
Gambar 2.4 Hasil IFFT Frame dan Windowing
J=0 : hop : (hop*(jml frame - 1))
8.
Penggabungan Frame Proses ini melakukan penggabungan frame – frame yang telah melalui tahap IFFT. Penggabungan frame membutuhkan dua parameter, yaitu matriks berisikan potongan frame hasil dari tahap IFFT, dan hopout. Variabel hopout didapatkan dengan pembulatan hasil perkalian antara nilai hop dan faktor pergeseran. Hasil dari tahap ini adalah sinyal utuh yang memiliki durasi yang diregangkan sebanyak nilai faktor. Untuk mengembalikan durasi sinyal kembali ke asal, maka digunakan teknik resampling Interpolasi Linear.
IFFT dan Windowing Resampling
Gambar 2.5 Blok diagram metode phase vocoder III. PENGUJIAN Pada pengujian ini digunakan sinyal semi sintetik gamelan balungan (saron, demung dan peking) baik slendro maupun saron. Nada saron memiliki lima (1, 2, 3, 5, 6) tingkatan nada, sedangkan pelog memiliki tujuh (1, 2, 3, 4, 5, 6, 7) tingkatan nada. Tabel 3.1 dan Tabel 3.2 menunjukkan nilai dari frekuensi dasar sinyal gamelan jenis pelog dan slendro yang digunakan sebagai input.
B. Phase Vocoder Baru Phase Vocoder Baru mengusung konsep yang nyaris serupa dengan metode phase vocoder. Walaupun demikian, ada beberapa perubahan yang dibawa oleh metode ini. Beberapa diantaranya adalah : 1. Penggunaan faktor modifikasi yang tidak mengandalkan perhitungan dengan frequency scaling. Metode ini menggunakan nilai pecahan float biasa. 2. Penggunaan teknik resampling biasa. Ini yang menyebabkan tidak dapat digunakannya nilai faktor dengan frequency scaling. Teknik resampling ini hanya menggunakan nilai pecahan hasil perhitungan dua nilai integer (ex. 9/10 = 0,9 ). 3. Efek windowing yang dihasilkan metode ini membawa penurunan yang lebih kecil terhadap hasil pergeseran, jika dibandingkan dengan metode phase vocoder.
Tabel 3.1 Frekuensi Dasar Gamelan Jenis Pelog Nada 1 2 3 4 5 Demung 309 331 353 419 441 Saron 617 661 705 837 903 Peking 1233 1321 1453 1695 1871
6 485 969 2003
Tabel 3.2 Frekuensi Dasar Gamelan Jenis Slendro Nada 1 2 3 5 Demung 265 309 353 419 Saron 551 639 727 837 Peking 1101 1277 1453 1981
7 529 1079 2201
6 485 969 2267
A. Metode Phase Vocoder Pengujian dengan metode ini menggunakan range nilai pergeseran maju hingga dua oktaf atau setara dengan 2400 cent. sedangkan untuk pergeseran mundur, range nilai pergeserannya hingga satu oktaf atau setara dengan 1200 cent. Frekuensi hasil pergeseran akan dibandingkan dengan nilai frekuensi perhitungan frequency scaling.
Berikut merupakan blok diagram metode phase vocoder baru yang ditunjukkan pada gambar 2.5.
4
B. Perbandingan Hasil Amplitudo Dikarenakan metode pergeseran yang berbeda, maka perbandingan hanya dilakukan terhadap amplitudo hasil pergeserannya saja. Untuk melakukan perbandingan, maka dilakukan beberapa percobaan tambahan pada metode phase vocoder, mengingat metode ini memiliki metode pergeseran yang lebih fleksibel. Sebagai contoh, nada yang digunakan sebagai nada masukan ialah nada demung 1 slendro. Tabel 3.4 menunjukkan hasilpergeseran dengan nilai frekuensi hasil yang sama antara metode phase vocoder dan phase vocoder baru.Pengujian yang dilakukan pada penelitian ini melalui beberapa proses berikut:
Tabel 3.3 Pergeseran dengan Metode Phase Vocoder – Demung 1 Slendro Berdasarkan Frekuensi Geser (Cent)
Hasil Pergeseran (Hz)
Perkiraan Frek. (Hz)
Error Geser (%)
0
265
265
0
240
309
304.41
1.51
480
353
349.67
0.95
720
419
401.66
4.32
960
463
461.39
0.35
1200
529
530.00
0.19
1440
617
608.81
1.35
1680
705
699.34
0.81
1920
815
803.33
1.45
2160
925
922.78
0.24
133
39.14
3.08
2400
1057
1060.00
0.28
155
44.28
2.59
-240
243
230.70
5.33
177
47.07
1.27
-480
221
200.83
10.04
199
45.12
1.64
-720
177
174.83
1.24
221
38.09
1.14
-960
133
152.20
12.62
243
24.15
0.57
-1200 Error Rata2
111
132.50
16.23
309
37.91
1.59
331
50.62
2.40
375
55.42
6.30
441
51.27
9.73
529
71.64
9.72
661
46.96
17.22
881
38.49
24.33
Rata2
45.40
6.28
Tabel 3.4 Amplitudo Hasil Pergeseran Metode Phase Vocoder dan Phase Vocoder Baru dengan Frekuensi Sama Geser Metode Phase Metode Phase (Hz) Vocoder Vocoder Baru
3.56
Gambar 2.6 merupakan salah satu contoh hasil pergeseran frekuensi dengan menggunakan metode phase vocoder dan phase vocoder baru.
Dari percobaan pada tabel 5.6, maka dapat dibuat grafik perbandingan antara kedua metode. Grafik ditunjukkan pada gambar 5.2. apabila diamati, maka hasil pergeseran metode phase vocoder baru menghasilkan nilai amplitudo yang jauh lebih baik dibandingkan dengan metode phase vocoder. Hal ini dikarenakan efek windowing pada metode phase vocoder memiliki efek yang lebih besar dari metode phase vocoder baru. Sehingga amplitudo pada metode phase vocoder mengalami penurunan yang lebih besar. C. Pengujian dengan Mean Opinion Score Mean Opinion Score (MOS) dilakukan terhadap kurang lebih 9 orang sebagai responden untuk memberikan penilaian terhadap hasil pergeseran, baik dengan metode phase vocoder atau phase vocoder baru. Dari hasil penilaian MOS, maka dapat dilihat hasil pergeseran mana yang lebih baik menurut pendengaran responden. Data pergeseran diambil dari kedua metode phase vocoder sebanyak lima pergeseran. Tiga diantaranya merupakan pergeseran frekuensi maju, sedangkan sisanya merupakan pergeseran frekuensi mundur. Sebagaimana yang telah dijelaskan pada sub bab sebelumnya bahwa metode phase vocoder baru tidak dapat dilakukan pergeseran secara
Gambar 2.6 Pergeseran dengan Phase Vocoder dan Phase Vocoder Baru 5
fleksibel, sehingga hasil pergeseran yang dihasilkan tidak selalu sama dengan hasil pergeseran metode phase vocoder. Untuk itu dilakukan percobaan tambahan pada metode phase vocoder agar dapat menghasilkan hasil pergeseran frekuensi yang sama dengan metode phase vocoder baru. Tabel 3.5 hingga tabel 3.10 menunjukkan prosentase hasil kebaikan dari suara hasil pergeseran terhadap responden. Dapat dilihat pada tabel bahwa metode phase vocoder baru memiliki prosentase rata – rata lebih baik dibandingkan metode phase vocoder.
Tabel 3.8 MOS Saron Slendro
Tabel 3.5 MOS Saron Pelog
Kualitas
PV
PV Baru
Buruk
3%
2%
Kurang
22%
13%
Cukup
36%
20%
Bagus
38%
49%
0%
16%
Kualitas
PV
PV Baru
Sangat Bagus
Buruk
3%
2%
Tabel 3.9 MOS Demung Slendro
Kurang
17%
9%
Kualitas
PV
PV Baru
Cukup
37%
22%
Buruk
0%
0%
Bagus
40%
57%
Kurang
5%
5%
Sangat Bagus
3%
10%
Cukup
28%
19%
Bagus
46%
56%
Sangat Bagus
21%
20%
Tabel 3.6 MOS Demung Pelog Kualitas
PV
PV Baru
Buruk
2%
3%
Kurang
14%
3%
Cukup
35%
16%
Bagus
46%
57%
Sangat Bagus
3%
21%
Tabel 3.10 MOS Peking Slendro
Tabel 3.7 MOS Peking Pelog Kualitas
PV
PV Baru
Buruk
4%
3%
Kurang
13%
13%
Cukup
35%
23%
Bagus
47%
47%
Sangat Bagus
1%
14%
Kualitas
PV
PV Baru
Buruk
2%
2%
Kurang
20%
15%
Cukup
29%
29%
Bagus
47%
44%
Sangat Bagus
2%
10%
IV. PENUTUP
A. Kesimpulan Dari beberapa pengujian yang telah dilakukan, maka dapat ditarik beberapa kesimpulan sebagai berikut : 1.
6
Pergeseran frekuensi dengan metode phase vocoder menghasilkan amplitudo yang lebih rendah. Hasil rata – rata error amplitudo pada gamelan jenis pelog dengan menggunakan phase vocoder sebesar 35.45% pada nada demung, sebesar 33.57% pada nada peking dan sebesar 39.52% pada nada saron. Sedangkan dengan menggunakan phase vocoder baru,error yang didapat sebesar 9.90% pada nada demung, sebesar 25.98% pada nada peking dan sebesar 7.51% pada nada saron.
2.
B.
Sedangkan hasil rata – rata error amplitudo pada gamelan jenis slendro dengan menggunakan phase vocoder sebesar 38.75% pada nada demung, sebesar 38.17% pada nada peking dan sebesar 46.02% pada nada saron. Sedangkan dengan menggunakan phase vocoder baru,error yang didapat sebesar 8.25% pada nada demung, sebesar 47.56% pada nada peking dan sebesar 11.19% pada nada saron. Batasan pergeseran frekuensi maksimal yang dapat dilakukan dengan metode phase vocoder adalah 960 cent untuk menggeser maju dan -960 cent untuk pergeseran frekuensi mundur. Hal ini dikarenakan bentuk spektrum yang dihasilkan memiliki banyak harmonics didalamnya
Saran
Demi perbaikan aplikasi, pada pengembangan selanjutnya dapat dikembangkan beberapa hal sebagai berikut: 1.
2.
Dilakukan pengembangan terhadap sistem phase vocoder baru yang dapat melakukan pergeseran lebih fleksibel. Sehingga dapat diperoleh sinyal pergeseran sesuai standarisasi Dilakukan pengujian dengan menggunakan sinyal gamelan yang terdiri dari 2 suara atau lebih (polifonik).
V. DAFTAR PUSTAKA [1] Suprapto, Yoyon Kusnendar, “Ekstraksi Suara Saron Berbasis Spectral-Density Menggunakan Filter Multidimensi”, Surabaya, 2010 [2] Kim, Jinho, “Automatic Pitch Detection and Shifting of Musical Tones in Real Time”, Boston, 2013 [3] Waluyanti, Sri, “Teknik Audio Video”, tanpa tahun BIOGRAFI PENULIS Penulis yang memiliki nama lengkap Ghea Ardy Prayogo W. ini lahir di Nganjuk pada tanggal 07 November 1988. Penulis bertempat tinggal di Ngagel Tirto No. 21 Surabaya 60245. Pada tahun 1994-2000, penulis mengenyam bangku pendidikan di SDN Ngagel Rejo I Surabaya dan melanjutkan pendidikan di SMP Muhammadiyah 5 Surabaya pada tahun 2000-2003. Penulis meneruskan studi Sekolah Menengah Kejuruan di SMK Negeri 11 Surabaya pada tahun 2003-2006. Pada tahun 20062010, penulis melanjutkan studi di Politeknik Elektronika Negeri Surabaya (PENS). Penulis sedang mengenyam pendidikan di Institut Teknologi Sepuluh Nopember Surabaya di Jurusan Teknik Elektro sejak tahun 2010 sampai saat ini. Penulis memiliki hobi menonton bioskop
7