Vocaloid (Jepun: ボーカロイド, Hepburn: Bōkaroido) merupakan jenama perisian sintesis suara nyanyian. Bahagian pemprosesan isyarat telah dibangunkan melalui projek penyelidikan bersama yang diketuai oleh Kenmochi Hideki yang berpusat pada Pompeu Fabra University di Barcelona, Catalonia, Sepanyol tahun 2000 (pasukan yang sama yang kemudiannya mengasaskan Voctro Labs[1]) dan pada asalnya tidak bertujuan untuk menjadi satu projek komersil sepenuhnya. Dengan sokongan daripada Yamaha, perisian ini dibangunkan menjadi satu produk komersil yang dinamakan sebagai "Vocaloid".[2][3]

Vocaloid
Editor Vocaloid 4 versi penuh
PembangunYamaha
Pelancaran pertama15 Januari 2004; 20 tahun yang lalu (2004-01-15)
Keluaran stabil
Sistem pengendalianWindows 2000/XP/Vista/7/8
Apple iOS (iVocaloid, Hanya di Jepun)
Terdapat dalamBahasa Jepun, Inggeris, Korea, Sepanyol, Cina, Catalan
JenisAplikasi pensintesis muzik
LesenBerhak milik
Tapak webnet.vocaloid.com/en/

Perisian ini membolehkan pengguna mensintesis nyanyian dengan menaip lirik dan melodi. Ia menggunakan teknologi sintesis dengan menggunakan vokal yang direkodkan khas daripada pelakon suara atau penyanyi. Untuk mencipta lagu, pengguna mesti memasukkan melodi dan lirik. Sejenis antara muka yang mempunyai gulungan piano digunakan untuk memasukkan melodi, manakala lirik pula boleh dimasukkan ke dalam setiap not. Perisian ini boleh mengubah tekanan sebutan, menambah kesan seperti vibrato, atau mengubah dinamik dan nada suara. Setiap Vocaloid yang dijual berkonsepkan "seorang penyanyi dalam satu kotak", direka untuk bertindak sebagai pengganti kepada seorang penyanyi yang sebenar.

Pada asalnya perisian ini hanya wujud dalam bahasa Inggeris dengan kewujudan Vocaloid generasi terawal Leon, Lola dan Miriam, serta dalam bahasa Jepun dengan kehadiran Meiko dan Kaito, tetapi Vocaloid 3 telah menambahkan sokongan dalam bahasa Sepanyol untuk Vocaloid Bruno, Clara dan Maika; bahasa Cina untuk Luo Tianyi dan Yanhe; serta bahasa Korea untuk SeeU

Perisian ini bertujuan untuk penggunaan bagi pemuzik profesional serta pengguna muzik komputer ringan, dan setakat ini ia telah dijual dengan idea bahawa satu-satunya had adalah kemahiran pengguna itu sendiri.[4] Kumpulan muzuk Jepun Livetune di bawah Toy's Factory, dan juga Supercell di bawah Sony Music Entertainment Japan telah menghasilkan lagu-lagu mereka dengan menampilkan Vocaloid sebagai vokal. Label rekod Jepun Exit Tunes di bawah Quake Inc. juga telah menghasilkan album kompilasi yang menampilkan Vocaloid.[5][6] Artis-artis seperti Mike Oldfield juga telah menggunakan Vocaloids dalam hasil karya mereka sebagai vokal penyanyi dan sampel bunyi sandaran.[7]

Teknologi sunting

 
Model suara di balik tabir Vocaloid, Model Excitation plus Resonances (EpR),[8] merupakan satu kombinasi bagi sintesis permodelan spektrum (SMS) dan model sumber-tapisan (berdasarkan gambar rajah 1 tahun Bonada et al. 2001)

Teknologi sintesis suara nyanyian Vocaloid secara umumnya dikategorikan di bawah sintesis konkatenatif[9][10] dalam domain frekuensi, yang mana ia berperanan dalam menyambat dan memproses serpihan vokal yang diekstrak daripada suara-suara nyanyian manusia, dalam bentuk perwakilan masa-frekuensi. Sistem Vocaloid boleh menghasilkan suara-suara yang realistik dengan menambah ekspresi vokal seperti vibrato ke atas maklumat skor.[11] Pada awalnya, teknologi sintesis Vocaloid dikenali sebagai "Frequency-domain Singing Articulation Splicing and Shaping" (Jepun: 周波数ドメイン歌唱アーティキュレーション接続法, Hepburn: Shūhasū-domain Kashō Articulation Setsuzoku-hō) sewaktu pengeluaran Vocaloid 1 pada tahun 2004,[12][13][14] walaupun Yamaha tidak lagi menggunakan nama ini selepas pengeluaran Vocaloid 2 pada tahun 2007.[15] "Artikulasi nyanyian" diterangkan sebagai "ekspresi vokal" seperti vibrato dan cebisan vokal, dan ia juga merupakan elemen penting dalam nyanyian. Enjin sintesis Vocaloid dan Vocaloid 2 direka khas untuk nyanyian, bukan untuk bacaan teks secara lantang,[16] walaupun perisian seperti Vocaloid-flex dan Voiceroid telah dibangunkan untuk tujuan tersebut. Ia juga tidak boleh meniru secara semula jadi ungkapan nyanyian seperti suara serak mahupun jeritan.[17]

Seni bina sistem sunting

 
Rajah sistem Vocaloid
(berdasarkan Rajah 1 pada Kenmochi & Ohshima , Interspeech 2007)

Bahagian-bahagian utama sistem Vocaloid 2 adalah Editor Skor (Editor Vocaloid 2), Pustaka Penyanyi, dan juga Enjin Sintesis.[3] Enjin Sintesis menerima maklumat skor daripada Editor Skor, memilih sampel yang sepatutnya daripada Pustaka Penyanyi, dan merangkaikan sampel tersebut kepada pengeluaran suara yang disintesis.[3] Pada dasarnya tidak ada perbezaan dalam Editor Skor dan Enjin Sintesis yang dibekalkan oleh Yamaha antara produk Vocaloid 2 yang berlainan. Apabila suatu produk Vocaloid 2 telah dipasang, penggunna boleh mendayakanproduk Vocaloid 2 yang lain melalui penambahan pustakanya. Sistem ini menyokong lima bahasa, iaitu bahasa Jepun, Korea, Cina, Sepanyol dan juga bahasa Inggeris, walaupun bahasa lain boleh menjadi pilihan pada masa akan datang.[2] Ia berfungsi secara sendiri (main balik dan eksport ke WAV) dan sebagai aplikasi Rewire atau instrumen Teknologi Studio Maya (VST) yang boleh diakses dari stesen kerja audio digital (DAW).

Editor Skor sunting

Editor skor (contoh)
Contoh lagu: "Sakura Sakura"

Editor Skor merupakan alat penyunting berjeniskan gulungan piano untuk memasukkan not, lirik dan beberapa ekspresi suara. Apabila memasuki lirik, editor itu secara automatik menukarkannya kepada bentuk simbol fonetik Vocaloid dengan menggunakan kamus ejaan yang direka khas.[3] Pengguna boleh mengedit simbol fonetik bagi perkataan yang tak berdaftar secara langsung.[10] Editor SKor menawarkan pelbagai parameter untuk menambar ekspresi kepada suara nyanyian. Pengguna disarankan untuk mengoptimumkan parameter-parameter pada tahap yang paling sesuai dengan irama yang disintesis apabila menggubah suara-suara. [9] Editor ini menyokong Rewire dan boleh diselaraskan dengan DAW. Lagu yang "dimain semula" dengan masa nyata berserta dengan lirik yang telah ditetapkan turut disokong menggunakan MIDI keyboard.[3]

Pustaka Suara sunting

Setiap lesen Vocaloid membangunkan satu Pustaka Suara, ataupun satu pangkalan data bagi serpihan vokal yang diambil daripada manusia sebenar.[3] Pangkalan data ini mesti mempunyai semua kemungkinan kombinasi fonem untuk bahasa sasaran,[3] termasuk difon (rantaian antara dua fonem yang berbeza) dan bunyi vokal mampan, serta polifon dengan gabungan dua atau lebih fonem jika diperlukan.[3] Misalnya, suara yang sepadan dengan huruf "sing" ([sIN]) boleh disintesis dengan merangkaikan urutan difon "#-s, s-I, I-N, N-#" (# menandakan fonem tak bersuara) dengan bunyi vokal mampan ī.[16] Sistem Vocaloid mengubah pic bagi serpihan-serpihan ini supaya ia menjadi sesuai dengan melodi. Dalam usaha untuk mendapatkan bunyi yang lebih semula jadi, tiga atau empat julat pic berbeza diperlukan untuk disimpan ke dalam perpustakaan.[18][19] Bahasa Jepun memerlukan 500 difon untuk satu pic, manakala bahasa Inggeris memerluka 2,500 difon.[16] Bahasa Jepun mempunyai difon yang lebih sedikit disebabkan ia mempunyai kurang fonem dan kebanyakan bunyi suku kata adalah suka kata terbuka yang berakhiran dengan vokal. Dalam bahasa Jepun, terdapat pada asasnya tiga corak difon yang mengandungi konsonan: tak bersuara-konsonan, vokal-konsonan, dan konsonan-vokal. Jika dibuat perbandingan, bahasa Inggeris mempunyai banyak suku kata tertutup yang diakhiri dengan konsonan, juga melibatkan gubahan difon konsonan-konsonan dan konsonan-tak bersuara. Justeru, lebih banyak difon yang perlu untuk direkodkan ke dalam pustaka Inggeris berbanding pustaka Jepun. Oleh kerana perbezaan linguistik ini, pustaka Jepun tidak sesuai digunakan untuk nyanyian dalam Bahasa Inggeris secara fasih dan berkesan.

Lihat juga sunting

Rujukan sunting

  1. ^ "Voctro Labs - Advanced Voice Technologies". Voctro Labs. Dicapai pada April 6, 2013.
  2. ^ a b Werde, Bill (November 23, 2003). "MUSIC; Could I Get That Song in Elvis, Please?". The New York Times. Dicapai pada October 23, 2010.
  3. ^ a b c d e f g h Kenmochi & Ohshima , Interspeech 2007
  4. ^ Wilkinson, Scott. "Humanoid or Vocaloid". Electronic Musician (August 1, 2003). Dicapai pada July 1, 2010.
  5. ^ "初音ミクなどの人気曲だけを集めた高音質コンピCDが登場!". Dengeki Online (dalam bahasa Japanese). ASCII Media Works. June 12, 2009. Dicapai pada January 22, 2011. Unknown parameter |trans_title= ignored (bantuan)CS1 maint: unrecognized language (link)
  6. ^ "初音ミクCD、週間ランキングでも初のオリコン1位に" (dalam bahasa Japanese). ITmedia Inc. May 25, 2010. Dicapai pada January 22, 2011. Unknown parameter |trans_title= ignored (bantuan)CS1 maint: unrecognized language (link)
  7. ^ "Vocaloid Miriam". Zero-G. Dicapai pada July 8, 2010.
  8. ^ Kenmochi & Fujimoto 2014 Pada versi engin Vocaloid seterusnya, blok tak bersuara bagi model EpR telah digabungkan dengan blok bersuara, untuk menyamakan perbezaan fonem antara kualiti bunyi.
  9. ^ a b DTM magazine , January 2008 Special ed., halaman 39
  10. ^ a b Kenmochi & Ohshima , SIGMUS 2008
  11. ^ "VOCALOIDについて" (dalam bahasa Japanese). Yamaha Corporation. Diarkibkan daripada yang asal pada 2011-08-26. Dicapai pada January 9, 2011. VOCALOID歌唱合成の流れ ... さらに楽譜情報に歌声に必要な表情情報(ビブラートなど)を入れることにより、よりリアルな歌声を作ることができます。 Unknown parameter |trans_title= ignored (bantuan)CS1 maint: unrecognized language (link)
  12. ^ "Characteristics of VOCALOID (2004)". VOCALOID1, Product line up (vocaloid.com) (dalam bahasa English). Yamaha Corporation. Dicapai pada 7 April 2016.CS1 maint: unrecognized language (link)
  13. ^ "『VOCALOID』(2004年)の特長". VOCALOID1製品紹介, ボカロ製品一覧 (vocaloid.com) (dalam bahasa Japanese). Yamaha Corporation. Dicapai pada 7 April 2016.CS1 maint: unrecognized language (link)
  14. ^ 歌詞とメロディを入力すると歌い出す ヤマハが歌声合成ソフト開発 (dalam bahasa Japanese). ITmedia Inc. February 26, 2003. Dicapai pada January 9, 2011. Unknown parameter |trans_title= ignored (bantuan)CS1 maint: unrecognized language (link)
  15. ^ "Vocaloid" (dalam bahasa Japanese). Yamaha Corporation. Dicapai pada January 9, 2011.CS1 maint: unrecognized language (link)
  16. ^ a b c Kenmochi , DCAJ 2008, 第III章 歌唱合成システムVOCALOIDと初音ミク [Part 3. Singing Synthesis System VOCALOID and Hatsune MIKU]
  17. ^ Kenmochi , HIS 2008
  18. ^ "クリプトン社佐々木氏インタビュー". DTM magazine (dalam bahasa Japanese). Jil. 17 no. 2. Terajima Joho Kikaku. February 2010. m/s. 106. ASIN B002ZHYKL6. Unknown parameter |trans_title= ignored (bantuan)CS1 maint: unrecognized language (link)
  19. ^ Inoue, Satoru (January 14, 2008). 技術フロンティア 肉声に近づいた音声合成(ヤマハ、クリプトン・フューチャー・メディア、アニモ). Nikkei Business (dalam bahasa Japanese). Nikkei BP (1424): 78–80. ISSN 0029-0491. Unknown parameter |trans_title= ignored (bantuan)CS1 maint: unrecognized language (link)

Bibliografi sunting

Teknologi
Keluaran terbitan

Bacaan lanjutan sunting

Rencana bertema
Kupasan