Kod bahasa

Kod bahasa ialah kod yang memberikan huruf atau nombor sebagai pengecam atau pengelas untuk bahasa. Kod ini boleh digunakan untuk mengatur koleksi perpustakaan atau pembentangan data, untuk memilih penyetempatan dan terjemahan yang betul dalam pengkomputan, dan sebagai sebutan singkatan untuk bentuk nama bahasa yang lebih panjang.

Kesukaran dalam pengelasan sunting

Skema-skema kod bahasa cuba mengelaskan dunia bahasa, dialek dan variasi manusia yang rumit. Kebanyakan skema membuat kompromi seperti menjadi umum dan cukup lengkap untuk menyokong dialek-dialek tertentu.

Contohnya, bahasa Sepanyol dituturkan di lebih 20 negara di Amerika Utara, Amerika Tengah, Caribbean dan Eropah. Bahasa Sepanyol yang dituturkan di Mexico akan berbeza sedikit daripada bahasa Sepanyol yang dituturkan di Peru. Wilayah Mexico yang berbeza akan mempunyai dialek dan loghat bahasa Sepanyol yang berbeza sedikit. Skema kod bahasa mungkin akan memanggil semua ini "Bahasa Sepanyol" untuk reka letak papan kekunci, kebanyakannya sebagai "Bahasa Sepanyol" untuk kegunaan umum, atau memisahkan setiap dialek untuk membenarkan variasi mengikut wilayah.

Skema lazim sunting

Senarai beberapa skema kod bahasa lazim
Skema	Nota	Examples for English	Examples for Sepanyol
Kod-kod Glottolog	Dicipta untuk bahasa-bahasa minoriti sebagai alternatif saintifik kepada standard ISO 639‑3 yang bergred perindustrian. Sengaja tidak menyerupai singkatan.	stan1293 – Inggeris standard macr1271 – Inggeris makro (Inggeris Moden, term. kreol) midd1317 – Inggeris Pertengahan merc1242 – Mercia (Inggeris Pertengahan ke Moden) olde1238 – Inggeris Lama angl1265 – Anglia (Lama ke Inggeris Moden, term. Scot)	stan1288 – Sepanyol standard olds1249 – Sepanyol Lama cast1243 – Castilla (Sepanyol Lama ke Moden, term. Extremadura dan kreol)
Tag bahasa IETF	Amalan terbaik IETF, ditentukan oleh BCP 47,^[1] untuk tag-tag bahasa yang mudah dihuraikan oleh komputer. Sistem tag ini boleh diperluaskan kepada wilayah, dialek dan sebutan peribadi. Ia merujuk ISO 639, ISO 3166 dan ISO 15924.	en – Inggeris, sebagai kod ISO 639 terpendek. en-US – Inggeris seperti yang digunakan di Amerika Syarikat (US ialah kod negara ISO 3166‑1 untuk Amerika Syarikat) Sumber: memo IETF^[2]	es – Sepanyol, sebagai kod ISO 639 terpendek. es-419 – Bahasa Sepanyol sesuai untuk wilayah Amerika Latin dan Caribbean, menggunakan kod wilayah UN M.49
ISO 639‑1	Sistem kod dua huruf dirasmikan pada tahun 2002, mengandungi 136 kod pada masa itu. Banyak sistem menggunakan kod ISO 639‑1 yang berhuruf dua, ditambah dengan kod tiga-huruf ISO 639‑2 apabila tiada kod dua huruf boleh digunakan.↵↵ Terdapat 183 kod dua huruf yang didaftarkan pada Jun 2021. Lihat: Senarai kod ISO 639	en	es – Sepanyol
ISO 639‑2	Sistem tiga huruf 464 kod. Lihat: List of ISO 639-2 codes	eng – kod tiga huruf enm – Inggeris Pertengahan, s. 1100–1500 ang – Inggeris Lama, s. 450–1100 cpe – kreol dan pidgin lain yang berdasarkan Inggeris	spa – Sepanyol
ISO 639‑3	Lanjutan ISO 639‑2 untuk merangkumi semua bahasa yang diketahui, hidup atau mati, pertuturan atau bertulis dalam 7,589 entri. Lihat: Senarai kod ISO 639-3	eng – kod tiga huruf enm – Inggeris Pertengahan, s. 1100–1500 aig – Kreol Inggeris di Antigua dan Barbuda ang – Inggeris Lama, s. 450–1100 svc – Inggeris Krol Vincent	spa – Sepanyol spq – Sepanyol, Loreto-Ucayali ssp – bahasa isyarat Sepanyol
Sistem kod Daftar Linguasphere	Sistem kod Daftar Linguasphere dua digit + satu hingga enam huruf yang diterbitkan pada tahun 2000,^[3] mengandungi lebih daripada 32,000 kod dalam 10 sektor rujukan, meliputi bahasa dan komuniti pertuturan seluruh dunia. Navigasi juga hierarki sistem kod Daftar Linguasphere yang diterbitkan dalam talian oleh hortensj-garden.org ^[4]	Dalam hierarki sistem kod Daftar Linguasphere: 5= filosektor Indo-Eropah 52= filozon Jermanik 52-A set Jermanik 52-AB rantaian Inggeris + Kreol Inggeris 52-ABA jaringan Inggeris 52-ABA-c Inggeris Global (unit luaran) 52-ABA-ca ke 52-ABA-cwe (186 varian) Bandingkan: 52-ABA-a Scots + Northumbriaunit luaran & 52-ABA-b unit luaran "Anglo-Inggeris"(= Varieti tradisional Britain Selatan + Old Anglo-Irish)	Dalam hierarki sistem kod Daftar Linguasphere: 5= filosektor Indo-Eropah 51= filozon Romawi 51-A set Romawi 51-AA rantaian Romawi 51-AAA jaringan Romawi Barat 51-AAA-b Español/Castellano (unit luaran) 51-AAA-ba ke 51-AAA-bkk (58 varian) Bandingkan: 51-AAA-a unit luaran Português + Galego & 51-AAA-c unit luaran Astur + Leonés, dsb.
Kod-kod SIL (edisi ke-10–14)	Kod dicipta untuk digunakan dalam Ethnologue, terbitan SIL International yang menyenaraikan statistik bahasa. Penerbitan kini menggunakan kod ISO 639‑3.	ENG	SPN
Kod bahasa Verbix	Kod yang dibina bermula dengan kod SIL lama dan menambah lebih banyak maklumat.^[5]	ENG	SPN

Rujukan sunting

^ "Information on BCP 47 » RFC Editor".
^ Best Current Practice 47 – Tags for Identifying Languages, IETF
^ "The Linguasphere Register in PDF". l’Observatoire linguistique (Linguasphere Observatory). Diarkibkan daripada yang asal pada 27 April 2015. Dicapai pada 20 April 2015.
^ "Linguasphere Register hierarchy". Dicapai pada 8 June 2016.
^ Verbix language codes Diarkibkan 2009-04-01 di Wayback Machine, Verbix

[1] "Information on BCP 47 » RFC Editor".

[2] Best Current Practice 47 – Tags for Identifying Languages, IETF

[3] "The Linguasphere Register in PDF". l’Observatoire linguistique (Linguasphere Observatory). Diarkibkan daripada yang asal pada 27 April 2015. Dicapai pada 20 April 2015.

[4] "Linguasphere Register hierarchy". Dicapai pada 8 June 2016.

[5] Verbix language codes Diarkibkan 2009-04-01 di Wayback Machine, Verbix

[1]

[2]

[3]

[4]

[5]