Kod bahasa ialah kod yang memberikan huruf atau nombor sebagai pengecam atau pengelas untuk bahasa. Kod ini boleh digunakan untuk mengatur koleksi perpustakaan atau pembentangan data, untuk memilih penyetempatan dan terjemahan yang betul dalam pengkomputan, dan sebagai sebutan singkatan untuk bentuk nama bahasa yang lebih panjang.

Kesukaran dalam pengelasan sunting

Skema-skema kod bahasa cuba mengelaskan dunia bahasa, dialek dan variasi manusia yang rumit. Kebanyakan skema membuat kompromi seperti menjadi umum dan cukup lengkap untuk menyokong dialek-dialek tertentu.

Contohnya, bahasa Sepanyol dituturkan di lebih 20 negara di Amerika Utara, Amerika Tengah, Caribbean dan Eropah. Bahasa Sepanyol yang dituturkan di Mexico akan berbeza sedikit daripada bahasa Sepanyol yang dituturkan di Peru. Wilayah Mexico yang berbeza akan mempunyai dialek dan loghat bahasa Sepanyol yang berbeza sedikit. Skema kod bahasa mungkin akan memanggil semua ini "Bahasa Sepanyol" untuk reka letak papan kekunci, kebanyakannya sebagai "Bahasa Sepanyol" untuk kegunaan umum, atau memisahkan setiap dialek untuk membenarkan variasi mengikut wilayah.

Skema lazim sunting

Senarai beberapa skema kod bahasa lazim
Skema Nota Examples for English Examples for Sepanyol
Kod-kod Glottolog Dicipta untuk bahasa-bahasa minoriti sebagai alternatif saintifik kepada standard ISO 639‑3 yang bergred perindustrian.

Sengaja tidak menyerupai singkatan.

  • stan1293 – Inggeris standard
  • macr1271 – Inggeris makro (Inggeris Moden, term. kreol)
  • midd1317 – Inggeris Pertengahan
  • merc1242 – Mercia (Inggeris Pertengahan ke Moden)
  • olde1238 – Inggeris Lama
  • angl1265 – Anglia (Lama ke Inggeris Moden, term. Scot)
  • stan1288 – Sepanyol standard
  • olds1249 – Sepanyol Lama
  • cast1243 – Castilla (Sepanyol Lama ke Moden, term. Extremadura dan kreol)
Tag bahasa IETF Amalan terbaik IETF, ditentukan oleh BCP 47,[1] untuk tag-tag bahasa yang mudah dihuraikan oleh komputer. Sistem tag ini boleh diperluaskan kepada wilayah, dialek dan sebutan peribadi. Ia merujuk ISO 639, ISO 3166 dan ISO 15924.
  • en – Inggeris, sebagai kod ISO 639 terpendek.
  • en-US – Inggeris seperti yang digunakan di Amerika Syarikat (US ialah kod negara ISO 3166‑1 untuk Amerika Syarikat)

Sumber: memo IETF[2]

  • es – Sepanyol, sebagai kod ISO 639 terpendek.
  • es-419 – Bahasa Sepanyol sesuai untuk wilayah Amerika Latin dan Caribbean, menggunakan kod wilayah UN M.49
ISO 639‑1 Sistem kod dua huruf dirasmikan pada tahun 2002, mengandungi 136 kod pada masa itu. Banyak sistem menggunakan kod ISO 639‑1 yang berhuruf dua, ditambah dengan kod tiga-huruf ISO 639‑2 apabila tiada kod dua huruf boleh digunakan.↵↵

Terdapat 183 kod dua huruf yang didaftarkan pada Jun 2021. Lihat: Senarai kod ISO 639

  • en
  • es – Sepanyol
ISO 639‑2 Sistem tiga huruf 464 kod.

Lihat: List of ISO 639-2 codes

  • eng – kod tiga huruf
  • enm – Inggeris Pertengahan, s. 1100–1500
  • ang – Inggeris Lama, s. 450–1100
  • cpe – kreol dan pidgin lain yang berdasarkan Inggeris
  • spa – Sepanyol
ISO 639‑3 Lanjutan ISO 639‑2 untuk merangkumi semua bahasa yang diketahui, hidup atau mati, pertuturan atau bertulis dalam 7,589 entri.

Lihat: Senarai kod ISO 639-3

  • eng – kod tiga huruf
  • enm – Inggeris Pertengahan, s. 1100–1500
  • aig – Kreol Inggeris di Antigua dan Barbuda
  • ang – Inggeris Lama, s. 450–1100
  • svc – Inggeris Krol Vincent
  • spa – Sepanyol
  • spq – Sepanyol, Loreto-Ucayali
  • ssp – bahasa isyarat Sepanyol
Sistem kod Daftar Linguasphere Sistem kod Daftar Linguasphere dua digit + satu hingga enam huruf yang diterbitkan pada tahun 2000,[3] mengandungi lebih daripada 32,000 kod dalam 10 sektor rujukan, meliputi bahasa dan komuniti pertuturan seluruh dunia.

Navigasi juga hierarki sistem kod Daftar Linguasphere yang diterbitkan dalam talian oleh hortensj-garden.org [4]

Dalam hierarki sistem kod Daftar Linguasphere:

  • 5= filosektor Indo-Eropah
  • 52= filozon Jermanik
  • 52-A set Jermanik
  • 52-AB rantaian Inggeris + Kreol Inggeris
  • 52-ABA jaringan Inggeris
  • 52-ABA-c Inggeris Global (unit luaran)

    52-ABA-ca ke 52-ABA-cwe (186 varian)

Bandingkan: 52-ABA-a Scots + Northumbriaunit luaran & 52-ABA-b unit luaran "Anglo-Inggeris"(= Varieti tradisional Britain Selatan + Old Anglo-Irish)

Dalam hierarki sistem kod Daftar Linguasphere:

  • 5= filosektor Indo-Eropah
  • 51= filozon Romawi
  • 51-A set Romawi
  • 51-AA rantaian Romawi
  • 51-AAA jaringan Romawi Barat
  • 51-AAA-b Español/Castellano (unit luaran)

    51-AAA-ba ke 51-AAA-bkk (58 varian)

Bandingkan: 51-AAA-a unit luaran Português + Galego & 51-AAA-c unit luaran Astur + Leonés, dsb.

Kod-kod SIL (edisi ke-10–14) Kod dicipta untuk digunakan dalam Ethnologue, terbitan SIL International yang menyenaraikan statistik bahasa. Penerbitan kini menggunakan kod ISO 639‑3. ENG SPN
Kod bahasa Verbix Kod yang dibina bermula dengan kod SIL lama dan menambah lebih banyak maklumat.[5] ENG SPN

Rujukan sunting

  1. ^ "Information on BCP 47 » RFC Editor".
  2. ^ Best Current Practice 47 – Tags for Identifying Languages, IETF
  3. ^ "The Linguasphere Register in PDF". l’Observatoire linguistique (Linguasphere Observatory). Diarkibkan daripada yang asal pada 27 April 2015. Dicapai pada 20 April 2015.
  4. ^ "Linguasphere Register hierarchy". Dicapai pada 8 June 2016.
  5. ^ Verbix language codes Diarkibkan 2009-04-01 di Wayback Machine, Verbix