Senarai rujukan entiti aksara XML dan HTML

rencana senarai Wikimedia

Dalam dokumen HTTP, HTML dan XML, pembinaan logik yang dikenali sebagai data askara dan nilai atribut terdiri daripada urutan askara, di mana setiap askara boleh nyata (mewakili dirinya sendiri), atau boleh diwakili oleh satu siri aksara yang dipanggil rujukan askara, yang mana terdapat dua jenis: rujukan aksara angka dan rujukan entiti askara. Artikel ini menyenaraikan rujukan entiti askara yang sah dalam dokumen HTML dan XML.

Rujukan entiti askara merujuk kepada kandungan entiti yang dinamakan. Pengisytiharan entiti dicipta dengan menggunakan sintaks <!ENTITY name "value"> dalam Document Type Definition (DTD).

Gambaran keseluruhan rujukan aksara sunting

Rujukan askara angka merujuk kepada askara mengikut titik kod Universal Character Set/Unicode, dan menggunakan format berikut:

&#nnnn;

atau

&#xhhhh;

dimana nnnn adalah titik kod dalam bentuk perpuluhan, dan hhhh adalah titik kod dalam bentuk heksadesimal. x mesti huruf kecil dalam dokumen XML. nnnn atau hhhh mungkin bilangan digit dan mungkin dimulakan dengan sifar. hhhh boleh mencampur huruf besar dan huruf kecil, walaupun huruf besar adalah gaya biasa.

Sebaliknya, rujukan entiti askara merujuk kepada askara dengan nama entiti yang mempunyai askara yang diingini sebagai teks penggantian. Entiti mestilah dipratentukan (dibina dalam bahasa markup) atau secara eksplisit diisytiharkan dalam Document Type Definition (DTD). Formatnya adalah sama dengan mana-mana rujukan entiti:

&nama;

dimana nama adalah entiti nama sensitif huruf. Koma bertitik diperlukan.

Entiti awam piawai ditetapkan untuk aksara sunting

Set Entiti ISO: SGML membekalkan satu set lengkap pengisytiharan entiti untuk aksara yang digunakan secara meluas dalam penerbitan teknikal dan rujukan Barat, untuk skrip Latin, Yunani dan Cyrillic. Persatuan Matematik Amerika juga menyumbang entiti untuk aksara matematik.

Set Entiti HTML: Versi awal HTML dibina dalam subset kecil ini, yang berkaitan dengan askara-askara yang terdapat dalam tiga fon Western 8-bit.

Set Entiti MathML: W3C membangunkan satu set perisytiharan entiti untuk aksara MathML.

Set Entiti XML: W3C Kumpulan Kerja MathML mengambil alih penyelenggaraan set entiti awam ISO, digabungkan dengan MathML dan dokumen mereka dalam Definisi Entiti XML untuk Askara. Set ini boleh menyokong keperluan XHTML, MathML dan sebagai input kepada versi HTML masa depan.

HTML 5: HTML5 mengguna pakai entiti XML sebagai rujukan askara dinamakan, namun ia menyatakan semula XML tanpa merujuk kepada sumber XML dan tidak menyusunnya ke dalam set. Spesifikasi HTML 5 juga menyediakan pemetaan dari nama kepada urutan aksara Unicode menggunakan JSON.

Banyak set entiti lain telah dibangunkan untuk keperluan khas, dan bagi skrip utama dan minoriti. Bagaimanapun, kemunculan Unicode sebahagian besarnya menggantikannya.

Entiti yang ditetapkan dalam XML sunting

Spesifikasi XML tidak menggunakan istilah "entiti askara" atau "rujukan entiti askara". Spesifikasi XML mentakrifkan lima "entiti yang telah ditetapkan" yang mewakili aksara khas, dan menghendaki semua pemproses XML menghormati mereka. Entiti-entiti itu boleh dinyatakan secara eksplisit dalam DTD, juga, tetapi jika ini dilakukan, teks penggantian mestilah sama dengan definisi terbina dalam. XML juga membenarkan entiti yang dinamakan lain apa-apa saiz yang akan ditakrifkan pada setiap dokumen.

Jadual di bawah menyenaraikan lima entiti yang telah ditetapkan terlebih dahulu oleh XML. Lajur "Nama" menyebut nama entiti. Lajur "Askaara" menunjukkan aksara. Untuk menjadikan asakara itu, formatnya &nama; digunakan; contohnya, &amp; menjadi &. Lajur "titik kod Unicode" memetik askara melalui standard notasi UCS/Unicode "U+", yang menunjukkan titik kod askara dalam heksadesimal. Persamaan perpuluhan titik kod kemudian ditunjukkan dalam kurungan. Lajur "Standard" menunjukkan versi XML pertama yang merangkumi entiti. Lajur "Penerangan" memaparkan askara melalui nama kanji UCS/Unicode, dalam Bahasa Melayu dan bahasa Inggeris jika tiada penerangan rasmi di PRPM.

Nama Askara Titik kod Unicode (perpuluhan) Standard Penerangan
quot " U+0022 (34) XML 1.0 tanda petikan berganda
amp & U+0026 (38) XML 1.0 ampersan
apos ' U+0027 (39) XML 1.0 apostrof (petikan apostrof)
lt < U+003C (60) XML 1.0 Tanda kurang daripada
gt > U+003E (62) XML 1.0 tanda lebih daripada

Rujukan entiti askara dalam HTML sunting

HTML 4 DTDs menentukan 252 entiti yang dinamakan, rujukan yang bertindak sebagai alias mnemonik untuk aksara Unicode tertentu. Spesifikasi HTML 4 memerlukan penggunaan DTD standard dan tidak membenarkan pengguna untuk menentukan entiti tambahan. Disebabkan kenyataan ini beberapa "Penerangan" Unicode tidak dapat diterjemahkan dalam Bahasa Melayu kerana takut tersasar dari senarai rasmi yang dibuat oleh Unicode dan XML.

Dalam jadual di bawah, lajur "Standard" menunjukkan versi pertama HTML DTD yang mentakrifkan rujukan entiti askara. HTML 4.01 tidak menyediakan sebarang rujukan aksara baru.

Untuk menggunakan salah satu rujukan entiti askara dalam dokumen HTML atau XML, masukkan ampersan diikuti dengan nama entiti dan titik koma, cth., &amp; untuk ampersan ("&").

Nama Askara Titik kod Unicode (perpuluhan) Standard DTD[a] Subset ISO lama[b] Penerangan[c]
exclamation ! U+0021 (33) HTML 2.0 ISOnum tanda seru
quot " U+0022 (34) HTML 2.0 HTMLspecial ISOnum tanda petikan (petikan APL)
percent % U+0025 (37) HTML 2.0 ISOnum tanda peratus
amp & U+0026 (38) Spesifikasi html asal (html 1.0) dan HTML 2.0 HTMLspecial dan http://info.cern.ch/MarkUp/html-spec/html.dtd (yang asal) ISOnum ampersan
apos ' U+0027 (39) XHTML 1.0 HTMLspecial ISOnum apostrophe (apostrophe-quote); lihat bawah
add + U+002B (43) HTML 3.0 ISOnum plus sign
lt < U+003C (60) Spesifikasi html asal (html 1.0) dan HTML 2.0 HTMLspecial dan http://info.cern.ch/MarkUp/html-spec/html.dtd (yang asal) ISOnum less-than sign
equal = U+003D (61) HTML 3.0 ISOnum equals sign
gt > U+003E (62) Spesifikasi html asal (html 1.0) dan HTML 2.0 HTMLspecial dan http://info.cern.ch/MarkUp/html-spec/html.dtd (yang asal) ISOnum greater-than sign
nbsp   U+00A0 (160) HTML 3.2 HTMLlat1 ISOnum no-break space (non-breaking space)[d]
iexcl ¡ U+00A1 (161) HTML 3.2 HTMLlat1 ISOnum inverted exclamation mark
cent ¢ U+00A2 (162) HTML 3.2 HTMLlat1 ISOnum cent sign
pound £ U+00A3 (163) HTML 3.2 HTMLlat1 ISOnum pound sign
curren ¤ U+00A4 (164) HTML 3.2 HTMLlat1 ISOnum currency sign
yen ¥ U+00A5 (165) HTML 3.2 HTMLlat1 ISOnum yen sign (yuan sign)
brvbar ¦ U+00A6 (166) HTML 3.2 HTMLlat1 ISOnum broken bar (broken vertical bar)
sect § U+00A7 (167) HTML 3.2 HTMLlat1 ISOnum section sign
uml ¨ U+00A8 (168) HTML 3.2 HTMLlat1 ISOdia diaeresis (spacing diaeresis); lihat Umlaut Jermanik
copy © U+00A9 (169) HTML 3.2 HTMLlat1 ISOnum copyright symbol
ordf ª U+00AA (170) HTML 3.2 HTMLlat1 ISOnum feminine ordinal indicator
laquo « U+00AB (171) HTML 3.2 HTMLlat1 ISOnum left-pointing double angle quotation mark (left pointing guillemet)
not ¬ U+00AC (172) HTML 3.2 HTMLlat1 ISOnum not sign
shy   U+00AD (173) HTML 3.2 HTMLlat1 ISOnum soft hyphen (discretionary hyphen)
reg ® U+00AE (174) HTML 3.2 HTMLlat1 ISOnum registered sign (registered trademark symbol)
macr ¯ U+00AF (175) HTML 3.2 HTMLlat1 ISOdia macron (spacing macron, overline, APL overbar)
deg ° U+00B0 (176) HTML 3.2 HTMLlat1 ISOnum degree symbol
plusmn ± U+00B1 (177) HTML 3.2 HTMLlat1 ISOnum plus-minus sign (plus-or-minus sign)
sup2 ² U+00B2 (178) HTML 3.2 HTMLlat1 ISOnum superscript two (superscript digit two, squared)
sup3 ³ U+00B3 (179) HTML 3.2 HTMLlat1 ISOnum superscript three (superscript digit three, cubed)
acute ´ U+00B4 (180) HTML 3.2 HTMLlat1 ISOdia aksen akut (spacing acute)
micro µ U+00B5 (181) HTML 3.2 HTMLlat1 ISOnum micro sign
para U+00B6 (182) HTML 3.2 HTMLlat1 ISOnum pilcrow sign (paragraph sign)
middot · U+00B7 (183) HTML 3.2 HTMLlat1 ISOnum middle dot (Georgian comma, Greek middle dot)
cedil ¸ U+00B8 (184) HTML 3.2 HTMLlat1 ISOdia cedilla (spacing cedilla)
sup1 ¹ U+00B9 (185) HTML 3.2 HTMLlat1 ISOnum superscript one (superscript digit one)
ordm º U+00BA (186) HTML 3.2 HTMLlat1 ISOnum masculine ordinal indicator
raquo » U+00BB (187) HTML 3.2 HTMLlat1 ISOnum right-pointing double angle quotation mark (right pointing guillemet)
frac14 ¼ U+00BC (188) HTML 3.2 HTMLlat1 ISOnum vulgar fraction one quarter (fraction one quarter)
frac12 ½ U+00BD (189) HTML 3.2 HTMLlat1 ISOnum vulgar fraction one half (fraction one half)
frac34 ¾ U+00BE (190) HTML 3.2 HTMLlat1 ISOnum vulgar fraction three quarters (fraction three quarters)
iquest ¿ U+00BF (191) HTML 3.2 HTMLlat1 ISOnum Tanda soal terbalik (tanda soal terpusing)
Agrave À U+00C0 (192) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin A dengan aksen grava (Huruf besar Latin A grave)
Aacute Á U+00C1 (193) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin A dengan aksen akut
Acirc  U+00C2 (194) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin A dengan circumflex
Atilde à U+00C3 (195) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin A dengan tilde
Auml Ä U+00C4 (196) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin A dengan diaeresis
Aring Å U+00C5 (197) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin A dengan ring above (Huruf besar Latin A ring)
AElig Æ U+00C6 (198) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin AE (Ligatur besar Latin AE)
Ccedil Ç U+00C7 (199) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin C dengan cedilla
Egrave È U+00C8 (200) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin E dengan aksen grava
Eacute É U+00C9 (201) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin E dengan aksen akut
Ecirc Ê U+00CA (202) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin E dengan circumflex
Euml Ë U+00CB (203) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin E dengan diaeresis
Igrave Ì U+00CC (204) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin I dengan aksen grava
Iacute Í U+00CD (205) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin I dengan aksen akut
Icirc Î U+00CE (206) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin I dengan circumflex
Iuml Ï U+00CF (207) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin I dengan diaeresis
ETH Ð U+00D0 (208) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin Eth
Ntilde Ñ U+00D1 (209) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin N dengan tilde
Ograve Ò U+00D2 (210) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin O dengan aksen grava
Oacute Ó U+00D3 (211) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin O dengan aksen akut
Ocirc Ô U+00D4 (212) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin O dengan circumflex
Otilde Õ U+00D5 (213) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin O dengan tilde
Ouml Ö U+00D6 (214) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin O dengan diaeresis
times × U+00D7 (215) HTML 3.2 HTMLlat1 ISOnum multiplication sign
Oslash Ø U+00D8 (216) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin O with stroke (Huruf besar Latin O slash)
Ugrave Ù U+00D9 (217) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin U dengan aksen grava
Uacute Ú U+00DA (218) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin U dengan aksen akut
Ucirc Û U+00DB (219) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin U dengan circumflex
Uuml Ü U+00DC (220) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin U dengan diaeresis
Yacute Ý U+00DD (221) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin Y dengan aksen akut
THORN Þ U+00DE (222) HTML 2.0 HTMLlat1 ISOlat1 Huruf besar Latin THORN
szlig ß U+00DF (223) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin sharp s (ess-zed); see German Eszett
agrave à U+00E0 (224) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin a dengan aksen grava
aacute á U+00E1 (225) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin a dengan aksen akut
acirc â U+00E2 (226) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin a dengan circumflex
atilde ã U+00E3 (227) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin a dengan tilde
auml ä U+00E4 (228) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin a dengan diaeresis
aring å U+00E5 (229) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin a with ring above
aelig æ U+00E6 (230) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin ae (Ligatur kecil Latin ae)
ccedil ç U+00E7 (231) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin c dengan cedilla
egrave è U+00E8 (232) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin e dengan aksen grava
eacute é U+00E9 (233) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin e dengan aksen akut
ecirc ê U+00EA (234) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin e dengan circumflex
euml ë U+00EB (235) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin e dengan diaeresis
igrave ì U+00EC (236) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin i dengan aksen grava
iacute í U+00ED (237) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin i dengan aksen akut
icirc î U+00EE (238) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin i dengan circumflex
iuml ï U+00EF (239) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin i dengan diaeresis
eth ð U+00F0 (240) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin eth
ntilde ñ U+00F1 (241) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin n dengan tilde
ograve ò U+00F2 (242) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin o dengan aksen grava
oacute ó U+00F3 (243) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin o dengan aksen akut
ocirc ô U+00F4 (244) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin o dengan circumflex
otilde õ U+00F5 (245) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin o dengan tilde
ouml ö U+00F6 (246) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin o dengan diaeresis
divide ÷ U+00F7 (247) HTML 3.2 HTMLlat1 ISOnum division sign (obelus)
oslash ø U+00F8 (248) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin o with stroke (Huruf kecil Latin o slash)
ugrave ù U+00F9 (249) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin u dengan aksen grava
uacute ú U+00FA (250) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin u dengan aksen akut
ucirc û U+00FB (251) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin u dengan circumflex
uuml ü U+00FC (252) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin u dengan diaeresis
yacute ý U+00FD (253) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin y dengan aksen akut
thorn þ U+00FE (254) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin thorn
yuml ÿ U+00FF (255) HTML 2.0 HTMLlat1 ISOlat1 Huruf kecil Latin y dengan diaeresis
OElig ΠU+0152 (338) HTML 4.0 HTMLspecial ISOlat2 Ligatur besar Latin oe[e]
oelig œ U+0153 (339) HTML 4.0 HTMLspecial ISOlat2 Ligatur kecil Latin oe[e]
Scaron Š U+0160 (352) HTML 4.0 HTMLspecial ISOlat2 Huruf besar Latin s dengan caron
scaron š U+0161 (353) HTML 4.0 HTMLspecial ISOlat2 Huruf kecil Latin s dengan caron
Yuml Ÿ U+0178 (376) HTML 4.0 HTMLspecial ISOlat2 Huruf besar Latin y dengan diaeresis
fnof ƒ U+0192 (402) HTML 4.0 HTMLsymbol ISOtech Huruf kecil Latin f dengan cangkuk (function, florin)
circ ˆ U+02C6 (710) HTML 4.0 HTMLspecial ISOpub sirkumfleks huruf pengubah
tilde ˜ U+02DC (732) HTML 4.0 HTMLspecial ISOdia tilde kecil
Alpha Α U+0391 (913) HTML 4.0 HTMLsymbol Huruf besar Yunani Alpha
Beta Β U+0392 (914) HTML 4.0 HTMLsymbol Huruf besar Yunani Beta
Gamma Γ U+0393 (915) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Gamma
Delta Δ U+0394 (916) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Delta
Epsilon Ε U+0395 (917) HTML 4.0 HTMLsymbol Huruf besar Yunani Epsilon
Zeta Ζ U+0396 (918) HTML 4.0 HTMLsymbol Huruf besar Yunani Zeta
Eta Η U+0397 (919) HTML 4.0 HTMLsymbol Huruf besar Yunani Eta
Theta Θ U+0398 (920) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Theta
Iota Ι U+0399 (921) HTML 4.0 HTMLsymbol Huruf besar Yunani Iota
Kappa Κ U+039A (922) HTML 4.0 HTMLsymbol Huruf besar Yunani Kappa
Lambda Λ U+039B (923) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Lambda
Mu Μ U+039C (924) HTML 4.0 HTMLsymbol Huruf besar Yunani Mu
Nu Ν U+039D (925) HTML 4.0 HTMLsymbol Huruf besar Yunani Nu
Xi Ξ U+039E (926) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Xi
Omicron Ο U+039F (927) HTML 4.0 HTMLsymbol Huruf besar Yunani Omicron
Pi Π U+03A0 (928) HTML 4.0 HTMLsymbol Huruf besar Yunani Pi
Rho Ρ U+03A1 (929) HTML 4.0 HTMLsymbol Huruf besar Yunani Rho
Sigma Σ U+03A3 (931) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Sigma
Tau Τ U+03A4 (932) HTML 4.0 HTMLsymbol Huruf besar Yunani Tau
Upsilon Υ U+03A5 (933) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Upsilon
Phi Φ U+03A6 (934) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Phi
Chi Χ U+03A7 (935) HTML 4.0 HTMLsymbol Huruf besar Yunani Chi
Psi Ψ U+03A8 (936) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Psi
Omega Ω U+03A9 (937) HTML 4.0 HTMLsymbol ISOgrk3 Huruf besar Yunani Omega
alpha α U+03B1 (945) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani alpha
beta β U+03B2 (946) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani beta
gamma γ U+03B3 (947) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani gamma
delta δ U+03B4 (948) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani delta
epsilon ε U+03B5 (949) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani epsilon
zeta ζ U+03B6 (950) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani zeta
eta η U+03B7 (951) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani eta
theta θ U+03B8 (952) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani theta
iota ι U+03B9 (953) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani iota
kappa κ U+03BA (954) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani kappa
lambda λ U+03BB (955) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani lambda
mu μ U+03BC (956) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani mu
nu ν U+03BD (957) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani nu
xi ξ U+03BE (958) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani xi
omicron ο U+03BF (959) HTML 4.0 HTMLsymbol NEW Huruf kecil Yunani omicron
pi π U+03C0 (960) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani pi
rho ρ U+03C1 (961) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani rho
sigmaf ς U+03C2 (962) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani final sigma
sigma σ U+03C3 (963) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani sigma
tau τ U+03C4 (964) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani tau
upsilon υ U+03C5 (965) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani upsilon
phi φ U+03C6 (966) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani phi
chi χ U+03C7 (967) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani chi
psi ψ U+03C8 (968) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani psi
omega ω U+03C9 (969) HTML 4.0 HTMLsymbol ISOgrk3 Huruf kecil Yunani omega
thetasym ϑ U+03D1 (977) HTML 4.0 HTMLsymbol NEW Greek theta symbol
upsih ϒ U+03D2 (978) HTML 4.0 HTMLsymbol NEW Greek Upsilon dengan cangkuk symbol
piv ϖ U+03D6 (982) HTML 4.0 HTMLsymbol ISOgrk3 Greek pi symbol
ensp U+2002 (8194) HTML 4.0 HTMLspecial ISOpub en space[d]
emsp U+2003 (8195) HTML 4.0 HTMLspecial ISOpub em space[d]
thinsp U+2009 (8201) HTML 4.0 HTMLspecial ISOpub thin space[d]
zwnj   U+200C (8204) HTML 4.0 HTMLspecial NEW RFC 2070 zero-width non-joiner
zwj   U+200D (8205) HTML 4.0 HTMLspecial NEW RFC 2070 zero-width joiner
lrm   U+200E (8206) HTML 4.0 HTMLspecial NEW RFC 2070 left-to-right mark
rlm   U+200F (8207) HTML 4.0 HTMLspecial NEW RFC 2070 right-to-left mark
ndash U+2013 (8211) HTML 4.0 HTMLspecial ISOpub en dash
mdash U+2014 (8212) HTML 4.0 HTMLspecial ISOpub em dash
horbar U+2015 (8213) Horizontal bar
lsquo U+2018 (8216) HTML 4.0 HTMLspecial ISOnum left single quotation mark
rsquo U+2019 (8217) HTML 4.0 HTMLspecial ISOnum right single quotation mark
sbquo U+201A (8218) HTML 4.0 HTMLspecial NEW single low-9 quotation mark
ldquo U+201C (8220) HTML 4.0 HTMLspecial ISOnum left double quotation mark
rdquo U+201D (8221) HTML 4.0 HTMLspecial ISOnum right double quotation mark
bdquo U+201E (8222) HTML 4.0 HTMLspecial NEW double low-9 quotation mark
dagger U+2020 (8224) HTML 4.0 HTMLspecial ISOpub dagger, obelisk
Dagger U+2021 (8225) HTML 4.0 HTMLspecial ISOpub double dagger, double obelisk
bull U+2022 (8226) HTML 4.0 HTMLspecial ISOpub bullet (black small circle)[f]
hellip U+2026 (8230) HTML 4.0 HTMLsymbol ISOpub horizontal ellipsis (three dot leader)
permil U+2030 (8240) HTML 4.0 HTMLspecial ISOtech per mille sign
prime U+2032 (8242) HTML 4.0 HTMLsymbol ISOtech prime (minutes, feet)
Prime U+2033 (8243) HTML 4.0 HTMLsymbol ISOtech double prime (seconds, inches)
lsaquo U+2039 (8249) HTML 4.0 HTMLspecial ISO proposed single left-pointing angle quotation mark[g]
rsaquo U+203A (8250) HTML 4.0 HTMLspecial ISO proposed single right-pointing angle quotation mark[g]
oline U+203E (8254) HTML 4.0 HTMLsymbol NEW overline (spacing overscore)
frasl U+2044 (8260) HTML 4.0 HTMLsymbol NEW fraction slash (solidus)
euro U+20AC (8364) HTML 4.0 HTMLspecial NEW euro sign
image U+2111 (8465) HTML 4.0 HTMLsymbol ISOamso black-letter capital I (imaginary part)
weierp U+2118 (8472) HTML 4.0 HTMLsymbol ISOamso script capital P (power set, Weierstrass p)
real U+211C (8476) HTML 4.0 HTMLsymbol ISOamso black-letter capital R (real part symbol)
trade U+2122 (8482) HTML 4.0 HTMLsymbol ISOnum trademark symbol
alefsym U+2135 (8501) HTML 4.0 HTMLsymbol NEW alef symbol (first transfinite cardinal)[h]
larr U+2190 (8592) HTML 4.0 HTMLsymbol ISOnum leftwards arrow
uarr U+2191 (8593) HTML 4.0 HTMLsymbol ISOnum upwards arrow
rarr U+2192 (8594) HTML 4.0 HTMLsymbol ISOnum rightwards arrow
darr U+2193 (8595) HTML 4.0 HTMLsymbol ISOnum downwards arrow
harr U+2194 (8596) HTML 4.0 HTMLsymbol ISOamsa left right arrow
crarr U+21B5 (8629) HTML 4.0 HTMLsymbol NEW downwards arrow with corner leftwards (carriage return)
lArr U+21D0 (8656) HTML 4.0 HTMLsymbol ISOtech leftwards double arrow[i]
uArr U+21D1 (8657) HTML 4.0 HTMLsymbol ISOamsa upwards double arrow
rArr U+21D2 (8658) HTML 4.0 HTMLsymbol ISOnum rightwards double arrow[j]
dArr U+21D3 (8659) HTML 4.0 HTMLsymbol ISOamsa downwards double arrow
hArr U+21D4 (8660) HTML 4.0 HTMLsymbol ISOamsa left right double arrow
forall U+2200 (8704) HTML 4.0 HTMLsymbol ISOtech for all
part U+2202 (8706) HTML 4.0 HTMLsymbol ISOtech partial differential
exist U+2203 (8707) HTML 4.0 HTMLsymbol ISOtech there exists
empty U+2205 (8709) HTML 4.0 HTMLsymbol ISOamso empty set (null set); Lihat juga U+8960, ⌀
nabla U+2207 (8711) HTML 4.0 HTMLsymbol ISOtech del or nabla (vector differential operator)
isin U+2208 (8712) HTML 4.0 HTMLsymbol ISOtech element of
notin U+2209 (8713) HTML 4.0 HTMLsymbol ISOtech not an element of
ni U+220B (8715) HTML 4.0 HTMLsymbol ISOtech contains as member
prod U+220F (8719) HTML 4.0 HTMLsymbol ISOamsb n-ary product (product sign)[k]
sum U+2211 (8721) HTML 4.0 HTMLsymbol ISOamsb n-ary summation[l]
minus U+2212 (8722) HTML 4.0 HTMLsymbol ISOtech minus sign
lowast U+2217 (8727) HTML 4.0 HTMLsymbol ISOtech asterisk operator
radic U+221A (8730) HTML 4.0 HTMLsymbol ISOtech square root (radical sign)
prop U+221D (8733) HTML 4.0 HTMLsymbol ISOtech proportional to
infin U+221E (8734) HTML 4.0 HTMLsymbol ISOtech infinity
ang U+2220 (8736) HTML 4.0 HTMLsymbol ISOamso angle
and U+2227 (8743) HTML 4.0 HTMLsymbol ISOtech logik and (wedge)
or U+2228 (8744) HTML 4.0 HTMLsymbol ISOtech logik or (vee)
cap U+2229 (8745) HTML 4.0 HTMLsymbol ISOtech intersection (cap)
cup U+222A (8746) HTML 4.0 HTMLsymbol ISOtech union (cup)
int U+222B (8747) HTML 4.0 HTMLsymbol ISOtech integral
there4 U+2234 (8756) HTML 4.0 HTMLsymbol ISOtech therefore sign
sim U+223C (8764) HTML 4.0 HTMLsymbol ISOtech tilde operator (varies with, similar to)[m]
cong U+2245 (8773) HTML 4.0 HTMLsymbol ISOtech congruent to
asymp U+2248 (8776) HTML 4.0 HTMLsymbol ISOamsr almost equal to (asymptotic to)
ne U+2260 (8800) HTML 4.0 HTMLsymbol ISOtech not equal to
equiv U+2261 (8801) HTML 4.0 HTMLsymbol ISOtech identical to; sometimes used for 'equivalent to'
le U+2264 (8804) HTML 4.0 HTMLsymbol ISOtech less-than or equal to
ge U+2265 (8805) HTML 4.0 HTMLsymbol ISOtech greater-than or equal to
sub U+2282 (8834) HTML 4.0 HTMLsymbol ISOtech subset of
sup U+2283 (8835) HTML 4.0 HTMLsymbol ISOtech superset of[n]
nsub U+2284 (8836) HTML 4.0 HTMLsymbol ISOamsn not a subset of
sube U+2286 (8838) HTML 4.0 HTMLsymbol ISOtech subset of or equal to
supe U+2287 (8839) HTML 4.0 HTMLsymbol ISOtech superset of or equal to
oplus U+2295 (8853) HTML 4.0 HTMLsymbol ISOamsb circled plus (direct sum)
otimes U+2297 (8855) HTML 4.0 HTMLsymbol ISOamsb circled times (vector product)
perp U+22A5 (8869) HTML 4.0 HTMLsymbol ISOtech up tack (orthogonal to, perpendicular)[o]
sdot U+22C5 (8901) HTML 4.0 HTMLsymbol ISOamsb dot operator[p]
lceil U+2308 (8968) HTML 4.0 HTMLsymbol ISOamsc left ceiling (APL upstile)
rceil U+2309 (8969) HTML 4.0 HTMLsymbol ISOamsc right ceiling
lfloor U+230A (8970) HTML 4.0 HTMLsymbol ISOamsc left floor (APL downstile)
rfloor U+230B (8971) HTML 4.0 HTMLsymbol ISOamsc right floor
lang U+2329 (9001) HTML 4.0 HTMLsymbol ISOtech left-pointing angle bracket (bra)[q]
rang U+232A (9002) HTML 4.0 HTMLsymbol ISOtech right-pointing angle bracket (ket)[r]
loz U+25CA (9674) HTML 4.0 HTMLsymbol ISOpub lozenge
spades U+2660 (9824) HTML 4.0 HTMLsymbol ISOpub black spade suit[f]
clubs U+2663 (9827) HTML 4.0 HTMLsymbol ISOpub black club suit (shamrock)[f]
hearts U+2665 (9829) HTML 4.0 HTMLsymbol ISOpub black heart suit (valentine)[f]
diams U+2666 (9830) HTML 4.0 HTMLsymbol ISOpub black diamond suit[f]

Nota:

  1. ^ DTD: nama DTD awam penuh (di mana nama entiti watak didefinisikan) sebenarnya dipetakan dari salah satu daripada tiga entiti yang dinamakan yang dinyatakan:
    • HTMLlat1 dipetakan kepada:
      • PUBLIC "-//W3C//ENTITIES Latin 1//EN//HTML" dalam HTML (DTD secara tersirat ditentukan, tiada sistem URI diperlukan);
      • PUBLIC "-//W3C//ENTITIES Latin 1 for XHTML//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent" dalam XHTML 1.0;
    • HTMLsymbol dipetakan kepada:
    • HTMLspecial dipetakan kepada:
  2. ^ Subset ISO lama: ini adalah subset aksara lama (didokumenkan) yang digunakan dalam pengekodan lama sebelum penyatuan dalam ISO 10646.
  3. ^ Penerangan: nama standard ISO 10646 dan Unicode dipaparkan terlebih dahulu untuk setiap aksara, dengan sinonim yang tidak standard tetapi warisan yang ditunjukkan dalam huruf miring di antara kurungan selepas tanda yang sama.
  4. ^ a b c d spaces: latar belakang biru digunakan untuk memaparkan jarak setiap ruang.
  5. ^ a b ligatur: ini adalah salah tafsiran standard kerana ini adalah askara yang berasingan dalam beberapa bahasa.
  6. ^ a b c d e black: disini bermaksud filled (penuh) yang bertentangan dengan hollow (kosong).
  7. ^ a b Cadangan ISO: askara-askara ini telah diseragamkan dalam ISO 10646 selepas pembebasan HTML 4.0.
  8. ^ alefsym: 'simbol alif' ini tidak sama dengan U+05D0 'alif huruf Ibrani', walaupun glyph yang sama boleh digunakan untuk menggambarkan kedua-dua aksara.
  9. ^ lArr: ISO 10646 tidak mengatakan 'leftwards double arrow' (anak panah berganda ke kiri) sama dengan anak panah 'is implied by' (diimplikasikan oleh), tetapi juga tidak mempunyai askara lain untuk fungsi itu. Jadi lArr boleh digunakan untuk 'is implied by' selepas dicadangkan oleh ISOtech.
  10. ^ rArr: ISO 10646 tidak mengatakan 'rightwards double arrow' (anak panah berganda ke kanan) sama dengan askara 'implies' (mengimplikasikan) tetapi tidak mempunyai asakara lain dengan fungsi ini, jadi rArr boleh digunakan untuk 'implies' selepas dicadangkan oleh ISOtech.
  11. ^ prod: 'n-ary product' bukanlah sama dengan askara U+03A0 'Huruf besar Yunani Pi' walaupun glif yang sama mungkin digunakan untuk kedua-duanya.
  12. ^ sum: 'n-ary summation' bukanlah sama dengan askara U+03A3 'Huruf besar Yunani Sigma' walaupun glif yang sama mungkin digunakan untuk kedua-duanya.
  13. ^ sim: 'tilde operator' bukanlah sama dengan askara U+007E 'tilde', walaupun glyph yang sama mungkin digunakan untuk mewakili kedua-duanya.
  14. ^ sup: ambil perhatian bahawa nsup, U+2283 'not a superset of', tidak meliputi dan tidak termasuk oleh pengekod fon Symbol. Sekiranya berlaku untuk simetri? Ia berada dalam subset ISOamsn.
  15. ^ perp: Unicode hanya mentakrifkan U+22A5 sebagai "up tack". Simbol Unicode untuk "perpendicular" adalah U+27C2. Kedua-dua simbol ini kelihatan sama, tetapi berasingan di Unicode. Walau bagaimanapun, penggunaan HTML U+22A5 sebagai simbol "perpendicular"nya. Ini adalah percanggahan antara HTML dan Unicode. Juga, askara U+22A4 (simbol "down tack") dijana dalam pelayar seperti Firefox 3.6 boleh memadankan fon sama ada "up tack" atau "perpendicular", tetapi tidak kedua-duanya, bergantung kepada sama ada lebar tetap atau fon berkadar digunakan. Apabila dilihat di Firefox 3.6, simbol yang diberikan dalam susunan U+22A5, U+22A4, U+27C2 dalam fon berkadar: ⊥ ⊤ ⟂ dan lebar tetap: ⊥ ⊤ ⟂, menunjukkan bahawa "down tack" sangat serupa dengan U+22A5 ("perpendicular" bagai HTML) dalam kes pertama tetapi sepadan U+27C2 dalam kes kedua. Ini merupakan contoh kesulitan semiotika yang terlibat dalam menafsirkan glif, simbol dan askara secara amnya.
  16. ^ sdot: 'dot operator' bukanlah sama dengan askara U+00B7 'middle dot'.
  17. ^ lang: U+2329 'left-pointing angle bracket' bukanlah sama dengan askara U+003C 'less than' (kurang daripada), U+2039 'single left-pointing angle quotation mark' (tanda petikan sudut kiri tunggal), U+27E8 'mathematical left angle bracket' (kurungan sudut kiri matematik), atau U+3008 'left angle bracket' (kurungan sudut kiri). Dalam HTML 5.0, lang telah dipetakan semula kepada U+27E8 'mathematical left angle bracket', kerana U+2329 'left-pointing angle bracket' telah ditanda usang dalam Unicode (Unicode.org - Proposal for Additional Deprecated Characters).
  18. ^ rang: U+232A 'right-pointing angle bracket' bukanlah sama dengan askara U+003E 'greater than' (lebih daripada), U+203A 'single right-pointing angle quotation mark' (tanda petikan sudut kanan tunggal), U+27E9 'mathematical right angle bracket' (kurungan sudut kanan matematik), atau U+3009 'right angle bracket' (kurungan sudut kanan). Dalam HTML 5.0, rang telah dipetakan semula kepada U+27E9 'mathematical right angle bracket', kerana U+232A 'right-pointing angle bracket' telah ditanda usang dalam Unicode (Unicode.org - Proposal for Additional Deprecated Characters).

Entiti mewakili aksara khas dalam XHTML sunting

XHTML DTD dengan jelas mengisytiharkan 253 entiti (termasuk 5 entiti yang telah ditentukan terawal XML 1.0) yang pengembangannya adalah askara tunggal yang boleh secara tidak rasmi dirujuk sebagai "entiti askara". Ini (dengan pengecualian entiti &apos;) mempunyai nama yang sama dan mewakili askara yang sama seperti 252 entiti askara dalam HTML. Juga, oleh kerana dokumen XML, XHTML mungkin merujuk kepada entiti &apos; yang telah ditetapkan,yang bukan salah satu daripada 252 entiti askara dalam HTML. Entiti tambahan mana-mana saiz boleh ditakrifkan pada setiap dokumen. Walau bagaimanapun, kegunaan rujukan entiti dalam XHTML dipengaruhi oleh cara dokumen diproses:

  • Jika dokumen dibaca oleh pemproses HTML yang sesuai, maka hanya 252 entiti askara HTML yang dapat digunakan dengan selamat. Penggunaan &apos; atau rujukan entiti tersuai mungkin tidak disokong dan boleh menghasilkan hasil yang tidak menentu.
  • Sekiranya dokumen tersebut dibaca oleh XML parser yang tidak dapat membaca entiti luaran, maka hanya lima entiti askara XML terbina (lihat di atas) selamat boleh digunakan, walaupun entiti lain dapat digunakan jika mereka dinyatakan dalam subset DTD dalaman.
  • Jika dokumen dibaca oleh parser XML yang tidak membaca entiti luaran, maka entiti aksara XML terbina dalam dapat digunakan dengan selamat. Lain 248 entiti askara HTML boleh digunakan selagi XHTML DTD boleh diakses oleh parser pada masa dokumen dibaca. Entiti lain juga boleh digunakan jika mereka diisytiharkan dalam subset DTD dalaman.

Kerana yang kes istimewa &apos; yang dinyatakan diatas, hanya &quot;, &amp;, &lt;, dan &gt; akan berfungsi dalam semua keadaan pemprosesan.

Lihat juga sunting

Rujukan sunting

Pautan luaran sunting