Bahasa: Perbezaan antara semakan

Kandungan dihapus Kandungan ditambah
Rafiq Sinin (bincang | sumb.)
Dicipta dengan menterjemah laman "Bahasa"
k Back to revision
Baris 1:
{{multiple image
| align = right
| direction = vertical
| width =220
| image1 = Tepantitla mural, Ballplayer A (Daquella manera).jpg
| alt1 =
| caption1 = Sebuah mural di [[Teotihuacan]], Mexico ({{Circa|abad ke-2}}) yang menggambarkan orang yang memancarkan gulungan [[ucapan pidato]] dari mulutnya, melambangkan ucapan
| image2 = Cuneiform script2.png
| alt2 =
| caption2 = [[Tulisan pepaku]] adalah bentuk pertama bahasa [[bahasa bertulis]], tetapi bahasa [[bahasa lisan]] mendahului penulisan oleh sekurang-kurangnya puluhan ribu tahun.
| image3 = Girls learning sign language.jpg
| caption3 = Dua gadis belajar [[Bahasa Isyarat Amerika]]
| image4 = Braille house09.JPG
| caption4 = [[Braille]], varian [[Sistem somatosensori|sentuhan]] dari [[sistem penulisan]]
}}
'''Bahasa''' ([[Tulisan Jawi]]: بهاس) adalah sistem yang terdiri daripada pembangunan, pengambilalihan, penyelenggaraan dan penggunaan sistem komunikasi yang kompleks, terutamanya keupayaan [[manusia]] untuk melakukannya<!-- Jangan keluarkan kualifikasi "manusia" tanpa terlebih dahulu membaca artikel atau merujuk perbincangan mengenai isu ini.-->; dan '''bahasa''' adalah contoh khusus sistem sedemikian.
 
Kajian saintifik bahasa dipanggil [[linguistik]]. Soalan mengenai falsafah bahasa, seperti apakah perkataan boleh mewakili pengalaman, telah dibahaskan sekurang-kurangnya sejak [[Gorgias]] dan [[Plato]] di [[Yunani Purba]]. Pemikir seperti [[Jean-Jacques Rousseau|Rousseau]] berpendapat bahawa bahasa berasal dari [[emosi]] sementara yang lain seperti [[Immanuel Kant|Kant]] berpendapat bahawa ia berasal dari pemikiran rasional dan logik. Para ahli falsafah abad ke-20 seperti [[Ludwig Wittgenstein|Wittgenstein]] berpendapat bahawa falsafah adalah benar-benar kajian bahasa. Tokoh-tokoh utama dalam linguistik termasuk [[Ferdinand de Saussure]] dan [[Noam Chomsky]].
'''''Bahasa''''', '''''bhasa''''', '''''basa''''', atau '''''phasa''''' adalah perkataan yang merujuk kepada "bahasa" dalam banyak bahasa Asia, yang berasal dari perkataan [[Sanskrit|bahasa Sanskrit]] भाषा ''{{IAST2|bhāṣā}}'', bermaksud "ucapan, bahasa yang diucapkan". Dalam banyak bahasa moden di [[Asia Selatan]] dan [[Asia Tenggara]] yang telah dipengaruhi oleh bahasa Sanskrit atau [[Bahasa Pali|Pali]], istilah ''bahasa'' dan istilah kognitif digunakan untuk memberi maksud "bahasa" secara amnya.
 
Anggaran bilangan bahasa manusia di dunia berbeza-beza antara 5,000 dan 7,000. Walau bagaimanapun, apa-apa anggaran yang tepat bergantung kepada perbezaan sebahagiannya sewenang-wenang antara bahasa dan [[dialek]]. [[Bahasa sejadi]] adalah [[ucapan]] atau bahasa [[bahasa isyarat]], tetapi bahasa apa pun boleh [[Pengekodan (semiotika)|dikodkan]] ke media sekunder menggunakan pendengaran, visual, atau perangsang [[stimulus (fisiologi)|stimuli]] &nbsp; contohnya, dalam bahasa [[bahasa bersiul|bersiul]], [[bahasa isyarat]], atau [[braille]]. Ini kerana bahasa manusia [[Modaliti (semiotika)|modaliti]] - bebas. Bergantung kepada [[falsafah bahasa|perspektif falsafah]] mengenai definisi bahasa dan makna, apabila digunakan sebagai konsep umum, "bahasa" boleh merujuk keupayaan [[kognitif]] untuk belajar dan menggunakan sistem komunikasi yang rumit, atau untuk menggambarkan set peraturan yang membentuk sistem ini, atau set ucapan yang boleh dihasilkan daripada peraturan tersebut. Semua bahasa bergantung pada proses [[semiosis]] untuk mengaitkan [[Tanda (linguistik)|tanda-tanda]] kepada [[Makna (linguistik)|maksud tertentu]]. [[Bahasa lisan]], [[bahasa isyarat]] dan bahasa sentuhan mengandungi sistem [[fonologi|fonologi]] yang mengawal bagaimana simbol digunakan untuk membentuk urutan yang dikenali sebagai perkataan atau [[morfem]], dan sistem [[sintaksis]] yang mentadbir bagaimana perkataan dan morfem digabungkan untuk membentuk frasa dan wacana.
== Nama-nama bahasa ==
 
Bahasa manusia mempunyai sifat-sifat [[Produktiviti (linguistik)|produktiviti]] dan [[Pemindahan (linguistik)|pemindahan]], dan bergantung sepenuhnya pada konvensyen dan pembelajaran sosial. Strukturnya yang kompleks memberikan pelbagai ekspresi yang lebih luas daripada sistem komunikasi haiwan yang diketahui. Bahasa dianggap berasal dari awal [[hominin]] bermula secara beransur-ansur mengubah sistem komunikasi primata mereka, memperoleh keupayaan untuk membentuk [[Teori minda|teori minda lain]] dan kesengajaan dikongsi.<ref>{{harvcoltxt|Tomasello|1996}}</ref><ref name="Hauser 2002">{{harvcoltxt|Hauser|Chomsky|Fitch|2002}}</ref> Perkembangan ini kadang-kadang difikirkan telah bertepatan dengan peningkatan jumlah otak, dan banyak ahli bahasa melihat struktur bahasa sebagai berkembang untuk melayani fungsi komunikatif dan sosial tertentu. Bahasa diproses di banyak lokasi yang berlainan di dalam otak manusia, tetapi terutamanya di kawasan Broca dan kawasan Wernicke. Manusia [[bahasa pemerolehan bahasa|memperoleh]] melalui interaksi sosial pada zaman kanak-kanak, dan kanak-kanak biasanya bercakap dengan lancar dengan kira-kira tiga tahun. Penggunaan bahasa sangat berakar dalam budaya [[manusia]]. Oleh itu, sebagai tambahan kepada penggunaannya secara tegas, bahasa juga mempunyai banyak kegunaan sosial dan budaya, seperti menandakan kumpulan [[Identiti (sains sosial)|identiti]], [[stratifikasi sosial]], serta [[dandanan sosial]] dan [[hiburan]].
* [[Bahasa Tamil]] adalah தமிழ் மொழி ( ''Tamil bhāṣa'' )
* [[Bahasa Telugu]] adalah bahasa Tiếng Việt (తెలుగు భాష ( ''Tĕlugu bhāṣa'' )
* [[Bahasa Kannada]] adalah ಕನ್ನಡ ಭಾಷೆ ( ''Kannaḍa bhāṣĕ'' )
* [[Bahasa Malayalam]] adalah മലയാള ഭാഷ ( ''Malayāḷaṁ bhāṣa'' )
* [[Bahasa Hindi]] adalah हिन्दी भाषा ( ''Hindī bhāṣā'' )
* [[Bahasa Gujarat|Bahasa Gujarati]] adalah ગુજરાતી ભાષા ( ''Gujarātī bhāṣā'' )
* Bahasa Odia adalah ଓଡ଼ିଆ ''ଭାଷା'' ( ''Or̤iā bhāṣā'' )
* [[Bahasa Assam]] adalah অসমীয়া ভাষা ( ''Axomiya bhaxa'' )
* [[Bahasa Benggali|Bahasa Bengali]] adalah বাংলা ভাষা ( ''Bāṃlā bhāṣā'' )
* [[Bahasa Punjabi]] adalah ਪੰਜਾਬੀ ਭਾਸ਼ਾ ( ''Pajābī bhāśā'' )
* Bahasa Nepal adalah नेपाली भाषा ( ''Nepālī bhaṣa'' )
* [[Bahasa Nepal Bhasa]] adalah नेपाल भाषा ( ''Nepal bhaṣa'' )
* [[Bahasa Burma]] adalah ''Myanma bhasa'' ( {{Lang-my|မြန်မာဘာသာ}} )
* [[Bahasa Khmer]] adalah ''phiesa Khmae'' ( Khmer )
* [[Bahasa Lao]] adalah ''phasa Lao'' ( Lao )
* [[Bahasa Thai]] adalah ''phasa Thai'' ( Bahasa Thai )
* Bahasa Sinhala adalah ''Siŋhala bhāṣāva'' ( Sinhala සිංහල )
* [[Bahasa Melayu]] adalah ''bahasa Melayu'' ( Malay )
** [[Bahasa Malaysia]] adalah ''bahasa Malaysia''
** [[Bahasa Indonesia]] adalah ''bahasa Indonesia''
* [[Bahasa Minangkabau]] adalah bahasa ''Minangkabau'' ( Minangkabau )
* [[Bahasa Aceh]] adalah ''bahsa Aceh'' ( Aceh )
* [[Bahasa Jawa]] adalah ''basa Jawa'', juga ''basa Jawi'' ( Jawa )
* [[Bahasa Sunda]] adalah ''bahasa Sunda'' (Bahasa Sunda )
* [[Bahasa Bali]] adalah ''basa Bali'' ( Bali )
* [[Bahasa Bugis|Bahasa Buginese]] ialah ''Basa Ugi'' ( Bugis )
* [[Bahasa Suluk|Bahasa Tausug]] adalah Bahasa ''Sūg''
 
Perubahan bahasa [[perubahan bahasa|berkembang]] dan mempelbagai dari masa ke masa, dan sejarah evolusi mereka boleh [[sejarah linguistik|dibina semula]] oleh bahasa [[Perbandingan kaedah (linguistik)|membandingkan]] bahasa moden untuk menentukan ciri-ciri nenek moyang mereka bahasa mestilah mempunyai supaya peringkat perkembangan kemudiannya berlaku. Sekumpulan bahasa yang berasal dari nenek moyang yang sama dikenali sebagai [[keluarga bahasa]]. [[Bahasa-bahasa Indo-Eropah|Keluarga Indo-Eropah]] adalah bahasa yang paling banyak digunakan dan termasuk bahasa yang pelbagai seperti [[bahasa Inggeris|bahasa Inggeris]], [[bahasa Rusia|Rusia]] dan [[bahasa Hindi|Hindi]]; [[bahasa-bahasa Sino-Tibet|keluarga Sino-Tibet]] termasuk [[bahasa Mandarin|Mandarin]], [[bahasa Bodo|Bodo]] dan [[bahasa Cina]] yang lain, dan [[bahasa Tibet]]; [[bahasa-bahasa Afro-Asia|keluarga Afro-Asia]] termasuk [[bahasa Arab|Arab]], [[bahasa Somali|Somali]], dan [[bahasa Ibrani|Ibrani]]; bahasa [[bahasa Bantu]] termasuk [[bahasa Swahili|Swahili]], dan [[bahasa Zulu|Zulu]], dan ratusan bahasa lain yang dituturkan di seluruh Afrika; dan [[Rumpun Bahasa Melayu-Polinesia|rumpun bahasa Melayu-Polinesia]] termasuk [[bahasa Indonesia|bahasa Indonesia]], [[bahasa Melayu|Melayu]], [[bahasa Tagalog|Tagalog]], dan ratusan bahasa lain yang digunakan di seluruh [[Pasifik]]. Bahasa-bahasa dari bahasa [[bahasa-bahasa Dravidia|keluarga Dravidia]], yang kebanyakannya ditutur di India Selatan, termasuk [[bahasa Tamil|Tamil]] [[Bahasa Telugu|Telugu]] dan [[bahasa Kannada|Kannada]]. Konsensus akademik berpendapat bahawa antara 50% dan 90% bahasa yang dituturkan pada awal abad ke-21 mungkin akan menjadi [[kepupusan bahasa|pupus]] pada tahun 2100.
== Penggunaan ==
Perkataan "Bahasa" dalam Bahasa Inggeris kadangkala digunakan untuk merujuk secara khusus kepada [[bahasa Melayu]] (terutama variati [[Bahasa Melayu|bahasa]] [[Bahasa Indonesia|Indonesianya]]), biasanya oleh ekspatriat Barat dan rakan-rakan Malaysia dan Indonesia mereka yang berbahasa Inggeris. Penggunaan ini berasal dari penjajah, tidak pernah menjadi popular dalam kalangan ahli bahasa dan dianggap salah oleh sesetengah orang. <ref>[https://web.archive.org/web/20050508115242/http://www.hawaii.edu/indolang/malay.html "Bahasa Indonesia: The Indonesian Language," George Quinn, Australian National University]</ref> Apabila penutur dari Malaysia atau Indonesia merujuk kepada bahasa lain, perkataan "bahasa" yang tidak berhuruf besar digunakan; contohnya, bahasa Inggeris dipanggil ''bahasa Inggeris,'' manakala bahasa Itali dipanggil ''bahasa Italia.''
 
Manusia telah cuba untuk mentakrifkan '''bahasa''' daripada beberapa segi. Contoh takrifan termasuk yang berikut:
== Lihat juga ==
 
# satu sistem untuk mewakili benda, tindakan, idea dan keadaan.
* Basa (nyahkekaburan) #Bahasa
# satu peralatan yang digunakan untuk menyampaikan konsep realiti mereka kepada fikiran orang lain
# satu sistem maksud yang dikongsikan antara mereka
# satu kod yang digunakan oleh pakar linguistik untuk membezakan antara bentuk dan maksud.
# satu ucapan yang menepati tata bahasa yang telah ditetapkan (contoh :- Perkataan , ayat, dan lain lain.)
# satu penuturan yang akan dapat difahami oleh masyarakat linguistik.
# pemikiran
 
Walau bagaimanapun, bahasa manusia merupakan erti utama yang dikaitkan dengan "bahasa". Pengkajian tentang bahasa dipanggil [[linguistik|linguistik, atau pakar bahasa]].
== Rujukan ==
 
{{Reflist}}
== Bahasa Manusia ==
 
Menetapkan perbezaan utama antara satu bahasa manusia dan yang lain seringkali amat sukar. [[Noam Chomsky|Chomsky]] (1986) membuktikan bahawa sebahagian loghat [[Jerman]] adalah sangat hampir dengan loghat yang dikenali sebagai [[Belanda]] dan tidaklah terlalu berbeza sehingga tidak difahami langsung dengan bahasa yang lain yang dikenali sebagai [[Jerman]].
 
Sesetengah suka mengaitkan bahasa dengan biologi, di mana tiada cara yang tepat untuk membezakan antara satu spesies dengan spesies yang lain. Namun, perkara yang paling sukar mungkin datang daripada interaksi antara bahasa dan populasi dengan perubahan (''modification'')
 
=== Linguistik ===
 
'' Untuk rencana lanjutan, lihat [[Linguistik]]''
 
 
Linguistik mengkaji perspektif teori yang berbeza dalam bahasa manusia secara mendalam. Rencana mengenai Linguistik adalah rencana pengenalan yang berguna tentang bahasa.
 
=== Taksonomi Bahasa ===
 
'' Untuk rencana lanjutan, lihat [[keluarga bahasa]]''
 
Bahasa di dunia telah dibahagikan kepada beberapa keluarga atau kumpulan bahasa yang mempunyai persamaan. Kumpulan utama ialah [[Bahasa Indo-Eropah]], [[Bahasa Afro-Asiatik]], dan [[Bahasa Sino-Tibetan]].
 
=== Bahasa Buatan ===
 
''Untuk lanjutan, lihat [[Bahasa Buatan]]''
 
 
Satu daripada bahasa buatan dipanggil [[Esperanto]] telah dicipta oleh [[L. L. Zamenhof]]. Ia merupakan satu penyusunan dari pelbagai elemen daripada bahasa berlainan dengan matlamat untuk memudahkan belajar bahasa.
 
Sebahagian pakar bahasa, seperti J.R.R. Tolkien, telah mencipta bahasa dongeng, selalu untuk tujuan kesusasteraan. Satu daripada bahasanya dipanggil [[Quenya]], satu bentuk Elvish. [[Quenya]] mempunyai abjad dan sebutan tersendiri dan dapat dipertuturkan oleh manusia.
 
Bahasa manusia yang berbeza-beza menyebabkan manusia cuba untuk menyelesaikannya dengan pelbagai cara. Salah satu caranya adalah dengan menggunakan komputer untuk menterjemah daripada satu bahasa kepada bahasa yang lain. Aturcara sedemikian dikenali sebagai [[Terjemahan Mesin]].
 
[[Terjemahan Mesin]] merupakan satu matlamat pakar komputer sejak awal lagi. Pada mulanya mereka menjangkakan bahawa ia dapat dilakukan dengan mudah tetapi malangnya matlamat ini lebih sukar dilaksanakan sehinggakan pada suatu masa hampir kesemua pakar komputer telah berputus asa untuk melakukannya. Bagaimanapun, pada masa sekarang beberapa aturcara [[penterjemah]] telah dijual secara komersial.
 
== Bahasa Haiwan Bukan-Manusia ==
 
''Untuk rencana lanjutan, lihat [[Bahasa Haiwan|Bahasa Haiwan Bukan-Manusia]]''
 
 
Walaupun istilah '''Bahasa Haiwan Bukan-Manusia''' digunakan, banyak pengkaji bersetuju bahawa bahasa haiwan tidaklah serumit bahasa manusia. Sesetengah pengkaji berpendapat terdapat perbezaan ketara antara bahasa haiwan dan manusia yang menyebabkan perhubungan antara kedua kumpulan ini sukar dilakukan.
 
 
Pengkaji yang lain pula berpendapat satu kesinambungan (''continuum'') wujud antara kaedah komunikasi semua haiwan. Hampir semua pengkaji bersetuju bahasa manusia jauh lebih kompleks daripada bahasa haiwan.
 
<!--'''Bahasa''' adalah kapasitas khusus yang ada pada [[manusia]] untuk memperoleh dan menggunakan sistem [[komunikasi]] yang kompleks, dan '''sebuah bahasa''' adalah contoh spesifik dari sistem tersebut.
Kajian ilmiah terhadap bahasa disebut dengan [[linguistik]].
Semua perkiraan tentang jumlah pasti dari bahasa di dunia bergantung kepada suatu perbedaan yang berubah-ubah antara bahasa dan [[dialek]].
Namun, perkiraan beragam antara sekitar 6.000-7.000 bahasa.
[[Bahasa alami]] adalah [[bicara]] atau [[bahasa isyarat]], tapi setiap bahasa dapat di[[sandi]]kan ke dalam media kedua menggunakan auditori, visual atau taktil [[stimulus (fisiologi)|stimuli]], sebagai contoh dalam [[bahasa tulis|tulisan grafis]], [[braille]], atau [[bahasa siul|siulan]].
Hal ini karena bahasa manusia adalah modalitas-independen.
Bila digunakan sebagai konsep umum, "bahasa" bisa mengacu pada kemampuan [[kognitif]] untuk dapat belajar dan menggunakan sistem komunikasi yang kompleks, atau untuk menjelaskan sekumpulan aturan yang membentuk sistem tersebut, atau sekumpulan pengucapan yang dapat dihasilkan dari aturan-aturan tersebut.
 
Bahasa manusia adalah unik karena memiliki properti-properti [[Produktivitas (linguistik)|produktivitas]], [[rekursif]], dan [[Pergeseran (linguistik)|pergeseran]], karena ia bergantung sepenuhnya kepada konvensi dan pembelajaran sosial.
Strukturnya yang kompleks membuat penggunaan bahasa dan menghasilkan kemungkinan ekspresi yang lebih luas daripada sistem [[komunikasi hewan]] lainnya.
Bahasa dikatakan berasal sejak [[hominin]] awal mulai secara bertahap merubah sistem komunikasi primata mereka, memperoleh kemampuan untuk membentuk suatu [[teori pikiran]] dan berbagi secara sengaja.
 
Perkembangannya terkadang dikatakan bersamaan dengan meningkatnya volume otak, dan banyak ahli bahasa melihat struktur bahasa telah berkembang untuk melayani fungsi komunikatif dan sosial tertentu.
Bahasa diproses pada banyak lokasi yang berbeda pada [[otak manusia]], tapi terutama di [[area Broca]] dan [[area Wernicke]].
Manusia [[Akuisisi bahasa|mengakuisisi]] bahasa lewat interaksi sosial pada masa balita, dan anak-anak sudah dapat berbicara secara fasih sekitar umur tiga tahun.
Penggunaan bahasa telah berakar dalam [[kultur]] manusia.
Oleh karena itu, selain digunakan untuk berkomunikasi, bahasa juga memiliki banyak fungsi sosial dan kultural, seperti untuk menandakan [[Identitas (ilmu sosial)|identitas]] suatu kelompok, [[stratifikasi sosial]], dan untuk [[dandanan sosial]] dan [[hiburan]].
 
Semua bahasa bergantung pada proses [[semiosis]] untuk menghubungkan [[Isyarat (lingyistik)|isyarat]] dengan [[Makna (linguistik)|makna]] tertentu.
[[Bahasa oral]] dan [[Bahasa isyarat]] memiliki sebuah sistem [[fonologi]]s yang mengatur bagaimana simbol digunakan untuk membentuk urutan yang dikenal sebagai kata atau [[morfem]], dan suatu sistem [[sintaks]] yang mengatur bagaimana kata-katan dan [[morfem]] digabungkan untuk membentuk frasa dan penyebutan.
 
Bahasa-bahasa [[perubahan bahasa|berubah]] dan bervariasi sepanjang waktu, dan sejarah evolusinya dapat direkonstruksi ulang dengan [[Historikal Linguistik|membandingkan]] bahasa modern untuk menentukan sifat-sifat mana yang harus dimiliki oleh bahasa leluhurnya supaya perubahan nantinya dapat terjadi.
Sekelompok bahasa yang diturunkan dari leluhur yang sama dikenal sebagai [[rumpun bahasa]].
Bahasa yang digunakan dunia sekarang tergolong pada [[bahasa Indo-Eropa|keluarga Indo-Eropa]], yang mengikutkan bahasa seperti [[bahasa Inggris|Inggris]], [[bahasa Spanyol|Spanyol]], [[bahasa Portugis|Portugis]], [[bahasa Rusia|Rusia]] dan [[bahasa Hindi|Hindi]]; [[Bahasa Sino-Tibet]], yang melingkupi [[Bahasa Mandarin]], [[Cantonese]] dan lainnya; [[bahasa Semitik]], yang melingkupi [[bahasa Arab|Arab]], [[Bahasa Amhar|Amhar]] dan [[bahasa Hebrew|Hebrew]]; dan [[bahasa Bantu]], yang melingkupi [[bahasa Swahili|Swahili]], [[bahasa Zulu|Zulu]], [[Bahasa Shona|Shona]] dan ratusan bahasa lain yang digunakan di [[Afrika]].
Konsensus umum adalah antara 50% sampai 90% bahasa yang digunakan sekarang kemungkinan akan punah pada tahun 2100.<ref name="Handbook">
{{harvcoltxt
|Austin
|Sallabank
|2011
|
}}</ref>
<ref name="Moseley">
{{harvcoltxt
|Moseley
|2010
}}</ref>
 
== Definisi ==
 
{{main|Filsafat bahasa}}
 
Kata bahasa Inggris "language" diturunkan dari [[Indo-Eropa]] ''{ipa|dn̥ǵʰwéh₂s}}'' "lidah, perkataan, bahasa" lewat [[Bahasa latin]] ''lingua'', "bahasa, lidah", dan [[Prancis Tua]] ''langage'' "bahasa".<ref name=AHD>
{{cite encyclopedia
|title=language
|encyclopedia=The American Heritage Dictionary of the English Language
|edition=3rd
|year=1992
|location=Boston
|publisher=Houghton Mifflin Company
}}</ref>
Kata tersebut terkadang digunakan untuk mengacu pada [[kode]], [[sandi]] dan bentuk lain dari [[bahasa buatan|sistem komunikasi yang dibentuk secara artifisial]] seperti yang digunakan pada [[bahasa pemrograman|pemrograman komputer]].
Makna bahasa dalam hal ini adalah suatu [[sistem]] dari [[Isyarat (linguistik)|isyarat]] untuk [[menyandikan]] dan menterjemahkan [[informasi]].
Artikel ini secara khusus tentang properti-properti dari [[bahasa alami|bahasa alami manusia]] sebagaimana yang dipelajari dalam disiplin ilmu [[linguistik]].
 
Sebagai objek dari ilmu linguistik "bahasa" memiliki dua makna dasar: bahasa sebagai konsep abstrak, dan "sebuah bahasa" (sebuah sistem linguistik spesifik, contohnya "[[bahasa Prancis]]"). Linguis dari Swiss [[Ferdinand de Saussure]], yang mendefinisikan ilmu modern dari linguistik, pertama kali dengan jelas memformulasikan perbedaannya, menggunakan kata Prancis ''langage'' untuk bahasa sebagai sebuah konsep dan ''[[langue dan parol|langue]]'' sebagai suatu instansi spesifik dari sebuah sistem bahasa, dan ''parole'' untuk penggunaan konkret dari perkataan dalam suatu bahasa tertentu.<ref name="Lyons2">
{{Harvcoltxt
|Lyons
|1981
|p=2
}}</ref>
 
Bila berbicara mengenai bahasa sebagai konsep umum, beberapa definisi berbeda dapat digunakan yang menekankan aspek yang berbeda dari fenomena tersebut.<ref name="LyonsIntro">
{{Harvcoltxt
|Lyons
|1981
|pp=1–8
}}</ref>
Definisi tersebut juga memerlukan pendekatan dan pemahaman berbeda tentang bahasa, dan mereka memberikan kajian teori linguistik yang berbeda dan terkadang bertentangan.<ref name="TraskLanguage">
{{harvcoltxt
|Trask
|2007
|pages=129–31
}}</ref>
 
=== Kemampuan mental, organ atau insting ===
 
Salah satu definisi melihat bahasa pada pokoknya sebagai [[pikiran|kemampuan mental]] yang membuat manusia dapat menggunakan perilaku linguistik: untuk belajar bahasa dan menghasilkan dan memahami penyebutan. Definisi ini menekankan keuniversalan bahasa untuk semua manusia dan dasar biologis dari kapasitas manusia terhadap bahasa sebagai perkembangan yang unik dari [[otak manusia]].
Pandangan bahwa dorongan untuk akuisisi bahasa adalah lahiriah pada manusia didukung oleh fakta bahwa semua anak yang normal secara kognitif dibesarkan di dalam suatu lingkungan di mana bahasa dapat diakses akan memperolah bahasa tanpa instruksi formal.
Bahasa bahkan secara spontan berkembang dalam lingkungan di mana orang hidup atau tumbuh bersama tanpa suatu bahasa umum, sebagai contohnya dalam kasus [[bahasa kreol]], dan kasus perkembangan bahasa isyarat secara spontan seperti pada [[Bahasa Isyarat Nikaragua]].
Pandangan ini yang dapat dilihat sebagai sebuah pandangan terhadap bahasa masa lalu oleh [[Immanuel Kant|Kant]] dan [[Rene Descartes|Descartes]] sering memahami bahasa secara garis besar merupakan [[innasisme|bawaan lahir]], sebagai contoh dalam teori [[Tata bahasa universal]] dari [[Noam Chomsky|Chomsky]], atau teori ekstrim lahiriah dari seorang filsuf Amerika [[Jerry Fodor]].
Definisi semacam ini sering diaplikasikan oleh orang yang mempelajari bahasa lewat kerangka [[ilmu kognitif]] dan dalam [[neurolinguistik]].
<ref>
{{harvcoltxt
|Hauser
|Fitch
|2003
}}</ref>
<ref name="Language Instinct">
{{harvcoltxt
|Pinker
|1994
}}</ref>
 
=== Sistem simbolik formal ===
 
Definisi lain melihat bahasa sebagai sebuah sistem formal dari isyarat-isyarat yang diatur oleh aturan-aturan kombinasi tata-bahasa untuk mengkomunikasikan suatu makna.
Definisi ini menekankan fakta bahwa bahasa manusia dapat dijelaskan sebagai [[linguistik struktural|sistem terstruktur]] tertutup yang terdiri dari aturan-aturan yang menghubungkan isyarat tertentu terhadap makna tertentu. Pandangan [[strukturalisme|strukturalis]] terhadap bahasa pertama kali diperkenalkan oleh [[Ferdinand de Saussure]] <ref name="Saussure">
{{harvcoltxt
|Saussure
|Harris
|1983
}}</ref>
, dan strukturalisme-nya tetap menjadi fondasi terhadap hampir semua pendekatan terhadap bahasa pada masa sekarang.<ref>{{harvcoltxt
|Campbell
|2001
|p=96
}}</ref>
 
Beberapa pendukung pandangan bahasa ini telah menyarankan sebuah pendekatan formal yang mempelajari struktur bahasa dengan mengidentifikasi elemen-elemen dasarnya dan kemudian memformulasikan penjelasan formal dari aturan-aturannya berdasarkan pada elemen-elemen mana yang digabungkan untuk membentuk kata-kata dan kalimat.
Pendukung utama dari teori tersebut yaitu [[Noam Chomsky]], pencetus [[linguistik generatif|teori generatif tata-bahasa]], yang telah mendefinisikan bahasa sebagai sebuah kumpulan kalimat yang dapat dihasilkan dari sekumpulan aturan tertentu.
Chomsky menganggap aturan-aturan tersebut merupakan suatu fitur lahiriah dari otak manusia, dan untuk membentuk esensi dari bahasa itu sendiri.<ref>{{harvcoltxt|Chomsky|1957}}</ref>
Definisi formal dari bahasa umumnya digunakan dalam [[logika formal]], dan dalam [[tata-bahasa formal|formal]] [[linguistik teoretis|teori-teori tata-bahasa]] dan dalam penerapan [[linguistik komputasi]].<ref>
{{Harvcoltxt
|Trask
|2007
|pp=93, 130
}}</ref>
<ref name="NewmeyerForm">
{{harvcoltxt
|Newmeyer
|1998
|pp=3–6
}}</ref>
 
=== Alat untuk komunikasi ===
 
[[File:ASL family.jpg|right|250px|thumb|Dua pria dan seorang wanita sedang bercakap-cakap menggunakan [[Bahasa Isyarat Amerika]].]]
 
Definisi lain dari bahasa adalah sebagai sebuah sistem komunikasi yang membuat manusia dapat bekerja sama. Definisi ini menekankan fungsi sosial dari bahasa dan fakta bahwa manusia menggunakannya untuk mengekspresikan dirinya sendiri dan untuk memanipulasi objek dalam lingkungannya.
[[Teori fungsional tata bahasa]] menjelaskan struktur tata-bahasa lewat fungsi komunikatifnya, dan memahami struktur tata-bahasa dari bahasa sebagai hasil dari proses adaptif dimana tata-bahasa telah "disesuaikan" untuk melayani kebutuhan komunikatif penggunanya.<ref name="Myths"/>
<ref>
{{harvcoltxt
|Van Valin
|2001}}
</ref>
 
Pandangan terhadap bahasa ini berhubungan dengan kajian bahasa dalam kerangka [[pragmatis]], [[linguistik kognitif|kognitif]], dan kerangka interaksional, serta dalam [[sosial-linguistik]] dan [[linguistik antropologi]].
Teori-teori fungsionalis condong mempelajari tata-bahasa sebagai sebuah fenomena dinamis, sebagai suatu struktur yang selalu dalam proses perubahan saat mereka digunakan oleh para pembicaranya.
Pandangan ini menyebabkan kajian [[linguistik tipologi]] menjadi penting, klasifikasi dari bahasa-bahasa menurut fitur strukturalnya, karena ia dapat memperlihatkan bahwa proses-proses dari [[gramatikalisasi]] condong mengikuti lintasan yang sebagian bergantung bergantung pada tipologi.
Dalam filsafat bahasa pandangan ini sering dikaitkan dengan karya terakhir [[Ludwig Wittgenstein|Wittgenstein]] dan dengan filsuf bahasa umum seperti [[G. E. Moore]], [[Paul Grice]], [[John Searle]] dan [[J. L. Austin]].<ref name="NewmeyerForm"/>
 
=== Apa yang membuat bahasa manusia unik ===
 
{{main|Bahasa hewan|Bahasa kera besar}}
 
Bahasa manusia unik bila dibandingkan dengan bentuk lain komunikasi, seperti yang digunakan oleh [[komunikasi hewan|hewan]] selain-manusia.
Sistem-sistem komunikasi yang digunakan oleh hewan-hewan lain seperti [[Komunikasi dan pembelajaran lebah|lebah]] atau [[bahasa kera besar|kera]] selain-manusia adalah sistem tertutup yang terdiri dari sejumlah kemungkinan terbatas yang dapat diekspresikan.<ref>{{harvcoltxt|Hockett|1960}}; {{harvcoltxt|Deacon|1997}}</ref>
 
Sebaliknya bahasa manusia adalah tanpa-tutup dan [[Produktivitas (lingustik)|produktif]], yang berarti membolehkan manusia untuk menghasilkan sekumpulan pengucapan tak terbatas dari sekumpulan elemen terbatas, dan untuk membuat kata-kata dan kalimat baru.
Hal ini dapat kita lakukan karena bahasa manusia didasarkan pada suatu kode ganda, di mana sejumlah elemen-elemen tanpa arti yang terbatas (seperti suara, huruf atau isyarat) dapat digabungkan untuk membentuk unit-unit makna (kata-kata atau kalimat). <ref name="Trask5">{{harvcoltxt|Trask|1999|pages=1–5}}</ref>
Lebih lanjut simbol-simbol dan aturan tata-bahasa dari setiap bahasa tertentu pada umumnya berubah-ubah, yang berarti bahwa sistem tersebut hanya dapat dipelajari lewat interaksi sosial.<ref>{{harvcoltxt|Trask|1999|p=9}}</ref>
Sistem komunikasi yang diketahui yang digunakan pada hewan, pada sisi lain, hanya dapat mengekspresikan sejumlah pengucapan yang pada umumnya berpindah secara genetis.<ref name="Tomasello 2008">{{harvcoltxt|Tomasello|2008}}</ref>
 
Beberapa spesies hewan telah dibuktikan mampu memperoleh bentuk-bentuk komunikasi lewat pembelajaran sosial, seperti [[Bonobo]] [[Kanzi]] yang belajar mengekspresikan dirinya sendiri menggunakan sekumpulan [[leksigram]] simbolis.
Demikian juga banyak spesies burung dan paus mempelajari suara-suara mereka dengan meniru anggota lain dari spesies mereka.
Namun walau beberapa hewan bisa memperoleh sejumlah kata-kata dan simbol,<ref>
[[Koko (gorila)|Koko]] si gorila dilaporkan menggunakan sebanyak 1000 kata dalam bentuk [[Bahasa Isyarat Amerika]], dan memahami sebanyak 2000 kata dalam bahasa Inggris.
Ada beberapa keraguan tentang apakah dia menggunakan isyarat berdasarkan pemahaman yang kompleks atau hanya karena [[Kondisi operan]].
</ref>
tidak ada yang bisa mempelajari lebih banyak isyarat-isyarat yang berbeda yang secara umum diketahui oleh seorang manusia berumur rata-rata empat tahun, tidak juga ada yang mampu memperoleh sesuatu yang menyerupai tata-bahasa kompleks seperti pada bahasa manusia.<ref name="Deacon 1997">{{harvcoltxt|Deacon|1997}}</ref>
 
Bahasa manusia juga berbeda dengan sistem komunikasi hewan di mana mereka menggunakan [[kategori tata bahasa|kategori tata-bahasa dan semantik]] seperti kata benda dan kata kerja, atau masa sekarang dan masa lampu, untuk mengekspresikan makna-makna yang sangat kompleks.<ref name="Deacon 1997"/>
Bahasa manusia juga unik karena memiliki properti [[Rekursi#Rekursi dalam bahasa|rekursif]]; ini adalah suatu cara di mana, sebagai contohnya, frasa kata benda bisa mengandung frasa kata benda lainnya (seperti pada ''"<nowiki>bibir [[simpanse]]</nowiki>''") atau suatu klausa mengandung klausa (seperti pada ''"<nowiki>[Saya melihat [[anjing itu sedang lari]]</nowiki>"'').<ref>{{harvcoltxt|Hauser|Chomsky|Fitch|2002}}</ref>
Bahasa manusia juga satu-satunya sistem komunikasi alami yang diketahui yang ''bebas modalitas'', yang berarti bahwa bahasa manusia dapat digunakan tidak hanya untuk komunikasi lewat satu kanal atau media, tapi lewat beberapa - sebagai contohnya bahasa ucapan menggunakan modalitas pendengaran, sedangkan [[bahasa isyarat]] dan tulisan menggunakan modalitas visual dan tulisan [[braille]] menggunakan modalitas peraba.
<ref>{{harvcoltxt|Trask|2007|pp=165–66}}</ref>
 
Berkaitan dengan makna yang akan disampaikan dan operasi-operasi kognitif yang dibentuk darinya, bahasa manusia juga unik dalam hal mampu mengacu pada konsep abstrak dan berimajinasi atau kejadian-kejadian hipotesis, sebagaimana halnya kejadian-kejadian yang terjadi pada masa lalu atau yang mungkin terjadi di masa depan.
Kemampuan untuk mengacu pada kejadian yang tidak terjadi pada waktu atau tempat yang sama pada saat diucapkan disebut dengan ''[[Pergeseran (linguistik)|pergeseran]]'', dan bila beberapa sistem komunikasi hewan dapat menggunakan pergeseran (seperti komunikasi pada [[lebah]] yang dapat mengkomunikasikan lokasi dari sumber nektar yang di luar jangkauan pandangan), tingkaant di mana hal tersebut digunakan dalam bahasa manusia juga dianggap unik.<ref name="Trask5"/>
 
== Asal mula ==
 
[[Image:BBC-artefacts.jpg|thumb|Artifak berusia 75-80,000 tahun dari [[Gua Blombos]], [[Afrika selatan]] termasuk sebuah okre yang diukir dengan pola garis-silang diagonal, mungkin contoh simbol tertua yang diketahui.]]
 
{{Main|Asal mula bahasa}}
 
{{multiple image
| align = right
| direction = vertical
| width = 220
| image1 = BBC-artefacts.jpg
| caption1 = artifak berusia 75-80.000 tahun dari [[Gua Blombos]], [[Afrika Selatan]] termasuk bagian okre diukir dengan pola diagonal lintang-palka, kemungkinan simbol tertua yang diketahui.
|image2 =Pieter Bruegel the Elder - The Tower of Babel (Vienna) - Google Art Project - edited.jpg
|caption2 ="[[Menara Babel]]" oleh [[Pieter Bruegel the Elder]]. Cat minyak, tahun 1563.<br>Manusia telah berspekulasi tentang asal mula bahasa selama sejarah. [[Mitologi Kristen|mitos alkitab]] dari [[Menara Babel]] adalah salah satu catatan tersebut, kultur-kultur lain memiliki cerita-cerita tentang bagaimana bahasa muncul.<ref name="Haugen"/>
}}
 
Teori-teori tentang asal mula bahasa dapat dibagi berdasarkan asumsi dasarnya.
Beberapa teori berdasarkan pada ide bahwa bahasa adalah sangat kompleks sehingga seseorang tidak dapat membayangkan ia muncul dari ketiadaan dalam bentuk akhirnya, tapi ia harus telah berkembang dari sistem pra-linguistik awal di antara leluhur pra-manusia kita.
Teori ini dapat disebut dengan teori berdasarkan keberlanjutan.
Pandangan berlawanan adalah bahwa bahasa adalah sifat manusia yang unik yang tidak dapat dibandingkan dengan apapun yang ditemukan di antara selain-manusia dan bahwa ia makanya muncul secara tiba-tiba dalam transisi dari pra-hominid sampai pada manusia purba.
Teori ini dapat didefinisikan sebagai berdasarkan ketakberlanjutan.
Demikian juga, beberapa teori melihat bahasa umumnya sebagai kemampuan lahiriah yang tersandikan secara genetis, sementara yang lain melihatnya sebagai sebuah sistem yang besar secara kultural, yaitu dipelajari lewat interaksi sosial.<ref>{{harvcoltxt|Ulbaek|1998}}</ref>
 
Saat sekarang satu-satunya pendukung dari teori ketakberlanjutan pada asal mula bahasa manusia adalah linguis dan filsuf [[Noam Chomsky]].
Chomsky menyatakan bahwa 'beberapa mutasi random terjadi, mungkin setelah hujan cahaya kosmik aneh, dan menyebabkan reorganisasi pada otak, menanam sebuah organ bahasa dalam otak primata'.
Walau memperingatkan untuk tidak menangkap cerita tersebut terlalu harfiah, Chomsky bersikeras bahwa 'ia mungkin lebih mendekati kenyataan daripada dongeng lainnya yang mengatakan tentang proses-proses evolusioner, termasuk bahasa'.<ref>{{harvcoltxt|Chomsky|2000|p=4}}</ref>
 
Teori keberlanjutan sekarang dipegang oleh mayoritas pelajar, tapi mereka berbeda dalam melihat perkembangannya.
Mereka yang melihat bahasa sebagai bawaan lahir, sebagai contohnya [[Steven Pinker]], memegang preseden sebagai [[kognisi hewan]], <ref name="Language Instinct"/>
sementara mereka yang melihat bahasa sebagai alat komunikasi belajar sosial, seperti psikolog [[Michael Tomasello]], melihatnya berkembang dari [[komunikasi hewan]], baik isyarat primata atau komunikasi vokal untuk membantu dalam bekerja sama.<ref name="Tomasello 2008"/>
Model berkelanjutan lainnya melihat bahasa berkembang dari [[musik]], sebuah pandangan yang telah didukung oleh [[Jean-Jacques Rousseau|Rousseau]], [[Johann Gottfried Herder|Herder]], [[Wilhelm von Humboldt|Humboldt]] dan [[Charles Darwin]].
Pendukung utama dari pandangan tersebut pada saat sekarang adalah arkeolog [[Steven Mithen]].<ref>{{harvcoltxt|Fitch|2010|pp=466–507}}</ref>
 
Karena timbulnya bahasa berada sebelum prasejarah manusia, perkembangan yang berkaitan tidak meninggalkan jejak sejarah dan tidak ada proses perbandingan yang dapat diobservasi pada saat sekarang. Teori yang menekankan keberlanjutan sering melihat pada binatang untuk melihat jika, misalnya, primata memperlihatkan ciri-ciri yang dapat dilihat sebagai analogi terhadap bentuk bahasa dari pra-manusia. Alternatif lain, fosil awal manusia dapat diinspeksi untuk melihat jejak-jejak adaptasi fisik dari penggunaan bahasa atau bentuk jejak-jejak pra-linguistik dari perilaku simbolik.
 
Secara umum tak terbantahkan bahwa pra-manusia [[australopithecine]] tidak memiliki sistem komunikasi yang secara signifikan berbeda dengan yang ditemukan pada [[kera besar]] secara umum, tetapi para ahli memiliki opini yang berbeda-beda terhadap perkembangan sejak munculnya ''[[Homo]]'' sekitar 2,5 juta tahun yang lalu. Beberapa ahli mengasumsikan perkembangan sistem mirip-bahasa primitif (proto-bahasa) sama awalnya dengan ''[[Homo habilis]]'' (2,3 juta tahun lalu), sementara ahli lainnya menempatkan perkembangan komunikasi simbol primitif hanya dengan ''[[Homo erectus]]'' (1,8 juta tahun yang lalu) atau ''[[Homo heidelbergensis]]'' (0,6 juta tahun yang lalu) dan perkembangan bahasa layak pada ''[[Manusia modern anatomis|Homo sapiens modern anatomis]]'' dengan ''[[perilaku modernitas|revolusi Paleolitik Atas]] kurang dari 100.000 tahun lalu.
<ref>{{harvcoltxt|Foley|1997|pp=70–74}}</ref>
<ref>{{harvcoltxt|Fitch|2010|pp=292–3}}</ref>
 
== Kajian bahasa ==
{{main|Linguistik|Sejarah dari linguistik}}
 
{{multiple image
| align = right
| direction = vertical
| width = 170
| image1 = Sir William Jones.jpg
| caption1 = William Jones menemukan relasi antara [[Latin]] dan [[Sanskrit]], meletakan dasar bagi disiplin dari [[Sejarah linguistik]].
| image2 = Ferdinand de Saussure by Jullien.png
| caption2 = [[Ferdinand de Saussure]] mengembangkan pendekatan [[structuralisme|structuralis]] terhadap kajian bahasa.
| image3 = Noam chomsky cropped.jpg
| caption3 = [[Noam Chomsky]] adalah salah satu ahli teori linguistik terpenting pada abad 20.
}}
 
Kajian tentang bahasa, [[linguistik]], telah berkembang menjadi sains sejak deskripsi pertama tata-bahasa dari bahasa tertentu di [[India]] lebih dari 2000 tahun lalu. Linguistik sekarang adalah sebuah sains yang memperhatikan semua aspek yang berhubungan dengan bahasa, menelitinya dari semua sudut pandang yang telah dijelaskan di atas.
 
=== Sub-disiplin ===
 
Kajian akademis terhadap bahasa dilakukan dari banyak area disiplin dan dari sudut pandang teoritis yang berbeda, semuanya memberikan pendekatan modern terhadap linguistik.
Sebagai contoh, [[Deskriptif linguistik]] membedah tata-bahasa dari sebuah bahasa; [[teoritikal linguistik]] mengembangkan teori terbaik untuk mengkonsepkan bahasa sebagai sebuah kajian, berdasarkan pada data dari berbagai macam bahasa manusia yang masih ada; [[sociolinguistik]] mempelajari bagaimana bahasa digunakan untuk tujuan sosial memberikan kajian fungsi sosial dari bahasa dan deskripsi gramatikal; [[neurolinguistik]] mempelajari bagaimana bahasa diproses dalam otak manusia, dan melakukan percobaan mengenai teori tentang kemampuan bahasa; [[komputasi linguistik]] dibangun dari teori dan deskripsi linguistik untuk membangun model komputasi bahasa yang terkadang ditujukan untuk memproses bahasa alami, atau mencoba hipotesis linguistik; dan [[historikal linguistik]] bergantung pada tata-bahasa dan deskripsi lexical dari bahasa untuk menyelidiki sejarah tiap-taip bahasa dan membangun pohon rumpun-rumpun bahasa dengan menggunakan [[metoda komparatif]].
 
=== Sejarah awal ===
 
Kajian formal bahasa sering dianggap telah bermulai di [[India]] oleh [[Panini]], ahli tata-bahasa abad 5 SM yang memformulasikan 3.959 aturan dari [[morfologi (linguistik)|morfologi]] [[bahasa Sanskrit|Sanskrit]].
Namun penulis-penulis [[Sumeria]] telah mempelajari perbedaan antara tata-bahasa [[Bahasa sumeria]] dan [[Bahasa Akkadia]] sekitar 1900 SM.
Kemudian tradisi tata-bahasa berkembang pada semua kultur kuno yang mengadopsi tata tulis.<ref>{{harvcoltxt|Campbell|2001|pp=82–83}}</ref>
 
Pada abad ke-17 seorang [[Tata bahasa Port-Royal]] dari Prancis mengembangkan ide bahwa tata-bahasa dari semua bahasa merupakan sebuah refleksi dari dasar-dasar pemikiran universal, dan oleh karena itu tata-bahasa merupakan universal.
Pada abad ke-18, penggunaan pertama dari [[metoda komparatif]] oleh ahli [[filologi]] dan India kuno dari Inggris [[Willian Jones (filologis)|William Jones]] memicu tumbuhnya [[linguistik komparatif]].<ref>{{harvnb|Bloomfield|1914|p=310}}</ref>
Kajian ilmiah dari bahasa diperluas dari Indo-Eropa ke bahasa secara umum oleh [[Wilhelm von Humboldt]].
Pada awal abad 20, [[Ferdinand de Saussure]] memperkenalkan ide bahwa bahasa sebagai suatu sistem statik dari unit-unit yang saling berhubungan, didefinisikan lewat pertentangan antara mereka.<ref name="Saussure"/>
 
Dengan memperkenalkan perbedaan analisis bahasa antara [[Linguistik diakronik|diakronik]] dan [[Linguistik Sinkronik|sinkronik]], dia meletakkan fondasi dari disiplin ilmu linguistik modern.
Saussure juga memperkenalkan beberapa dimensi dasar dari analisis bahasa yang masih menjadi dasar dibanyak teori linguistik kontemporer, seperti perbedaan antara [[Analisis sintagmatis|sintagma]] dan [[Analisis paradigmatis|paradigma]], dan [[Langue dan parole|perbedaan Langue-parole]], membedakan bahasa sebagai suatu sistem abstrak (''Language''), dari bahasa sebagai suatu manifestasi konkrit dari sistem itu sendiri (''parole'').
<ref>{{harvcoltxt|Clarke|1990|pages=143–144}}</ref>
 
=== Linguistik kontemporer ===
 
Sekitar tahun 1960-an [[Noam Chomsky]] memformulasikan [[Linguistik generatif|teori generatif bahasa]].
Menurut teori tersebut bentuk paling dasar dari bahasa adalah suatu kumpulan aturan-aturan sintaks yang universal untuk semua manusia yang mendasari tata-bahasa dari semua bahasa manusia.
Kumpulan aturan tersebut disebut dengan [[Tata bahasa universal]], dan Chomsky menyebutnya sebagai tujuan utama dari disiplin ilmu linguistik.
Karena alasan tersebut tata-bahasa dari setiap bahasa hanya penting bagi linguistik, sejauh mereka membolehkan kita memahami aturan universal yang mendasari darimana keberagaman linguistik yang tampak dapat diturunkan.<ref>{{harvcoltxt|Foley|1997|pp=82–83}}</ref>
 
Sebagai lawan dari teori formal dari aliran generatif, [[Teori fungsional tata bahasa]] mengajukan bahwa sejak bahasa secara dasarnya adalah suatu alat, strukturnya lebih baik dianalisa dan dipahami dengan referensi terhadap fungsi-fungsi mereka.
Teori fungsional dari tata-bahasa berbeda dengan [[Tata bahasa formal|Teori formal tata-bahasa]], di mana yang terakhir mencari untuk mendefinisikan elemen-elemen berbeda dari bahasa dan menjelaskan bagaimana mereka berhubungan satu sama lain sebagai sistem aturan-aturan formal atau operasi-operasi, Teori Fungsional mencari untuk menentukan fungsi-fungsi yang dilakukan oleh bahasa dan kemudian menghubungkan fungsi-fungsi tersebut dengan elemen-elemen linguistik yang membawa mereka.
<ref name="NewmeyerForm"/>
<ref>
{{harvcoltxt
|Nichols
|1984}}
"''[Tata-bahasa fungsional] menganalisa struktur tata-bahasa, seperti halnya tata-bahasa formal dan struktural; tapi ia juga menganalisa keseluruhan situasi komunikatif: tujuan dari pembicaraan, pembicaranya, konteks diskursusnya.
Fungsionalis mempertahankan motif situasi komunikatif, batasan, penjelasan, atau sebaliknya menentukan struktur tata-bahasa, dan bahwa pendekatan struktural atau formal tidak hanya terbatas pada basis data yang secara artifisial membatasi, tapi ketidakcukupannya bahkan sebagai suatu catatan struktural.
Tata bahasa fungsional, maka, berbeda dari tata bahasa formal dan struktural di mana ia bermaksud tidak untuk memodelkan tapi untuk menjelaskan; dan penjelasannya didasarkan pada situasi komunikatif.''"
</ref>
Kerangka dari [[Linguistik kognitif]] menginterpretasikan bahasa dalam bentuk konsep, terkadang universal, terkadang khusus terhadap bahasa tertentu, yang bergantung kepada bentuknya.<ref>{{harvcoltxt|Croft|Cruse|2004|page=1}}</ref>
Linguistik kognitif secara utama lebih memperhatikan tentang bagaimana pikiran membuat makna lewat bahasa.
 
== Fisiologis dan arsitektur saraf dari bahasa dan bicara ==
 
Berbicara adalah modalitas dasar untuk bahasa di dalam semua kultur.
Produksi dari bahasa lisan bergantung pada kapasitas mutakhir untuk mengkontrol bibir, lidah dan komponen-komponen lain dari peralatan vokal, kemampuan untuk secara akustik menerjemahkan suara lisan, dan peralatan neurologis dibutuhkan untuk memperoleh dan menghasilkan bahasa. <ref>
{{harvcoltxt
|Trask
|1999
|pp=11–14; 105–113
}}</ref>
Kajian terhadap dasar genetis bagi bahasa manusia berada dalam tahap yang baru dimulai, dan satu-satunya gen yang telah secara positif mempengaruhi dalam produksi bahasa adalah [[FOXP2]], yang mana, jika dipengaruhi oleh mutasi, mungkin menyebabkan semacam [[Perkembangan dyspraxia|kelainan bahasa bawaan]].<ref>
{{harvcoltxt
|Fisher
|Lai
|Monaco
|2003
}}</ref>
 
=== Bahasa dan otak ===
 
{{main|Neurolinguistik}}
 
[[Image:Brain Surface Gyri.SVG|thumb|Area-area bahasa pada otak. [[Angular Gyrus]] direpresentasikan dalam warna oranye, [[Supramarginal Gyrus]] direpresentasikan dengan warna kuning, [[Area Broca]] direpresentasikan dengan warna biru, [[Area Wernicke]] direpresentasikan dalam warna hijau dan [[Primary Auditory Cortex]] direpresentasikan dalam warna merah jambu.]]
 
Otak adalah pusat koordinasi dari semua aktivitas linguistik: ia mengatur produksi kognisi linguistik dan pemaknaan dan mekanika dari produksi lisan.
Pengetahuan kita mengenai dasar neurologis untuk bahasa masih terbatas, meskipun telah dianggap berkembang lewat penggunaan tekni pencitraan modern.
Disiplin linguistik yang mendedikasikan untuk meneliti aspek-aspek neurologis dari bahasa disebut dengan [[neurolinguistik]].<ref name="Lesser205">{{harvcoltxt|Lesser|1989|pp=205–6}}</ref>
 
Penelitian awal dalam neurolinguistik mengikutkan penelitian bahasa terhadap orang dengan luka pada otak, untuk melihat bagaimana luka pada area tertentu mempengaruhi bahasa dan bicara.
Dengan cara ini para neurosaintis di abad 19 menemukan bahwa dua area dalam otak secara krusial mempengaruhi pemrosesan bahasa: [[area Wernicke]] yang berada di bagian belakang dari [[superior temporal gyrus]] di dalam belahan otak serebral dominan.
Orang dengan luka di area otak ini memiliki [[Aphasia reseptif]], suatu kondisi di mana terdapat kerusakan mayor terhadap komprehensi bahasa, sementara berbicara masih dengan ritme yang alami dan relatif normal [[sintaks|struktur kalimat]].
Area lainnya adalah [[area Broca]] yang berada di belakang [[inferior frontal gyrus]] dari belahan otak yang dominan.
Orang dengan luka pada area ini memiliki [[aphasia ekspresif]], yang berarti bahwa mereka "apa yang ingin mereka katakan, mereka hanya tidak dapat mengeluarkannya".<ref>{{harvcoltxt|Trask|1999|pp=105–7}}</ref>
Mereka umumnya mampu memahami apa yang dikatakan kepada mereka, tapi tidak mampu berbicara secara fasih.
Simtom-simtom lain yang mungkin ada pada aphasia Broca termasuk bermasalah dengan kelancaran, artikulasi, menemukan-kata, [[pengulangan kata]], dan menghasilkan dan memahami kalimat dengan tata-bahasa kompleks, baik secara oral maupun tulisan.
Mereka juga memperlihatkan pembicaraan yang tidak terstruktur dan ketidakmampuan menggunakan bahasa isyarat, secara analogi untuk memperlihatkan bagaimana mereka mempengaruhi bicara, dengan aphasia Broca menyebabkan si pengisyarat memberi isyarat dengan lambat dan dengan tata-bahasa yang tidak benar, namun pada pengisyarat dengan aphasia Wernicke akan fasih berisyarat, tapi hanya sedikit masuk akal oleh orang lain dan sulit memahami isyarat-isyarat dari orang lain.
Hal ini memperlihatkan bahwa gangguan tersebut adalah spesifik terhadap kemampuan untuk menggunakan bahasa, dan bukan pada fisiologi yang digunakan untuk produksi bicara.<ref>{{harvcoltxt|Trask|1999|p=108}}</ref><ref>{{harvcoltxt|Sandler|Lillo-Martin|2001|p=554}}</ref>
 
Dengan kemajuan teknologi pada akhir abad 20, neurologi juga telah mengadopsi teknik non-invasif seperti [[pencitraan resonansi magnetis fungsional]] (fMRI) dan [[elektrofisiologi]] untuk mempelajari pemrosesan bahasa dalam individu tanpa gangguan.<ref name="Lesser205"/>
 
=== Anatomi dari lisan ===
 
{{main|Produksi lisan|Fonetik|Fonetik artikulatori}}
 
{{multiple image
| align = right
| direction = vertical
| width = 200
| image1 = Illu01 head neck.jpg
| caption1 = Sistem vokal manusia.
| image2 = Spectrogram -iua-.png
| caption2 = [[Spectrogram]] dari vokal bahasa Inggris Amerika {{IPA|[i, u, ɑ]}} memperlihatkan forman ''f''<sub>1</sub> dan ''f''<sub>2</sub>]]
|image3 = Real-time MRI - Speaking (Chinese).ogv
|caption3 = Pemindaian MRI secara langsung dari seseorang yang berbicara Cina Mandarin.
}}
 
Bahasa lisan bergantung pada kemampuan fisik kita untuk menghasilkan suara, suatu gelombang longitudinal disebarkan lewat udara pada suatu frekuensi yang dapat menggetarkan [[gendang telinga]] manusia.
Kemampuan ini bergantung pada fisilogi dari organ-organ lisan manusia.
Organ-organ tersebut teridiri dari paru-paru, kotak suara ([[laring]]) dan sistem vokal atas - tenggorokan, mulut dan hidung.
Dengan mengkontrol bagian-bagian berbeda dari peralatan lisan aliran udara dapat dimanipulasi untuk menghasilkan suara lisan yang berbeda.<ref>{{harvcoltxt|MacMahon|1989|p=2}}</ref>
 
Suara lisan dapat dianalisa menjadi suatu kombinasi dari elemen-elemen [[Segmen (linguistik)|segmentasi dan suprasegmentasi]].
Elemen segmentasi adalah yang mengikuti satu sama lain secara berurutan, dan biasanya direpresentasikan dengan huruf-huruf berbeda dalam skrip alfabet seperti pada skrip Romawi.
Dalam bicara bebas, tidak ada batasan jelas antara satu segmen dengan lainnya, tidak juga umumnya ada jeda suara antara kata.
Segmen-segmen oleh karena itu dibedakan dengan suara-suara berbeda yang merupakan hasil dari artikulasi mereka yang berbeda, dan mereka dapat berbentuk huruf vokal atau konsonan.
Fenomena suprasegmentasi melingkupi elemen-elemen seperti [[Stress (linguistik)|stres]], tipe [[fonasi]], [[warna nada]] suara dan [[Prosodi (linguistik)|prosodi]] atau [[Intonasi (lingustik)|intonasi]] yang kesemuanya bisa mempengaruhi segmen-segmen lain. <ref name="MacMahon5">{{harvcoltxt|MacMahon|1989|pp=3}}</ref>
 
Segmen [[konsonan]] dan [[vokal]] digabungkan untuk membentuk [[silabel]], yang kemudian digabungkan untuk membentuk pengucapan; hal ini dapat dibedakan secara fonetis lewat ruang antara dua pernafasan.
[[Akustik|Secara akustik]], segmen-segmen berbeda ini dikarakterisasikan oleh struktur [[formant]] berbeda, yang dapat terlihat dalam suaut [[spectogram]] dari rekaman gelombang suara (lihat gambar Spectogram dari struktur formant dari tiga huruf vokal bahasa Inggris).
Forman adalah puncak amplitudo dalam spektrum frekuensi dari suatu suara tertentu.
<ref name="MacMahon5"/><ref name="IPA">{{harvcoltxt|International Phonetic Association|1999|pp=3–8}}</ref>
 
Huruf vokal adalah suara-suara yang tidak memiliki gesekan bunyi yang disebabkan oleh mendekatnya atau terhalangnya beberapa bagian dari sistem vokal atas.
Mereka beragam secara kualitas bergantung pada tingkat peralatan bibir dan letak dari lidah dalam rongga oral. <ref name="MacMahon5"/>
Huruf vokal disebut ''[[vokal tertutup]]'' saat bibir secara relatif tertutup, sebagaimana pada pengucapan dari huruf vokal {{ipa|[i]}} (Inggris "''ee''"), atau ''[[vokal terbuka]]'' saat bibir secara relatif terbuka, sebagaimana pada huruf vokal {{ipa|[a]}} (Inggris "''ah''").
Jika lidah terletak pada bagian belakang mulut maka kualitasnya berubah, membuat huruf vokal seperti {{ipa|[u]}} (Inggris "''oo''").
Dan kualitasnya juga berubah bergantung apakah bibir [[kebulatan|membulat]] atau tidak, membuat perbedaan seperti antara {{ipa|[i]}} (huruf vokal tidak membulat seperti pada Inggris "''ee''"") dan {{ipa|[y]}} ([[vokal depan membulat]] seperti pada Jerman "ü".<ref>{{harvcoltxt|MacMahon|1989|pp=11–15}}</ref>
 
Konsonan adalah suara-suara yang memiliki gesekan bunyi atau penutupan pada poin tertentu dalam sistem vokal atas.
Suara konsonan beragam dari tempat artikulasi, contohnya tempat dalam sistem vokal di mana aliran udara terhambat -- umumnya pada bibir, gigi, [[alveolar ridge]], ''[[palate]]'', ''[[Soft palate|velum]]'', ''[[uvula]]'' atau ''[[glottis]]''.
Setiap tempat artikulasi menghasilkan sekumpulan suara yang berbeda, yang lebih lanjuta dibedakan oleh [[cara artikulasi]] -- jenis dari gesekan -- baik tertutup penuh, pada kasus di mana konsonan disebut ''[[oklusif]]'' atau ''[[konsonan stop|stop]]'', atau tingkatan berbeda dari peralatan membentuk ''[[fricative]]'' dan ''[[konsonan aproximant|approximant]]''.
Konsonan juga dapat ''[[Bunyi (fonetik)|dibunyikan atau tidak dibunyikan]]'', bergantung apakah pita vokal di set dalam vibrasi oleh aliran udara selama menghasilkan suara.
Bunyi adalah yang membedakan Inggris {{ipa|[s]}} pada ''bus'' ([[sibilant|sibilant tak berbunyi]]) dengan {{ipa|[z]}} pada ''buzz'' ([[Alveolar sibilant berbunyi#alveolar sibilant berbunyi|sibilant berbunyi]]). <ref>{{harvcoltxt|MacMahon|1989|pp=6–11}}</ref>
 
Beberapa suara lisan, baik vokal dan konsonan, melibatkan pengeluaran aliran udara lewat lubang nasal, dan hal ini disebut ''[[Nasal konsonan|nasal]]'' atau suara ''[[nasalisasi]]''.
Suara-suara lainnya didefinisikan dengan cara lidah bergerak dalam mulut: seperti suara l (disebut ''[[konsonan lateral|lateral]]'', karena udara mengalir pada kedua sisi lidah), dan suara r (disebut ''[[rhotics]]'' yang dikarakterisasikan dengan bagaimana lidah diposisikan relatif dengan aliran udara.<ref name="IPA"/>
 
Dengan menggunakan organ-organ bicara tersebut, manusia dapat menghasilkan ratusan suara berbeda: beberapa sering muncul pada bahasa-bahasa di dunia di mana yang lainnya lebih umum pada rumpun bahasa tertentu, atau wilayah bahasa, atau bahkan spesifik pada satu bahasa.<ref>{{harvcoltxt|Ladefoged|Maddieson|1996}}</ref>
 
== Struktur ==
 
Bila dijelaskan sebagai suatu sistem dari [[komunikasi simbolik]], bahasa secara tradisional terdiri dari tiga bagian: [[isyarat (semiotik)|isyarat]], [[makna (semiotik|makna]] dan suatu [[kode (semiotik)|kode]] menghubungkan isyarat dengan maknanya.
Kajian dari proses [[semiotik]], bagaimana isyarat dan makna digabungkan, digunakan dan diinterpretasikan disebut dengan [[semiotik]].
Isyarat-isyarat dapat dibentuk dari suara, gerak, huruf-huruf atau simbol, bergantung pada apakah bahasa tersebut diucapkan, diisyaratkan atau ditulis, dan mereka dapat digabungkan menjadi isyarat kompleks seperti kata-kata dan frasa.
Bila digunakan dalam komunikasi suatu isyarat disandikan dan dipindahkan oleh pengirim lewat suatu kanal kepada penerima yang menterjemahkannya.<ref name="Lyons17">{{harvcoltxt|Lyons|1981|pp=17–24}}</ref>
 
[[Image:Ancient Tamil Script.jpg|thumb|right|Prasasti [[Bahasa Tamil|Tamil]] kuno di [[Thanjavur]]]]
 
Beberapa properti yang membatasi bahasa manusia dengan sistem komunikasi lainnya adalah: kesembarangan dari isyarat linguistik, berarti bahwa tidak ada koneksi yang dapat diprediksi antara suatu isyarat linguistik dan maknanya; dualitas dari sistem lingustik, berarti bahwa struktur linguistik dibangun dengan menggabungkan elemen-elemen menjadi struktur besar yang dapat dilihat sebagai lapisan-lapisan, misalnya bagaimana suara membentuk kata dan kata membentuk frasa; ciri-ciri dari elemen-elemen bahasa, berarti bahwa elemen-elemen pembangun dari isyarat linguistik adalah unit-unit diskrit, misalnya suara dan kata, yang dapat dibedakan satu dengan yang lainnya dan disusun kembali dalam pola-pola berbeda; dan produktivitas dari sistem linguistik, yang berarti bahwa jumlah terbatas dari elemen-elemen lingustik dapat digabungkan secara teoritis menjadi sejumlah kombinasi tak terbatas.<ref name="Lyons17"/>
 
Aturan-aturan mengenai isyarat mana yang dapat digabungkan untuk membentuk kata dan frasa disebut dengan [[sintaks]] atau tata-bahasa.
Makna yang terhubung pada isyarat-isyarat tertentu, morfem, kata, frasa dan teks disebut [[semantik]]. <ref>{{harvcoltxt|Trask|1999|p=35}}</ref>
Pembagian bahasa menjadi terpisah tapi sistem yang terhubung dari isyarat dan makna berawal dari kajian linguistik pertama dari de Saussure dan sekarang digunakan hampir pada semua cabang dari linguistik. <ref>{{harvcoltxt|Lyons|1981|pp=218–24}}</ref>
 
=== Semantik ===
 
{{main|Semantik|Semiotika|Makna (linguistik)}}
 
Bahasa mengekspresikan makna dengan mengaitkan sebuah isyarat dengan maknanya, isinya.
Bentuk isyarat haruslah sesuatu yang dapat dipersepsi, contohnya dalam suara, gambar atau gerak isyarat, dan mereka timbul berhubungan dengan makna tertentu oleh konvensi sosial.
Karena relasi dasar dari makna bagi kebanyakan isyarat-isyarat linguistik didasarkan pada konvensi sosial, isyarat linguistik bisa dianggap sembarang, dalam artian bahwa konvensi tersebut terbentuk secara sosial dan sejarah, bukan lewat relasi alami antara suatu bentuk isyarat tertentu dan maknanya.
 
Makanya bahasa haruslah memiliki [[kosa kata]] isyarat yang berkaitan dengan makna tertentu -- isyarat Inggris dari "anjing" menandakan, misalnya, anggota dari jenis ''[[Canis]]''.
Dalam sebuah bahasa, susunan dari isyarat yang sembarang yang terhubung kepada makna tertentu disebut dengan [[lexicon]], dan sebuah isyarat yang terhubung ke sebuah makna disebut dengan [[lexeme]].
Tidak semua makna dalam sebuah bahasa direpresentasikan oleh satu kata -- terkadang konsep semantik terkandung dalam morfologi atau sintaks dari suatu bahasa dalam bentuk [[Kategori Tatabahasa|kategori tatabahasa]].
<ref>{{harvcoltxt|Levinson|1983}}</ref>
 
Semua bahasa memiliki struktur semantik dari [[predikat (tatabahasa)|predikat]] -- sebuah struktur yang mendasari sebuah properti, keadaan atau aksi.
Secara tradisional semantik telah dipahami sebagai kajian bagaimana pembicara dan pendengar memberikan [[nilai benar]] terhadap suatu pernyataan, sehingga makna dapat dipahami sebagai suatu proses di mana sebuah predikat dapat dikatakan benar atau salah mengenai sebuah entitas, contohnya: "<nowiki>[x [adalah y]]" atau "[x [maka y]]</nowiki>."
Baru-baru ini, model dari semantik ini telah dilengkapi dengan model makna yang lebih dinamis yang menggabungkan pengetahuan yang sama tentang konteks di mana sebuah tanda diinterpretasikan menjadi produksi dari makna.
Model makna seperti itu ditelaah lebih jauh dalam bidang [[pragmatik]].
<ref>{{harvcoltxt|Levinson|1983}}</ref>
 
=== Suara dan simbol ===
 
{{main|Fonologi|Tulisan}}
 
{{multiple image
| align = right
| direction = vertical
| width = 150
| image1 = ManSpec.png
| caption1 = Sebuah spectrogram memperlihatkan suara dari kata bahasa Inggris "man" yang ditulis secara fonetik sebagai {{ipa|[mæn]}}. Perlu diketahui bahwa dalam alur bicara tidak ada pembedaan jelas antara segmen-semgen, hanya transisi halus saat peralatan vokal bergerak.
| image3 = Hangul wi.svg
| caption3 = Hurup "wi" dalam naskah [[Hangul]].
| image4 = KSL wi.jpg
| caption4 = Isyarat untuk "wi" dalam [[Bahasa Isyarat Korea]]
}}
 
Bergantung kepada modalitas struktur bahasa dapat didasarkan pada sistem suara (bicara), gestur (bahasa isyarat) atau grafik atau simbol taktil (tulisan).
Cara-cara di mana bahasa menggunakan suara atau isyarat untuk membentuk makna dipelajari dalam [[fonologi]].
<ref>{{harvcoltxt|Goldsmith|1995}}</ref>
Kajian bagaimana manusia menghasilkan dan memaknakan suara vokal disebut dengan [[fonetik]].
<ref>{{harvcoltxt|International Phonetic Association|1999}}</ref>
Dalam bahasa ucapan, makna dihasilkan bila suara menjadi bagian dari sistem di mana beberapa suara dapat berkontribusi untuk mengekspresikan suatu makna dan suara lainnya tidak.
Dalam setiap bahasa yang ada dari sekian banyak suara yang dapat dibuat oleh vokal manusia hanya sejumlah suara yang berkontribusi dalam pembentukan makna.
<ref>{{harvcoltxt|Ladefoged|Maddieson|1996|pp=}}</ref>
 
Suara sebagai bagian dari sistem linguistik disebut dengan [[fonem]]. <ref>{{harvcoltxt|International Phonetic Association|1999|p=27}}</ref>
Fonem adalah unit abstrak dari suara, dicirikan sebagai unit terkecil dalam sebuah bahasa yang berfungsi untuk membedakan antara makna dari sepasang kata secara minimal dari kata-kata berbeda, yang disebut dengan [[pasangan minimum]].
Dalam bahasa Inggris contohnya kata ''/bat/'' {{ipa|[bat]}} dan ''/pat/'' {{ipa|[pat]}} membentuk suatu pasangan minimum di mana perbedaan antara /b/ dan /p/ membedakan kedua kata yang memiliki makna yang berbeda.
Tapi setiap bahasa memperlihatkan suara dengan cara yang berbeda: contohnya dalam suatu bahasa yang tidak membedakan antara konsonan berbunyi dan tak berbunyi suara [p] dan [b] akan dianggap sebuah fenom tunggal dan akibat pengucapan keduanya akan memiliki makna yang sama.
Hal yang sama, pada bahasa Inggris tidak membedakan secara fonem antara pengucapan [[aspirasi (linguistik)|aspirasi dan non-aspirasi]] dari konsonan sebagai kebanyakan bahasa lain lakukan: non-aspirasi /p/ dalam /''spin''// {{ipa|[[spin]}} dan aspirasi /p/ dalam /''pin''/ {{ipa|[pin]}} dianggap hanya sebagai cara yang berbeda dalam pengucapan fenom yang sama (variansi dari fenom tunggal disebut dengan [[allofon]]), sedangkan dalam [[Mandarin]] perbedaan dalam pengucapan memisahkan antara kata {{ipa|[pʰá]}} "jongkok" dan {{ipa|[pá]]}} "delapan" (aksen di atas á berarti bahwa vokal diucapkan dengan nada tinggi).<ref name="Trask214"/>
 
Semua [[bahasa oral]] memiliki sedikitnya dua kategori fenom berbeda: [[harakat]] dan [[konsonan]], yang dapat digabungkan menjadi [[suku kata]]. <ref name="MacMahon5"/>
Selain segmen seperti harakat dan konsonan, beberapa bahasa juga menggunakan suara dengan cara berbeda untuk menyampaikan suatu makna.
Banyak bahasa, misalnya, menggunakan [[stres (linguistik)|penekanan]], [[aksen nada|aksen]], [[panjang harakat|durasi]] dan [[bahasa tonal|nada]] untuk membedakan makna.
Karena fenomena seperti ini bekerja di luar tingkat dari sebuah segmen mereka disebut dengan [[suprasegmental]]. <ref>{{harvcoltxt|International Phonetic Association|1999|p=4}}</ref>
Beberapa bahasa hanya memiliki sedikit fenom, sebagai contohnya [[Bahasa Rotokas|Rotokas]] dan [[Bahasa Piraha]] masing-masing dengan 11 dan 10 fenom, sementara bahasa seperti [[Bahasa Taa#fonologi|Taa]] bisa memiliki 141 fenom.<ref name="Trask214">{{harvcoltxt|Trask|2007|p=214}}</ref>
Dalam [[bahasa isyarat]] [[Fenom#Fenom dalam bahasa isyarat|persamaan dengan fenom]] (sebelumnya dikenal dengan [[chereme]]) ditentukan oleh elemen-elemn dasar dari gestur seperti bentuk tangan, orientasi, lokasi, dan gerakan, yang berhubungan dengan kebiasaan artikulasi dalam bahasa lisan.<ref>{{harvcoltxt|Sandler|Lillo-Martin|2001|pp=539–40}}</ref>
 
[[Aksara]] merepresentasikan suara dari perkataan manusia menggunakan simbol visual, yang bisa atau mungkin tidak berhubungan dengan suara dari bahasa lisan.
Alfabet latin (dan yang berbasis atau diturunkan darinya) adalah berbasiskan representasi dari suatu suara, sehingga kata-kata terbentuk dari huruf-huruf yang secara umum menandakan sebuah konsonan atau harakat dalam struktur dari kata.
Dalam naskah suku kata, seperti naskah [[Inuktitut]], setiap isyarat merepresentasikan seluruh suku kata.
Dalam naskah [[logographic]] setiap isyarat merepresentasikan seluruh kata, <ref>{{harvcoltxt|Trask|2007|p=326}}</ref>
dan akan secara umum tidak memiliki hubungan dengan suara dari kata dalam bahasa lisan.
 
Karena semua bahasa memiliki jumlah kata yang sangat banyak, tidak ada naskah logographic yang diketahui eksis.
Dalam menulis, dimensi sementara saat suara dan kata mengalir pada bahasa lisan direpresentasikan secara spasial dalam bentuk direksi.
Tapi direksi di mana urutan-urutan dari simbol disusun dalam menulis juga beragam, beberapa sistem penulisan menggunakan arah horizontal (kiri ke kanan pada naskah Latin atau kanan ke kiri pada [[naskah Arab]]), yang lainnya seperti tulisan tradisional Cina menggunakan dimensi vertikal (atas - bawah).
Beberapa sistem penulisan menggunakan arah berlawan untuk baris-baris alternatif, dan yang lainnya seperti naskah Maya dapat ditulis dengan arah manapun dan menggunakan petunjuk grafis untuk memperlihatkan pada pembaca arah dari membaca.<ref name="Coulmas">{{harvcoltxt|Coulmas|2002}}</ref>
 
Untuk merepresentasikan suara dari bahasa-bahasa di dunia dalam penulisan, linguis telah mengembangkan [[International Phonetic Alphabet]], dirancang untuk merepresentasikan semua suara yang berbeda yang telah diketahui untuk membantu pemaknaan dalam bahasa manusia. <ref>{{harvcoltxt|Trask|2007|p=123}}</ref>
 
 
=== Tatabahasa ===
{{main|tatabahasa}}
 
Tatabahasa adalah kajian bagaimana elemen-elemen makna ([[morfem]]) dalam suatu bahasa dapat digabungkan menjadi pengucapan. Morfem dapat ''bebas'' atau ''terikat''. Jika mereka bebas berpindah dalam pengucapan, mereka biasanya disebut dengan kata, dan jika mereka terikat dengan kata atau morfem lainnya, mereka disebut dengan [[afiks]].
Bagaimana suatu elemen makna dapat digabungkan dalam suatu bahasa dikontrol oleh aturan-aturan.
Aturan-aturan untuk mendapatkan struktur internal kata disebut dengan [[morfologi (linguistik)|morfologi]].
Aturan-aturan dari struktur internal dari frasa dan kalimat disebut dengan sintaks. <ref>{{harvcoltxt|Lyons|1981|p=103}}</ref>
 
==== Kategori Tatabahasa ====
 
Tatabahasa dapat diartikan sebagai sebuah sistem kategori, dan suatu kumpulan aturan-aturan yang menentukan bagaimana kategori-kategori digabungkan untuk membentuk aspek-aspek makna yang berbeda. <ref>{{harvcoltxt|Allerton|1989}}</ref>
Bahasa-bahasa berbeda secara luas dalam apakah suatu kategori dikodekan lewat penggunaan unit kategori atau leksikal.
Namun, beberapa kategori sangat umum sehingga hampir universal.
Beberapa kategori universal itu termasuk pengkodean relasi gramatikal dari peserta dan predikat secara tatabahasa [[morphosyntactic alignment|berbeda antara relasinya]] terhadap predikat, pengkodean dari relasi [[Kala (linguistik)|sementara]] dan [[Preposisi dan posposisi|spasial]] pada predikat, dan sistem dari [[pelaku gramatikal]] mengatur acuan dan perbedaan antara pembicara dan penerima dan tentang siapa yang mereka bicarakan. <ref>{{harvcoltxt|Payne|1997}}</ref>
 
==== Kelas-kelas kata ====
 
Bahasa mengelompokkan [[bagian-bagian dari pembicaraan]] menjadi kelas-kelas bergantung kepada fungsi dan posisi relatif terhadap bagian lainnya. Semua bahasa, misalnya, memiliki perbedaan mendasar antara sekelompok kata yang secara prototipikal mengacu pada sesuatu dan konsep dan sekelompok kata yang secara prototipikal mengacu pada aksi dan kejadian. Kelompok pertama, yang mengikutkan kata seperti "anjing" dan "lagu", biasanya disebut dengan [[kata benda]]. Kelompok kedua, yang mengikutkan kata seperti "lari" dan "menyanyi", disebut dengan [[kata kerja]]. Kategori umum lainnya adalah [[Kata sifat]], kata-kata yang menjelaskan properti atau kualitas dari kata benda seperti "merah" atau "besar".
 
Kelas-kelas kata juga memiliki fungsi berbeda dalam tatabahasa. Kata kerja prototipikal digunakan untuk membentuk [[predikat (tatabahasa)|predikat]], sementara kata benda digunakan sebagai [[argumen]] dari predikat. Dalam kalimat seperti "Sally lari," predikatnya adalah "lari," karena ia merupakan kata yang menandakan keadaan tertentu tentang argumennya "Sally". Beberapa kata kerja seperti "sumpah" bisa saja memerlukan dua argumen, contohnya: "Sally menyumpahi John". Predikat yang hanya menggunakan satu argumen disebut dengan [[transitiviti (tatabahasa)|''intransitif'']], dan predikat yang memakai dua argumen disebut dengan [[kata kerja transitif|''transitif'']].
 
Banyak kelas-kelas lain yang ada di bahasa yang berbeda, seperti [[Konjungsi (tatabahasa)|konjungsi]] yang berguna untuk menggabungkan dua kalimat dan [[artikel (tatabahasa)|klausa]] yang memperkenalkan sebuah kata benda, [[interjeksi]] seperti "agh!" atau "wow!", atau [[ideofon]] yang menirukan suara dari suatu kejadian.
Beberapa bahasa memiliki posisional, yang menjelaskan posisi spasial dari suatu kejadian atau entitas.
Banyak bahasa memiliki [[Penggolongan (linguistik)|penggolongan]], yang mengidentifikasi sejumlah kata-benda yang yang termasuk pada tipe tertentu atau memiliki suatu bentuk tertentu.
Sebagai contohnya, dalam [[Bahasa Jepang]], penggolongan umum kata benda untuk manusia adalah ''nin'' (人), dan ia digunakan untuk menghitung manusia, apapun namanya:
:''san-nin no gakusei'' (三人の学生) secara literal "3 manusia-penggolongan dari pelajar" — tiga pelajar
Sementara untuk pohon, akan berbentuk:
:''san-bon no ki'' (三本の木) secara literal "3 penggolongan-untuk-objek dari pohon-panjang" — tiga pohon;
 
==== Morfologi ====
 
Dalam linguistik, kajian mengenai struktur internal dari kata-kata kompleks, dan proses-proses di mana setiap kata dibentuk disebut [[morfologi (linguistik)|morfologi]].
Pada kebanyakan bahasa, adalah memungkinkan untuk membentuk kata-kata kompleks yang dibentuk dari beberapa [[morfem]].
Sebagai contohnya kata Bahasa Inggris "unexpected" dan dianalisa sebagai gabungan dari tiga morfem "un-", "expect" dan "-ed".<ref>{{harvcoltxt|Aronoff|Fudeman|2011|pp=1–2}}</ref>
 
Morfem dapat dikelompokkan berdasarkan apakah mereka morfem independen, yang disebut ''[[Akar (linguistik)|akar]]'', atau apakah mereka dapat muncul terkait dengan morfem lainnya.
Morfem yang terikat atau ''[[afiks]]'' dapat digolongkan menurut posisi mereka berkaitan dengan akarnya: ''[[prefiks]]'' lebih dulu dari akar, ''[[sufiks]]'' setelah akar dan ''[[infiks]]'' dimasukkan di antara akar.
Afiks bertujuan untuk merubah atau mengembangkan makna dari akar.
Beberapa bahasa mengganti makna dari kata dengan merubah struktur fonologi dari kata, contohnya kata Inggris "run" dengan kata kerja masa lampaunya adalah "ran".
Proses ini disebut dengan ''[[ablaut]]''.
Lebih lanjut, morfologi membedakan antara proses ''[[infleksi]]'' yang merubah atau mengembangkan kata, dan proses [[derivasi (linguistik)|derivasi]] yang membuat kata baru dari kata yang sudah ada.
Dalam bahasa Inggris kata kerja "sing" memiliki bentuk infleksi "singing" dan "sung" yang mana keduanya merupakan kata kerja, dan bentuk derivasi "singer" yang merupakan sebuah kata benda yang diturunkan dari kata kerja dengan sufiks agentif "-er".<ref>{{harvcoltxt|Bauer|2003}}</ref><ref>{{harvcoltxt|Haspelmath|2002}}</ref>
 
Bahasa berbeda secara luas dalam bagaimana mereka bergantung kepada proses morfologis dari formasi kata.
Dalam beberapa bahasa, sebagai contohnya Cina, tidak ada proses morfologis dan semua informasi gramatis disandikan secara sintaks dengan membentuk pertalian dari kata-kata tunggal.
Bentuk dari morfo-sintaks ini sering disebut [[Isolasi bahasa|isolasi]], atau analitis, karena hampir ada suatu korepondensi penuh antara sebuah kata tunggal dan sebuah aspek tunggal dari makna.
Kebanyakan bahasa memiliki kata-kata yang terdiri dari beberapa morfem, tapi mereka beragam dalam tingkatan di mana morfem adalah unit-unit diskrit.
Pada kebanyakan bahasa, secara terkenal dalam kebanyakan bahasa Indo-Eropa, morfem tunggal bisa memiliki beberapa makna berbeda yang tidak dapat dianalisis menjadi segmen-segmen kecil.
Sebagai contohnya dalam bahasa Latin kata ''bonus'', terdiri dari kata akar ''bon-'' yang berarti "baik" dan sufiks -''us'' yang berarti gender maskulin, jumlah tunggal dan kasus [[nominatif]].
Bahasa seperti itu disebut dengan ''[[bahasa fusional]]'', karena beberapa makna bisa digabungkan menjadi morfem tunggal.
Kebalikan dari bahasa fusional adalah [[bahasa aglutinatif]] yang membentuk kata-kata dengan menggabungkan morfem-morfem dalam satu rantai, tapi dengan setiap morfem sebagai suatu unit diskrit semantik.
Sebuah contoh dari bahasa seperti itu adalah [[Bahasa Turki|Turki]], dengan contoh kata ''evlerinizden'' ("dari rumah anda") terdiri dari beberapa morfem, ''ev-ler-iniz-den'' dengan arti ''rumah-jamak-anda-dari''.
Bahasa-bahasa yang bergantung kepada morfologi pada tingkat tertinggi secara tradisional disebut [[bahasa polisintetik]].
Mereka bisa mengekspresikan sebuah kalimat Bahasa Inggris secara penuh dalam satu kata tunggal.
Sebagai contohnya kata [[Bahasa Yupik|Yupik]] ''tuntussuqatarniksaitengqiggtuq'' yang berarti "Dia (pria) belum mengatakan lagi bahwa dia akan berburu rusa kutub."
Kata tersebut terdiri dari morfem-morfem ''tuntu-ssur-qatar-ni-ksaite-ngqiggte-uq'' dengan arti, rusa.kutub-berburu-besok-mengatakan-negasi-lagi-orang.ketiga.tunggal-indikatif, dan kecuali pada morfem ''tuntu'' "rusa kutub", tidak ada morfem lain yang muncul dalam isolasi. <ref>{{harvcoltxt|Payne|1997|pp=28–29}}</ref>
 
Banyak bahasa menggunakan morfologi untuk merujuk-silang kata-kata dengan sebuah kalimat.
Hal ini terkadang disebut dengan ''[[Kesepakatan (linguistik)|kesepakatan]]''.
Contohnya, pada kebanyakan bahasa Indo-Eropa adjektif harus merujuk-silang pada kata benda yang dirubahnya berkenaan dengan jumlah, hal dan gender, sehingga adjektif Latin ''bonus'' "bagus" diinfleksikan sepakat dengan kata benda gender maskulin dan singular.
Pada bahasa-bahasa polisintetik kata kerja merujuk-silang subjek dan objek mereka.
Dalam tipe-tipe bahasa ini, sebuah kata-kerja tunggal bisa mengikutkan informasi yang membutuhkan sebuah kalimat dalam bahasa Inggris.
Sebagai contohnya dalam [[Bahasa Basque]] frase ''ikusi nauzu'' "anda melihat saya", kata kerja bantu masa lampau ''n-au-zu'' (mirip dengan Inggris "do") sesuai dengan subjek (anda) diekspresikan dengan prefiks ''n'', dan dengan objek (saya) diekspresikan dengan sufiks -''zu''.
Kalimat tersebut dapat secara langsung diterjemahkan sebagai "melihat kamu-kan-saya".
<ref>{{harvcoltxt|Trask|2007|p=11}}</ref>
 
==== Sintaks ====
{{main|sintaks}}
 
[[Berkas:Basic constituent structure analysis English sentence.svg|350px|right|thumb| Sebagai tambahan dari kelas-kelas kata, sebuah kalimat dapat dianalisa dipandang dari fungsi tata-bahasa: "Kucing" adalah [[subjek (tatabahasa)|subjek]] dari kalimat, "di atas matras" adalah sebuah frase [[lokatif (kejadian)|lokatif]], dan "duduk" adalah inti dari [[Predikat (tatabahasa)|predikat]].]]
 
Cara lain di mana bahasa menyampaikan makna adalah lewat urutan dari kata-kata dalam sebuah kalimat.
Aturan-aturan tata bahasa untuk bagaimana menghasilkan kalimat baru dari kata-kata yang telah diketahui disebut dengan sintaks.
Aturan-aturan tata-bahasa dari suatu bahasa menentukan kenapa sebuah kalimat dalam bahasa Inggris seperti "''I love you''" memiliki makna tapi "*''love you I''" tidak
<ref>Prefiks asterisk * secara konvensi mengindikasikan bahwa kalimat tersebut tidak memiliki tata-bahasa, yaitu tidak benar secara sintaks </ref>
: aturan-aturan sintaks menentukan bagaimana urutan kata dan struktur kalimat dibatasi, dan bagaimana batasan tersebut memiliki kontribusi pada makna.<ref>{{harvcoltxt|Baker|2001|p=265}}</ref>
Contohnya dalam bahasa Inggris dua kalimat "si budak mengutuk si tuan" dan "si tuan mengutuk si budak" memiliki makna berbeda karena peran dari subjek tata-bahasa disandikan oleh kata benda di depan kata kerja, dan peran dari objek disandikan oleh kata benda yang muncul setelah kata kerja.
Tapi dalam [[Bahasa Latin|Latin]] keduanya ''Dominus servos vituperabat'' dan ''Servos vituperabat dominus'' berarti "si tuan menegur si budak", karena ''servos'' "budak" ada dalam [[kasus akusatif]] memperlihatkan bahwa mereka adalah [[Objek (tata bahasa)|objek dari tata bahasa]] dari kalimat dan ''dominus'' "tuan" ada dalam [[kasus nominatif]] memperlihatkan bahwa dia adalah si subjek.
<ref>{{harvcoltxt|Trask|2007|p=179}}</ref>
 
Latin menggunakan morfologi untuk mengekspresikan perbedaan antara subjek dan objek, di mana pada bahasa Inggris menggunakan urutan kata.
Contoh lain bagaimana aturan-aturan sintatis memberikan makan adalah aturan pada [[Pergerakan-Wh|urutan kata terbalik dalam pertanyaan]] yang ada di banyak bahasa.
Aturan ini adalah alasan kenapa dalam bahasa Inggris, saat frasa "John is talking to Lucy" berubah menjadi sebuah pertanyaan menjadi "Who is John talking to?" dan bukan "John is talking to who?".
Contoh terakhir bisa digunakan sebagai cara untuk menempatkan [[fokus (linguistik)|empasis khusus]] pada ''who'', dengan demikian sedikit merubah makna dari pertanyaan.
Sintaks juga mengikutkan aturan-aturan bagaimana kalimat-kalimat kompleks disusun dengan mengelompokan kata-kata dalam unit-unit, disebut [[frase]], yang dapat menempati tempat berbeda dalam suatu struktur sintaktis besar.
Kalimat-kalimat dapat dijelaskan sebagai terdiri dari frase-frase terhubung dalam sebuah struktur pohon, menghubungkan frase satu sama lain pada tingkatan yang berbeda. <ref>{{harvcoltxt|Baker|2001|pp=269–70}}</ref>
Di sebelah kanan adalah suatu representasi grafik dari analisis sintaktis dari kalimat bahasa Inggris "the cat sat on the mat".
Kalimat tersebut dianalisa sebagai dibentuk oleh suatu frase kata benda, kata kerja dan frase preposional; fase preposional lebih lanjut lagi dibagi menjadi sebuah preposisi dan sebuah frase kata benda; dan frase kata benda terdiri dari dari sebuah artikel dan sebuah kata benda.
<ref>{{harvcoltxt|Trask|2007|pp=218–19}}</ref>
 
Alasan kenapa kalimat dapat dilihat sebagai gabungan dari frase adalah karena setiap frase akan bergerak sebagai sebuah elemen tunggal jika operasi sintaktis diikutkan.
Contohnya "the cat" adalah satu frase dan "on the mat" adalah yang lainnya karena mereka akan dianggap sebagai satu unit jika kita memilih menekankan lokasi dengan pindah ke depan frase preposisi: "[And] on the mat, the cat sat".<ref>{{harvcoltxt|Trask|2007|pp=218–19}}</ref>
Ada banyak perbedaan pada kerangka formalis dan fungsionalis yang mengajukan teori-teori untuk menjelaskan struktur sintaktis, berdasarkan asumsi-asumsi berbeda tentang apa itu bahasa dan bagaimana ia seharusnya dijelaskan.
Tiap-tiapnya akan menganalisa sebuah kalimat seperti contoh di atas dalam makna yang berbeda.<ref name="NewmeyerForm"/>
 
=== Tipologi: universal dan diversitas ===
{{Main|Tipologi linguistik|Bahasa universal|Tata bahasa universal}}
 
Bahasa dapat dikelompokan menurut relasi pada tipe-tipe tata-bahasa mereka.
Bahasa-bahasa yang berada pada rumpun yang berbeda terkadang memiliki fitur-fitur yang sama, dan fitur berbagi tersebut condong berhubungan.<ref>{{harvcoltxt|Nichols|1992}};{{harvcoltxt|Comrie|1989}}</ref>
Contohnya, bahasa dapat dikelompokan berdasarkan [[urutan kata]], urutan relatif dari [[kata kerja]], dan komponen-komponennya dalam suatu [[kalimat (linguistik)|kalimat]] indikatif normal.
Dalam bahasa Inggris urutan dasar adalah [[Subjek-predikat-objek|SPK]] "Ular (S) menggigit (P) orang (O)", di mana kalimat tersebut dalam [[Bahasa Aborigin Australia|bahasa orang Australia]] [[Bahasa Gamilaraay|Gamilaraay]] akan menjadi "''duyugu nama dayn yiːy''" (Ular Orang Gigit), [[Subjek-Objek-Predikat]].
<ref name="CroftErg">{{harvcoltxt|Croft|2001|p=340}}</ref>
Tipe urutan kata berkaitan sebagai suatu parameter tipologis karena dasar tipe urutan kata berhubungan dengan parameter sintaktis lainnya, seperti urutan relatif dari kata benda dan adjektif, atau penggunaan preposisi dari postposisi.
Korelasi seperti itu disebut [[universal linguistik|implikasi universal]].
Contohnya, kebanyakan (tapi tidak semua) bahasa yang memiliki tipe [[Subjek-objek-predikat|SOP]] memiliki [[postposisi]] bukan [[preposisi]], dan memiliki adjektif sebelum kata benda.
<ref>{{harvcoltxt|Greenberg|1966}}</ref>
 
Dari kajian berbagai tipe urutan kata telah ditemukan bahwa tidak semua bahasa mengelompokan hubungan antara aktor dan aksi sebagaimana yang bahasa Inggris lakukan pada Subjek, Objek dan Kata Kerja - tipe ini disebut dengan tipe [[Bahasa nominatif-absolutif|nominatif-akusatif]].
Beberapa bahasa disebut [[Ergativitas|ergatif]], Gamilaraay di antaranya, membedakan antara Agen dan Pasien.
Dalam klausa transitif bahasa Inggris, kedua subjek dari kalimat intransitif ("I run") dan kalimat transitif ("I love you") diperlakukan sama, diperlihatkan di sini oleh kata ganti nominatif ''I''.
Dalam bahasa-bahasa ergatif partisipan tunggal dalam sebuah kalimat intransitif seperti "I run" diperlakukan sama sebagai pasien dalam suatu kalimat transitif -- memberikan persamaan pada "me run" dan "you love me", hanya pada kalimat transitif persamaan kata ganti ''I'' akan digunakan. <ref name="CroftErg"/>
Dengan cara ini aturan-aturan semantik dapat dipetakan ke relasi tatabahasa dengan cara berbeda, mengelompokan sebuah subjek intransitif baik dengan Agen (tipe akusatif) atau Pasien (tipe ergatif) atau membuat setiap dari tiga aturan tersebut secara berbeda, yang disebut [[Bahasa Tripartite|tipe tripartite]].
<ref>{{harvcoltxt|Croft|2001|p=355}}</ref>
 
Fitur-fitur berbagi bahasa yang termasuk pada tipe kelas tipologis yang sama bisa muncul secara independen.
Kemunculannya mereka bisa dikarenakan hukum universal mengatur struktur dari bahasa alami -- bahasa universal -- atau mereka mungkin sebuah hasil dari bahasa-bahasa mengembangkan solusi-solusi konvergen terhadap permasalahan komunikatif yang muncul yang mana manusia menggunakan bahasa untuk menyelesaikannya.
<ref name="Myths"/>
 
== Konteks sosial dari penggunaan dan transmisi ==
 
Sementara semua manusa memiliki kemampuan untuk mempelajari bahasa apapun, mereka hanya melakukan tersebut jika mereka tumbuh dalam suatu lingkungan yang memiliki bahasa dan digunakan oleh yang lain.
Bahasa oleh karena itu bergantung pada [[komunitas bicara|komunitas dari pembicara]] di mana anak-anak [[akuisisi bahasa|mempelajari bahasa]] dari orang tua dan teman, dan mereka sendiri memindahkan bahasa kepada anak mereka.
Bahasa digunakan oleh mereka yang menyuarakannya untuk [[komunikasi]], dan untuk menyelesaikan masalah-masalah sosial.
Banyak aspek dari penggunaan bahasa dapat dilihat beradapatsi secara spesifik untuk tujuan tersebut.
<ref name="Myths">{{harvcoltxt|Evans|Levinson|2009}}</ref>
Dikarenakan cara di mana bahasa dipindahkan antara generasi dan dalam komunitas, bahasa terus-menerus berubah, berpisah menjadi bahasa baru atau menyatu karena [[kontak bahasa]].
Prosesnya sama dengan proses pada [[evolusi]], di mana proses dari turunana dengan modifikasi mengarah pada formasi dari suatu [[pohon filogenetis]]. <ref>{{harvcoltxt|Campbell|2004}}</ref>
 
Namun bahasa berbeda dengan organisme biologis di mana mereka siap menggabungkan elemen-elemen dari bahasa lain lewat proses [[difusi]], saat pembicara dari bahasa-bahasa berbeda melakukan kontak.
Manusia juga terkadang menggunakan lebih dari satu bahasa, memperoleh [[bahasa pertama]] mereka atau bahasa saat kanak-kanak, atau mempelajari bahasa baru saat mereka tumbuh.
Karena meningkatnya kontak bahasa dalam dunia globah banyak bahasa-bahasa kecil menjadi [[bahasa langka|langka]] karena si penutur berpindah ke bahasa lain yang memungkinkan mereka berpartisipasi dalam komunitas yang lebih besar dan lebih influensial.
<ref>{{Harvcoltxt|Austin|Sallabank|2011}}</ref>
 
=== Penggunaan dan Makna ===
{{main|pragmatik}}
 
Kajian semantik dari makna mengasumsikan bahwa makna berada dalam suatu relasi antara isyarat dan makna yang secara kuat terbentuk lewat konvensi sosial.
Tapi semantik tidak mempelajari bagaimana dalam konvensi sosial tersebut dibaut dan mempengaruhi bahasa.
Namun, saat mempelajari bagaimana suatu kata dan isyarat digunakan, terkadang kata memiliki makna berbeda bergantung kepada penggunaan pada konteks sosial.
Dan isyarat juga berubah maknanya sepanjang waktu, saat konvensi mengatur penggunaannya secara bertahap berubah.
Kajian tetang bagaimana makna dari ekspresi linguistik berubah bergantung konteks disebut pragmatik.
Pragmatik bersangkutan dengan cara-cara di mana penggunaan bahasa dipolakan dan bagaimana pola-pola tersebut mempengaruhi makna.
Sebagai contohnya di semua bahasa ekspresi linguistik dapat digunakan tidak hanya untuk memindahkan informasi, tapi untuk melakukan aksi.
Aksi-aksi tertentu hanya dibentuk lewat bahasa, tapi memiliki efek nyata.
Contohnya aksi 'menamakan', yang membuat sebuah nama baru untuk beberapa entitas, atau aksi dari 'menyebutkan seseorang suami dan istri' yang membuat kontrak sosial dari pernikahan.
Tipe-tipe dari aksi ini disebut dengan [[aksi bicara]], walau mereka tentu saja terbawa dalam penulisan dan isyarat tangan.
<ref>{{harvcoltxt|Levinson|1983|pp=226–78}}</ref>
 
Bentuk dari ekspresi linguistik tidak berhubungan dengan makna yang dimilikinya dalam suatu konteks sosial.
Contohnya, jika pada meja makan seseorang bertanya "bisakah anda menjangkau garam?", hal itu faktanya bukanlah pertanyaan tentang panjang dari tangan teman yang diajak bicara, tapi suatu permintaan untuk memberikan garam.
Makna tersebut tersirat oleh konteksi di mana ia dibicarakan, jenis dari efek dari makna disebut [[implikatur konversasional]].
Aturan-aturan sosial tentang bagaimana penggunaan bahasa dianggap sesuai dalam situasi tertentu, dan bagaimana memahami pengucapan dalam relasi terhadap konteksnya, beragam dalam komunitas, dan mempelajarinya adalah suatu bagian besar dari memperoleh [[kompetensi komunikatif]] dalam sebuah bahasa.
<ref>{{harvcoltxt|Levinson|1983|pp=100–169}}</ref>
 
=== Akuisisi bahasa ===
 
{{Main|[[Akuisisi bahasa]]|[[Akuisisi bahasa kedua]]|Bahasa kedua|Pendidikan bahasa}}
 
[[Image:Speech Client WEB (5).jpg|thumb|250px|right|Semua anak-anak normal memperoleh bahasa jika mereka dipertemukan dengan bahasa dalam tahun-tahun pertama hidup mereka, bahkan dalam kultur di mana orang dewasa jarang bertemu dengan bayi dan balita secara langsung.]]
 
Semua manusia yang sehat, [[Perkembangan manusia (biologi)|berkembang secara normal]], belajar menggunakan bahasa.
Anak-anak memperoleh bahasa atau bahasa yang ada disekitarnya -- bahasa manapun yang mereka terima secara penuh selama masa kanak-kanak.
Perkembangannya secara esensial sama antara anak-anak yang mempelajari [[bahasa isyarat]] atau [[bahasa oral]].
<ref>
{{Cite journal
|last1=Bonvillian
|first1=John D.
|coauthor=Michael D. Orlansky and Leslie Lazin Novack
|title=Developmental milestones: Sign language acquisition and motor development
|journal=Child Development
|volume=54
|issue=6
|date=December 1983
|pages=1435-1445
}}</ref>
Proses belajar ini dikenal dengan akuisisi bahasa pertama, karena tidak seperti pembelajaran lainnya ia tidak membutuhkan pembelajaran langsung atau kajian secara khusus.
Dalam ''[[The Descent of Man, and Selection in Relation to Sex|The Descent of Man]]'' naturalis [[Charles Darwin]] menyebut proses tersebut dengan "keinginan insting untuk memperoleh suatu seni."<ref name="Language Instinct"/>
 
Akuisisi bahasa pertama berlangsung regular secara bertahap, walaupun terdapat berbagai variasi dalam waktu untuk tingkatan-tingkatan tertentu di antara bayi yang berkembang secara normal.
Sejak lahir, bayi merespon lebih mudah pada suara manusia daripada suara lainnya.
Sekitar umur satu bulan, bayi tampak telah dapat membedakan antara [[Phone (phonetics)|suara bicara]] yang berbeda.
Sekitar umur enam bulan, seorang anak mulai [[mengoceh]], menghasilkan suara bicara dari bahasa yang digunakan disekitarnya.
Perkataan mulai muncul pada umur 12 sampai 18 bulan; rata-rata [[perbendaharaan kata]] bayi berumur 18 bulan adalah sekitar 50 kata.
Pengucapan pertama anak adalah berbentuk [[Holofrasis|Holofrasa]] (secara harfiah "keseluruhan-kalimat"), pengucapan yang hanya menggunakan satu kata untuk mengkomunikasikan seluruh ide.
Beberapa bulan setelah anak menghasilkan kata-kata, ia akan menghasilkan pengucapan dengan dua-kata, dan dalam beberapa bulan lebih mulai ber-[[bicara telegrafis]], kalimat singkat yang kurang kompleks secara [[tatabahasa]] daripada orang dewasa bicara, tetapi memperlihatkan struktur sintaks reguler.
Pada umur tiga sampai lima tahun, kemampuan anak untuk berbicara dan berisyarat yang halus yang hampir mirip dengan bahasa dewasa.
<ref name="OGrady-Cho">
{{Cite book
|last1=O'Grady
|first1=William
|last2=Cho
|first2=Sook Whan
|chapter=First language acquisition
|title=Contemporary Linguistics: An Introduction
|edition=fourth
|location=Boston
|publisher=Bedford St. Martin's
|year=2001
}}</ref>
 
Akuisisi dari bahasa kedua dan tambahan dapat berlangsung pada umur berapapun, lewat paparan dalam hidup sehari-hari atau lewat kursus.
Anak yang mempelajari bahasa kedua lebih mungkin mendapatkan kefasihan seperti aslinya daripada orang dewasa, tapi secara umum sangat jarang bagi seseorang yang menggunakan bahasa kedua melewati secara penuh penutur aslinya.
Perbedaan penting antara akuisisi bahasa pertama dan akuisisi bahasa tambahan adalah bahwa proses dari akuisisi bahasa tambahan dipengaruhi oleh bahasa yang si pelajar telah ketahui.
 
=== Bahasa dan kultur ===
{{see also|Kultur#Bahasa_dan_kultur|l1=Kultur}}
 
[[Image:Lakhovsky Conversation.jpg|thumb|250px|right|[[Arnold Lakhovsky]], ''The Conversation'' (sekitar 1935)]]
 
Bahasa, dipahami sebagai kumpulan norma-norma perkataan dari komunitas tertentu, juga termasuk bagian dari kultur yang lebih besar dari komunitas yang menggunakannya.
Manusia menggunakan bahasa sebagai cara memberikan sinyal identitas antara grup kultur dan perbedaan dengan yang lainnya.
Bahkan di antara pembicara dalam satu bahasa beberapa cara berbeda dalam menggunakan bahasa masih ada, dan setiapnya digunakan untuk memberikan sinyal pertalian antara subgrup dalam satu kultur yang besar.
Linguis dan antropologis, terutama [[Sociolinguistics|sociolinguistic]], [[Anthropological linguistics|ethnolinguists]] dan [[Linguistic anthropology|linguistic anthropologists]] telah mengkhususkan mengkaji bagaimana cara berbicara bisa berbeda antara [[Komunitas bicara]].
 
Cara komunitas menggunakan bahasa adalah bagian dari kultur komunitas tersebut, seperti praktek-praktek berbagi lainnya; ia merupakan cara untuk menunjukkan identitas grup.
Cara-cara berbicara tidak hanya untuk berkomunikasi, tetapi juga untuk mengidentifikasikan posisi sosial dari pembicara.
Dalam banyak bahasa terdapat perbedaan gaya atau bahkan tata-bahasa antara cara pria dan wanita berbicara.
Seperti halnya beberapa bahasa menggunakan kata-kata berbeda bergantung kepada yang mendengarkan.
Contohnya dalam bahasa Australia [[Bahasa Dyirbal|Dyirbal]] seorang pria yang menikah harus menggunakan sekumpulan kata-kata untuk mengacu pada benda-benda keseharian saat berbicara bila ada ibu angkatnya.<ref name="Foley"/>
 
Linguis menggunakan istilah ''[[Variasi (linguistik)|variasi]]'' untuk mengacu pada cara-cara berbeda dalam berbicara suatu bahasa. Istilah ini mengikutkan [[dialek]] yang secara geografi atau sosialkultural dibentuk dan juga [[register (sociolinguistics)|jargon]] atau [[style shifting|gaya]] dari [[subkultur]].
Anthropologi linguistik dan sosiologi bahasa menjelaskan gaya komunikasi sebagai cara suatu bahasa digunakan dan dipahami dalam kultur tertentu.
<ref name="Foley">{{harvcoltxt|Foley|1997}}</ref>
 
Bahasa tidak hanya berbeda dalam pengucapan, kosa kata atau tatabahasa, tetapi juga berbeda dalam "kultur berbicara".
Beberapa kultur sebagai contohnya memiliki sistem yang rumit dalam "sosial [[deixis]]", sistem pemberian sinyal jarak sosial lewat makna linguistik.
<ref name="Foley 1997 p">{{harvcoltxt|Foley|1997|pp=311–28}}</ref>
Dalam bahasa Inggris, sosial deixis diperlihatkan biasanya lewat perbedaan dalam memanggil orang dengan nama pertama dan yang lain dengan nama keluarga, tetapi juga dengan gelar separti "Nyonya", "anak", "Doktor" atau "Yang Mulia", tatapi dalam bahasa lain sistem seperti ini bisa sangat kompleks dan dikodifikasi dalam tatabahasa dan kosa kata dari bahasa tersebut.
Misalnya, dalam beberapa bahasa di Asia timur, seperti [[bahasa Thai|Thai]], [[bahasa Burmese|Burma]] dan [[Jawa Kuno|jawa]], kata yang berbeda digunakan bergantung kepada apakah pembicara berbicara kepada seseorang yang lebih tinggi atau rendah tingkatnya dari dirinya sendiri dalam sebuah sistem tingkatan dimana binatang dan anak-anak berada di tingkat rendah dan dewa-dewi dan anggota kerajaan sebagai yang tertinggi. <ref name="Foley 1997 p"/>
 
=== Tulisan, literasi dan teknologi ===
{{main|Tulisan|Literasi}}
 
[[Image:Winnipeg Forks - Plains Cree Inscription.jpg|thumb|300px|Sebuah prasasti dari [[Bahasa Swampy Cree|Swampy Cree]] menggunakan [[Silabel Canadian Aboriginal]], [[abugida]] dikembangkan oleh misionari Kristen untuk bahasa Indigenous Canadian]]
 
Dalam sejarah sejumlah cara-cara berbeda dari merepresentasikan bahasa dalam media grafik telah ditemukan. Hal ini disebut [[sistem tulis]].
 
Penggunaan tulisan telah membuat bahasa lebih berguna bagi manusia. Ia membuat kita bisa menyimpan sejumlah besar informasi di luar tubuh manusia dan menerimanya kembali, dan ia membolehkan komunikasi antarjarak yang sebelumnya tidak mungkin.
Banyak bahasa secara konvensional memnggunakan jenis-jenis berbeda, gaya dan pencatatan dalam bahasa tulisan dan bicara, dan dalam beberapa komunitas, tulisan secara tradisional mengambil tempat bahasa yang berbeda daripada yang diucapkan.
Ada beberapa bukti bahwa penggunaan tulisan juga memiliki efek pada perkembangan kognitif pada manusia, mungkin karena mempelajari literasi secara umum membutuhkan pendidikan eksplisit dan [[pendidikan formal]].
<ref>{{harvcoltxt|Olson|1996}}</ref>
 
Penemuan sistem tulis pertama secara kasar bersamaan dengan permulaan dari [[Zaman Perunggu]] dalam akhir [[Neolitik]] dari akhir [[4 milenia SM]].
[[cuneiform (naskah)|naskah cuneiform]] [[Bahasa Sumeria|Sumeria]] purba dan [[Hiroglif Mesir]] secara umum dianggap sistem tulis paling awal, keduanya muncul dari sistem simbol proto-literasi nenek moyang dari 3400-3200 SM dengan tulisan koheren paling awal sekitar [[Abada 26 SM|2600 SM]].
Secara umum disetujui bahwa tulisan Sumeria adalah suatu penemuan independen; namun, diperdebatkan apakah tulisan orang Mesir dikembangkan penuh secara independen oleh orang Sumeria, atau karena [[difusi kultural]].
Debat yang sama juga ada pada [[naskah China]], yang dibuat sekitar [[1200 SM]].
[[Sistem tulis Mesoamerika]] [[pra-Kolombia]] (termasuk di antaranya [[Olmec]] dan [[Naskah Maya]]) secara umum dipercaya memiliki asal mula yang independen.
<ref name="Coulmas"/>
 
=== Perubahan Bahasa ===
 
{{main|Perubahan bahasa|Gramatikalisasi}}
 
[[image:Beowulf.firstpage.jpeg|thumb|right|200px|Halaman pertama dari puisi [[Beowulf]] ditulis dengan [[Inggris Tua]] pada periode pertengahan awal (800 - 1100 AD). Walaupun bahasa Inggris tua merupakan leluhur langsung dari bahasa Inggris modern perubahan telah menjadikannya tidak dapat dipahami bagi penutur bahasa Inggris kontemporer.]]
 
Semua bahasa berubah saat pembicara mengadopsi atau menemukan cara baru berbicara dan menyampaikannya ke anggota lain dari komunitas berbicara mereka.
Perubahan bahasa terjadi pada semua tingkat dari tingkat fonologis sampai pada tingkat kosa kata, morfologi, sintaks, dan diskursus.
Walaupun perubahan bahasa terkadang pada awalnya dinilai negatif oleh pembicara dari bahasa tersebut yang sering menganggap perubahan menjadi "merusak" atau sebagai suatu tanda penggunaan bahasa yang salah dari normal, hal tersebut adalah alami dan tidak terelakkan.
<ref>{{harvcoltxt|Aitchison|2001}}</ref><ref>{{harvcoltxt|Trask|1999|p=70}}</ref>
 
Perubahan bisa mempengaruhi suara-suara tertentu atau seluruh [[perubahan fonologis|sistem fonologis]].
[[Perubahan suara]] bisa terdiri dari penggantian dari suatu suara atau [[fitur pembeda|fitur fonetik]] oleh yang lain, atau suara yang dipengaruhi menjadi hilang, atau bahkan munculnya suara baru di tempat yang tadinya tidak ada.
Perubahan suara dapat ''dikondisikan'' di mana suatu suara berubah hanya jika ia terjadi dalam daerah sekitar dari suara-suara tertentu lainnya.
Perubahan suara biasanya dianggap ''biasa'', yang berarti ia diharapkan untuk diterapkan secara mekanis saat kondisi strukturalnya sesuai, terlepas dari faktor-faktor non-fonologis.
Di sisi lain, perubahan suara terkadang ''sporadik'', mempengaruhi hanya satu kata tertentu atau beberapa kata, tanpa ada kesamaan yang tampak.
Terkadang sebuah perubahan sederhana memicu suatu [[rantai pergeseran]] di mana seluruh sistem fonologis terpengaruhi.
Hal ini terjadi pada [[Bahasa Germanic]] saat perubahan suara yang dikenal dengan [[Hukum Grimm]] mempengaruhi semua stop konsonan dalam sistem.
Konsonan asli *{{PIE|bʰ}} menjadi /b/ dalam bahasa Jerman, dan yang sebelumnya *{{PIE|b}} berubah menjadi /p/ dan *{{PIE|p}} sebelumnya berubah menjadi /f/.
Proses yang sama berlaku untuk semua stop konsonan dan menjelaskan kenapa [[Bahasa Italic]] seperti Latin memiliki ''p'' dalam kata seperti '''''p'''atar'' dan '''''p'''isces sementara bahasa Germanic seperti Inggris memiliki '''''f'''ater '' dan '''''f'''ish''.
<ref>{{harvcoltxt|Clackson|2007|pp=27–33}}</ref>
 
Contoh lainnya adalah [[Pergeseran harakat besar]] dalam bahasa Inggris, yang merupakan alasan kenapa pengejaan harakat Inggris tidak berhubungan dengan pengucapannya sekarang, hal ini karena pergeseran harakat membawa ortografi yang telah mapan keluar dari sinkronisasi dengan pengucapannya.
Sumber lain dari perubahan suara adalah erosi dari kata-kata.
Perubahan jenis ini menyebabkan Latin ''mea domina'' menjadi [[Bahasa Prancis|Prancis]] ''madame]] dan Inggris Amerika ''ma'am''.
<ref>{{harvcoltxt|Aitchison|2001|p=112}}</ref>
 
Perubahan juga terjadi dalam tatabahasa dari bahasa pada pola-pola diskursus seperti [[idiom]] atau konstruksi tertentu menjadi [[gramatikalisasi]].
Hal ini sering terjadi saat kata atau morfem aus dan sistem gramatis secara tidak sadar menyusun ulang untuk mengganti elemen yang hilang.
Sebagai contoh dalam beberapa ragam dari [[Spanyol Carribean]] di mana kata final /s/ telah menghilang.
Karena [[Standar Spanyol]] menggunakan /s/ akhir adalah morfem penanda [[orang kedua]] subjek "anda" pada kata kerja, variasi Carribean sekarang harus mengekspresikan orang kedua menggunaan kata ganti ''tú''.
Hal ini berarti kalimat "Nama anda siapa" adalah ''¿como te llamas?'' {{ipa|['komo te 'jamas]}} di Standar Spanyol, tapi {{ipa|['komo 'tu te 'jama]}} di Spanyol Carribean.
Perubahan suara sederhana telah mempengaruhi morfologi dan sintaks.
<ref>{{harvcoltxt|Zentella|2002|p=178}}</ref>
Penyebab utama lainnya dari perubahan tata-bahasa adalah kebakuan bertahap dari idiom-idiom menjadi bentuk-bentuk tata-bahasa baru, contohnya cara dalam bahasa Inggris konstruksi "going to" hilang aspek penggunaannya dan dalam suatu variasi bahasa Inggris hampir menjadi kalimat baku masa depan (yaitu ''I'm gonna'').
 
Perubahan bahasa bisa disebabkan oleh faktor-faktor "internal bahasa", seperti perubahan dalam pengucapan dimotivasi oleh suara-suara tertentu sangat susah untuk dibedakan secara audi atau untuk diucapkan, atau karena pola-pola tertentu dari perubahan yang menyebabkan tipe-tipe langka tertentu dari konstruksi menjadi [[Pergeseran (linguistik)|bergeser]] ke arah tipe-tipe yang lebih umum.
<ref>{{harvcoltxt|Labov|1994}}</ref>
Penyebab lain dari perubahan bahasa adalah sosial, seperti saat pengucapan tertentu menjadi bersifat lambang dari keanggotan dari kelompok tertentu, seperti kelas-kelas sosial, atau dengan [[Ideologi Bahasa|ideologi-ideologi]], dan oleh karenanya diadopsi oleh mereka yang ingin diidentifikasi dengan kelompok atau ide tersebut.
Dengan cara ini permasalahan identitas dan politik bisa memiliki efek mendalam dalam struktur bahasa.
<ref>{{harvcoltxt|Labov|2001}}</ref>
 
=== Kontak bahasa ===
{{main|Kontak bahasa|Pijin|Bahasa Kreol|Sprachbund}}
 
Salah satu sumber penting dari perubahan bahasa adalah kontak antara bahasa-bahasa berbeda dan menghasilkan [[difusi trans-kultur|difusi]] dari sifat-sifat linguistik antara bahasa.
Kontak bahasa terjadi saat pembicara dari dua atau lebih [[bahasa]] atau [[Variasi (linguistik)|variasi]] berinteraksi secara regular.
<ref>{{harvcoltxt|Thomason|2001|p=1}}</ref>
[[Multilingualisme]] mungkin telah menjadi hal yang normal dalam [[sejarah manusia]], dan sekarang kebanyakan manusia di dunia adalah multilingual.
Sebelum munculnya konsep [[Negara-bagian|negara ethno-nasional]], monolingualisme dikarakterkan umumnya dari populasi yang menghuni pulau-pulau kecil.
Tapi dengan ideologi yang membuat satu masyarakat, satu negara dan satu bahasa perubahan politik yang diinginkan mulai menyebar lewat dunia.
Namun hanya ada sekitar 250 negara di dunia bersamaan dengan sekitar 6000 bahasa, jadi kebanyakan negara adalah multilingual dan kebanyakan bahasa maka ada karena kontak dekat dengan bahasa lainnya.
<ref>{{harvcoltxt|Romaine|2001|p=513}}</ref>
 
Saat pembicara dari bahasa berbeda berinteraksi secara dekat, bahasa mereka biasanya mempengaruhi satu sama lain.
Selama kontak bahasa terjaga terus-menerus selama periode waktu yang lama sifat-sifat linguistik bergabung antara bahasa, dan bahasa-bahasa yang tadinya dari rumpun yang berbeda bisa menyatu menjadi lebih mirip.
Dalam wilayah di mana banyak bahasa berada pada kontak dekat hal ini bisa mengarah pada formasi dari [[Sprachbund|Wilayah bahasa]] di mana bahasa yang tidak berhubungan berbagi sejumlah fitur-fitur linguistik.
Jumlah dari wilayah bahasa telah dicatat, di antaranya: [[Wilayah bahasa Balkan]], [[Wilayah bahasa Mesoamerika]], dan [[Wilayah bahasa Ethiopia]].
Juga wilayah besar seperti [[Asia Selatan]], Eropa dan Asia Tenggara terkadang dianggap wilayah bahasa, karena persebaran difusi dari [[fitur areal (linguistik)|fitur areal]] tertentu.
<ref>{{harvcoltxt|Campbell|2002}}</ref><ref>{{harvcoltxt|Aikhenvald|2001}}</ref>
 
Kontak bahasa juga bisa menyebabkan suatu variasi dari fenomena linguistik lain, termasuk [[konvergensi bahasa]], [[loanword|pinjaman]], dan [[releksifikasi]] (penggantian dari kosa kata asli dengan bahasa lain).
Dalam situasi ekstrim dan terus-menerus kontak bahasa bisa menyebabkan pada formasi dari [[bahasa campuran]] baru yang tidak dapat dianggap termasuk pada satu rummpun bahasa.
Salah satu tipe dari bahasa campuran disebut [[pijin]] terjadi saat pembicara dewasas dari dua bahasa berbeda berinteraksi secara teratur, tapi dalam suatu situasi di mana tidak ada kelompok yang belajar untuk berbicara bahasa dari kelompok lainnya secara fasih.
Pada kasus ini mereka terkadang akan membentuk suatu bentuk komunikasi yang memiliki sifat-sifat dari kedua bahasa, tapi dengan tata-bahasa dan struktur fonologis yang disederhanakan, bahasa tersebut muncul umumnya terdiri dari kategori-kategori tata-bahasa dan fonologis seperti orang yag memiliki bahasa lain sebagai bahasa pertamanya.
Tapi jika sebuah bahasa Pijin menjadi bahasa utama dari suatu komunitas, maka nantinya anak-naka mereka akan tumbuh mempelajari pijin sebagai bahasa pertama mereka.
Saat generasi dari anak-anak tersebut tumbuh, pijin terkadang akan tampak berubah strukturnya dan memperoleh tingkat kompleksitas yang tinggi.
Tipe bahasa ini disebut dengan [[bahasa kreol]].
Contoh dari bahasa campuran adalah [[Tok Pisin]] bahasa resmi dari [[Papua New-Guinea]] yang awalnya muncul sebagai Pijin berdasarkan bahasa Inggris dan [[Bahasa Austronesian]]; contoh lainnya yaitu [[Haitian Kreol|Kreyòl ayisyen]] bahasa kreol berbasiskan Prancis yang digunakan di [[Haiti]], dan [[Bahasa Michif|Michif]], bahasa campuran di Kanada, berdasarkan pada bahasa Natif Amerika [[Bahasa Cree|Cree]] dan Prancis.
<ref>{{harvcoltxt|Thomason|Kaufman|1988}}; {{harvcoltxt|Thomason|2001}}</ref>
<ref>{{harvcoltxt|Matras|Bakker|2003}}</ref>
 
== Keberagaman linguistik ==
 
{{See also|Daftar bahasa|Daftar bahasa berdasarkan jumlah pembicara]}}
 
{| class="wikitable" style="width: 200px; height: 200px; float: right"
|-
! Bahasa !! Penutur asli<br>(dalam jutaan)<ref name="Ethnologue"/>
|-
|[[Cina Mandarin|Mandarin]]||845
|-
|[[Bahasa Spanyol|Spanyol]]||329<ref>Perhitungan Ethnologue didasarkan pada jumlah sebelum 1995. Perhitungan yang terbaru adalah 420 juta ({{cite web|title=Primer estudio conjunto del Instituto Cervantes y el British Council sobre el peso internacional del español y del inglés|publisher=Instituto Cervantes (www.cervantes.es)|url=http://www.cervantes.es/sobre_instituto_cervantes/prensa/2012/noticias/nota-londres-palabra-por-palabra.htm}})</ref>
|-
|[[Bahasa Inggris|Inggris]]||328
|-
|[[Bahasa Arab]]||221
|-
|[[Bahasa Hindi|Hindi]]|| 182
|-
|[[Bahasa Bengali|Bengali]]||181
|-
|[[Bahasa Portugis|Portugis]]||178
|-
|[[Bahasa Rusia|Rusia]]||144
|-
|[[Bahasa Jepang|Jepang]]||122
|-
|[[Bahasa Jerman|Jerman]]||90,3
|}
 
"Bahasa hidup" sederhananya adalah bahasa yang secara luas digunakan sebagai bentuk komunikasi utama oleh kelompok tertentu dari masyarakat.
Jumlah pasti dari bahasa hidup beragam dari 6.000 sampai 7.000, bergantung kepada presisi dari definisi seseorang tentang "bahasa", dan terutama tentang bagaimana seseorang membedakan antara bahasa dan [[dialek]].
Pada tahun 2009, [[SIL ethnologue]] mengkatalogkan 6909 bahasa hidup manusia.<ref name="Ethnologue"/>
Ethnologue mendirikan grup linguistik untuk mempelajari [[kejelasan mutual]], dan makanya terkadang mengikutkan lebih banyak kategori-kategori daripada klasifikasi konservatif.
Sebagai contohnya [[Bahasa Denmark]] yang banyak ahli menganggap sebagai bahasa tunggal dengan beberapa dialek, dikelompokkan sebagai tiga bahasa berbeda oleh Ethnologue.
<ref name="Ethnologue"/>
 
Ethnologue terkadang juga dikritik karena menggunakan data kumulatif yang dikumpulkan selama beberapa dekade, yang berarti bahwa jumlah pasti dari penutur seringkali kedaluwarsa, dan beberapa bahasa diklasifikasikan sebagai hidup mungkin telah menjadi punah.
Menurut Ethnologue 389 (atau hampir 6%) bahasa memiliki lebih dari sejuta penutur.
Bahasa-bahasa tersebut bersama mencatat sekitar 94% dari populasi dunia, sebaliknya 94% dari bahasa dunia digunakan oleh 6% dari populasi golbal.
Di sebelah kanan adalah tabel dari 10 bahasa paling banyak dituturkan didunia dengan populasi diestimasi dari Ethnologue (perhitungan tahun 2009).<ref name="Ethnologue">{{Harvcoltxt|Lewis|2009}}</ref>
 
=== Bahasa dan dialek ===
 
Tidak ada perbedaan jelas antara sebuah bahasa dan sebuah [[dialek]], meskpun sebuah [[aforisme]] terkenal diatribusikan pada linguis [[Max Weinreich]] bahwa "[[sebuah bahasa adalah sebuah dialek dengan angkatan darat dan angkatan laut]]".
<ref name="5 minute linguist">
{{cite web
|last=Rickerson
|first=E.M.
|title=What's the difference between dialect and language?
|url=http://spinner.cofc.edu/linguist/archives/2005/08/whats_the_diffe.html?referrer=webcluster&
|work=The Five Minute Linguist
|publisher=College of Charleston
|accessdate=17 July 2011
}}</ref>
Contohnya, perbatasan negara seringkali menimpa perbedaan linguistik dalam menentukan apakah dua ragam linguistik adalah bahasa atau dialek.
[[Bahasa Kanton]] dan [[Bahasa Mandarin]] sebagai contohnya dikelompokkan seban "dialek" dari Cina, walaupun mereka lebih berbeda satu sama lain daripada [[Bahasa Swedia]] adalah dari [[Bahasa Norwegia]].
Sebelum [[perang sipil Yugoslavia]], [[Bahasa Serbia-Kroasia]] dianggap sebuah bahasa tunggal dengan dua dialek, tapi sekarang [[Bahasa Kroasia]] dan [[Bahasa Serbia]] dianggap bahasa berbeda, dan menggunakan sistem tulis yang berbeda.
Dengan kata lain, perbedaannya bisa saja tergantung pada pertimbangan politik seperti halnya pada perbedaan kultural, perbedaan [[sistem tulis]], atau tingkat dari [[Kejelasan mutual]].
<ref>{{harvcoltxt|Lyons|1981|p=26}}</ref>
 
=== Rumpun bahasa di Dunia ===
 
{{Main|Rumpun bahasa|dialektologi|Linguistik Historis|Daftar rumpun bahasa}}
 
[[File:Languengl.gif|550px|thumb|Rumpun bahasa utama di dunia (dan pada beberapa kasus kelompok geografis dari rumpun-rumpun). Untuk rincian lebih lanjut, lihat ''[[:Templat:Distribusi bahasa di dunia|Distribusi bahasa di dunia]]''.]]
 
Bahasa-bahasa di dunia dapat dikelompokan menjadi [[rumpun bahasa]] mencakup bahasa-bahasa yang dapat diperlihat memiliki leluhur yang sama.
Linguis saat ini mengenali ratusan rumpun bahasa, walau beberapa dari mereka dapat dikelompokan menjadi unit lebih besar bila lebih banyak bukti di dapat dan dipelajari lebih dalam.
Saat sekarang ada lusinan [[bahasa terisolasi]] -- bahasa yang tidak dapat diperlihatkan berelasi dengan bahasa lain di dunia. Di antaranya adlah [[Bahasa Basque|Basque]], dituturkan di Eropa, [[Bahasa Zuni|Zuni]] di [[New Mexico]], [[Bahasa Purépecha|P'urhépecha]] di Mexico, [[Bahasa Ainu|Ainu]] di Jepang, [[Bahasa Burushaski|Burushaski]] di [[Pakistan]] dan banyak lainnya.
 
Rumpun bahasa di dunia yang memiliki jumlah penutur paling banyak adalah [[Bahasa Indo-Eropa]], dituturkan oleh 46% dari populasi dunia.
Rumpun ini mengikutkan bahasa utama dunia seperti [[Bahasa Inggris|Inggris]], [[Bahasa Spanyol]], [[Bahasa Rusia]] dan [[Bahasa Hindi]]/[[Bahasa Urdu]].
Rumpun bahasa Indo-Eropa mencapai pemerataan pertama selama [[Periode Migrasi]] [[Eurasia]] (400-800 AD), dan diteruskan lewat [[Sejarah kolonialisme|ekspansi kolonial Eropa]] yang membawa bahasa Indo-Eropa ke posisi dominan secara politik dan terkadang jumlah di [[Amerika]] dan sebagian [[Afrika]].
[[Bahasa Sino-Tibetan]] dituturkan oleh 21% populasi dunia dan mengikutkan banyak bahasa dari Asia Timur termasuk [[Cina Mandarin]], [[Bahasa Kanton]], dan ratusan bahasa-bahasa kecil.
 
[[Afrika]] adalah rumah bagi sejumlah besar rumpun bahasa, yang terbesar yaitu [[Bahasa Niger-Kongo]] yang mengikutkan bahasa seperti [[Bahasa Swahili]], [[Bahasa Shona]] dan [[Bahasa Yoruba]].
Penutur dari bahasa Niger-Kongo terhitung 6,4% dari populasi dunia.
Jumlah orang yang sama juga menuturkan [[Bahasa Afroasiatik]], yang mengikutkan [[Bahasa Semitik]] seperti [[Bahasa Arab]], [[Bahasa Hebrew]] dan bahasa-bahasa di wilayah [[Sahara]] seperti [[Bahasa Berber]] dan [[Bahasa Hausa]].
 
[[Bahasa Austronesian]] dituturkan oleh 5,9% populasi dunia dan membentang dari [[Madagaskar]] sampai [[Asia Tenggara Laut]] mencapai [[Oseania]].
Ia mengikutkan beberapa bahasa seperti [[Bahasa Malagsy]], [[Bahasa Maori]], [[Bahasa Samoan]], dan banyak bahasa pribumi di [[Indonesia]] dan [[Bahasa Formosan|Taiwan]].
Bahasa Austronesian dianggap berasal dari Taiwan sekitar 3000 SM, dan tersebar lewat wilayah Oseanik lewat perpindahan-pulau, berdasarkan pada tingkat kemajuan teknologi kelautan.
Rumpun bahasa padat lainnya adalah [[Bahasa Dravidian]] dari [[Asia Selatan]] (di antaranya [[Bahasa Tamil]] dan [[Bahasa Telugu]]), [[Bahasa Turkic]] dari Asia Tengah (seperti [[Bahasa Turki]]), dan [[Bahasa Austro-Asiatic]] (di antaranya [[Bahasa Khmer]]) dan [[Bahasa Tai-Kadai]] dari [[Asia Tenggara]] (termasuk [[Bahasa Thai]]).
<ref>{{harvcoltxt|Katzner|1999}}; {{harvcoltxt|Comrie|2009}}; {{harvcoltxt|Brown|Ogilvie|2008}}</ref>
 
Area di dunia yang memiliki keberagaman linguistik tertinggi seperti Amerika, [[Papua-New Guinea]], [[Afrika Barat]] dan Asia-Selatan memiliki raturan rumpun bahasa kecil.
Di Amerika beberapa rumpun bahasa besar termasuk [[Bahasa Quechumaran]], [[Bahasa Arawak]], dan rumpun [[Bahasa Tupi-Guarani]] dari Amerika Selatan, [[Bahasa Uto-Aztecan]], [[Bahasa Oto-Manguean]], [[Bahasa Mayan]] dari [[Mesoamerica]], dan [[Bahasa Na-Dene]] dan [[Bahasa Algonquian]] rumpun bahasa dari [[Amerika Utara]].
Di Australia, kebanyakan bahasa pribumi termasuk pada rumpun [[Bahasa Pama-Nyungan]], walaupun Papua-New Guinea adalah rumah bagi sejumlah besar rumpun bahasa kecil dan terisolasi, sebagaimana juga sejumlah bahasa Austronesian.
<ref>{{harvcoltxt|Katzner|1999}}; {{harvcoltxt|Comrie|2009}}; {{harvcoltxt|Brown|Ogilvie|2008}}</ref>
 
=== Kepunahan bahasa ===
{{main|Bahasa langka|Bahasa hilang|Pergeseran bahasa|Bahasa mati|}}
 
[[File:Linguistic diversity.png|550px|thumb|Bersama, delapan negara dengan warna merah terdiri dari 50% dari bahasa dunia. Area warna biru adalah yang paling beragam secara linguistik di dunia, dan lokasi dari bahasa paling terancam punah di dunia.]]
 
[[Bahasa langka|Hampir punahnya bahasa]] terjadi bila sebuah bahasa berada pada resiko tidak digunakan lagi bila penuturnya meninggal atau [[pergeseran bahasa|bergeser]] menggunakan bahasa lain.
[[Bahasa hilang]] terjadi saat bahasa tersebut tidak memiliki penutur asli, dan menjadi sebuah ''[[bahasa mati]]''.
Jika kemudian tidak ada lagi yang menuturkan bahasa tersebut, ia menjadi ''[[bahasa punah]]''.
Walau bahasa selalu menjadi punah selama sejarah manusia, sekarang mereka menghilang dengan laju semakin cepat dikarenakan proses-proses dari [[globalisasi]] dan [[neo-kolonialisme]], di mana bahasa dengan kekuatan ekonomi mendominasi bahasa lainnya.
<ref name="Handbook"/>
 
Semakin bahasa yang secara umum dituturkan mendominasi bahasa yang jarang dituturkan dan maka, bahasa yang jarang dituturkan nantinya akan menghilang dari populasi.
Jumlah total dari bahasa di dunia tidak diketahui.
Estimasinya beragam bergantung kepada banyak faktor.
Konsensus umum adalah sekitar 6.000 <ref name="Moseley"/>
dan 7.000 bahasa yang sekarang dituturkan, dan antara 50-90% dari mereka akan menjadi punah pada tahun 2100.
<ref name="Handbook"/>
[[Daftar bahasa berdasar jumlah penutur asli|20 Bahasa teratas]] dituturkan oleh lebih dari 50 juta penutur masing-masingnya, dituturkan oleh 50% populasi dunia, walaupun banyak dari bahasa-bahasa lain yang dituturkan oleh komunitas yang lebih kecil, kebanyakan mereka kurang dari 10.000 penutur.
<ref name="Handbook"/>
 
[[UNESCO|United Nations Educational, Scientific and Cultural Organization]] bergerak dengan lima tingkat dari bahasa yang terancam punah: "aman", "rentan" (tidak dituturkan oleh anak di luar rumah), "pasti punah" (tidak dituturkan oleh anak), "punah parah" (hanya dituturkan oleh generasi tua), "langka kritis" (dituturkan oleh beberapa anggota dari generasi tua, terkadang [[semi-tutur]]).
Meskipun klaim bahwa dunia akan lebih baik bila semuanya menggunakan sebuah bahasa utama ''[[lingua franca]]'' seperti bahasa Inggris atau [[Esperanto]], ada suatu konsensus umum bahwa hilangnya bahasa melukai keberagaman kultural dari dunia.
Adalah kepercayaan umum, merujuk kembali pada narasi alkitab dari [[Menara babel]] bahwa keberagaman bahasa menyebabkan konflik politik,
<ref name="Haugen">{{harvcoltxt|Haugen|1973}}</ref>
tapi kepercayaan ini kontradiksi dengan fakta bahwa banyak episode-episode kekerasan utama dunia terjadi di situasi dengan keberagaman linguistik yang rendah seperti [[Perang Yugoslav|Yugoslavia]] dan [[Perang Sipil Amerika]], atau genosida oleh [[Jerman Nazi]] dan [[Rwanda]], meskipun kebanyakan unit-unit politik yang stabil telah sangat multilingual.
<ref>{{Harvcoltxt|Austin|Sallabank|2011|pp=10–11}}</ref>
 
Banyak proyek-proyek sedang berjalan bertujuan untuk membantu mencegah atau memperlambat kehilangan tersebut dengan [[revitalisasi bahasa|merevitalisasi]] bahasa yang terancam penuh dan mempromosikan edukasi dan literasi terhadap bahasa-bahasa minoritas.
Di seluruh dunia banyak negara telah memberlakukan [[Aturan Bahasa|perundang-undangan tertentu]] yang ditujukan untuk melindungi dan menstabilkan bahasa pribumi dari [[komunitas bahasa]].
Minoritas linguis telah berargumen bahwa kehilangan bahasa adalah proses alami yang seharusnya tidak dinetralisir, dan dengan mendokumentasikan bahasa yang terancam punah demi keturunan sudah cukup.
<ref>{{harvcoltxt|Ladefoged|1992}}</ref>-->
 
== Lihat juga ==
* [[Bahasa Melayu]]
* [[Senarai bahasa bahasa di dunia]]
* [[BAHASA]]
 
== Pautan luar Rujukan==
{{reflist}}
 
{{Commons|Language}}
* [https://www.wisdomlib.org/hinduism/book/the-natyashastra/d/doc210088.html Kaedah penggunaan Bahasa (bhāṣā)], Bab XVIII Nāṭyaśāstra
{{Authority control}}
[[Kategori:Perkataan dan frasa Sanskrit]]
[[Kategori:PagesBahasa| with unreviewed translations]]