Mengapa Bahasa Terbentuk
Bahasa sebagai produk evolusi, kognisi, dan kultur — dari mana asalnya, bagaimana otak memprosesnya, dan apa hubungannya dengan kecerdasan buatan modern.
From: LLM Wiki URL: llm-wiki.pages.dev/concepts/mengapa-bahasa-terbentuk Created: June 20, 2026 Updated: June 20, 2026 Read time: 30 min
Bahasa adalah salah satu fenomena paling misterius di alam semesta. Tidak ada spesies lain di Bumi — termasuk simpanse yang DNA-nya 98,7% identik dengan kita — yang memiliki sistem komunikasi dengan kompleksitas, rekursi, dan produktivitas tak terbatas seperti bahasa manusia. Pertanyaan “mengapa bahasa itu terbentuk” telah dijawab oleh banyak tradisi — dari mitologi (Menara Babel dalam Alkitab), filsafat (Plato认为 bahasa adalah cerminan realitas), hingga sains modern (Chomsky, Pinker, Fitch).
Artikel ini mengupas jawaban sains modern: bahasa muncul dari interaksi 7 juta tahun evolusi hominid, ratusan ribu tahun kultur, dan kemampuan kognitif unik manusia. Tiga faktor utama yang biasanya disepakati para ahli:
- Tekanan sosial — untuk维系 ikatan dalam kelompok yang semakin besar (Robin Dunbar: bahasa berevolusi dari “grooming” primata)
- Tekanan biologis — gen FOXP2, area Broca, tulang hyoid yang memungkinkan artikulasi
- Tekanan kognitif — teori pikiran, working memory, dan kemampuan untuk memikirkan pikiran orang lain
Pertanyaan yang lebih menarik justru muncul di 2020-an: apakah Large Language Models yang belajar dari teks statistik bisa memahami bahasa? Studi-studi emergent communication menunjukkan bahwa agen AI bisa mengembangkan “bahasa” mereka sendiri melalui permainan koordinasi. Ini menantang asumsi bahwa bahasa harus innate.
“Language is a window into human nature.” — Steven Pinker, The Language Instinct (1994)
“The faculty of language is likely to have emerged quite recently in evolutionary terms, some 70,000–100,000 years ago.” — Noam Chomsky (2014)
“Language is a perfect example of the kind of complex system that natural selection is good at building.” — Steven Pinker & Paul Bloom (1990)
Bahasa: Definisi dan Ciri Khas
Definisi bahasa
Tidak ada satu definisi tunggal yang disepakati semua ahli. Berikut beberapa definisi kunci:
- Edward Sapir (1921): “Bahasa adalah metode eksklusif manusia yang secara instingtif muncul untuk mengomunikasikan ide, emosi, dan keinginan melalui sistem simbol yang diproduksi secara sukarela.”
- Noam Chomsky (1957): Bahasa adalah “tata bahasa bawaan” — kemampuan generatif yang memungkinkan penutur menghasilkan kalimat yang belum pernah didengar.
- Charles Hockett (1960): Bahasa adalah sistem komunikasi dengan 13 design features (lihat bagian tersendiri).
- Steven Pinker (1994): Bahasa adalah “instinct” — kemampuan biologis yang terinstal secara evolusioner, seperti naluri burung bermigrasi.
- David Crystal (1997): Bahasa adalah “ekspresi pikiran melalui suara-suara dan simbol-simbol yang digunakan oleh anggota komunitas bahasa tertentu untuk saling berkomunikasi.”
Bahasa vs komunikasi
Komunikasi adalah fenomena universal di dunia hewan — semua spesies sosial punya cara untuk memberi sinyal. Yang membuat bahasa manusia unik adalah:
- Rekurensi — kemampuan menggabungkan klausa menjadi klausa tanpa batas (“Kucing yang menangkap tikus yang mencuri keju yang dibuat oleh…”)
- Produktivitas — kemampuan menghasilkan kalimat yang belum pernah didengar atau diucapkan
- Displacement — kemampuan membicarakan hal yang tidak ada di sini/sekarang
- Arbitrariness — hubungan antara bunyi (signifier) dan makna (signified) adalah konvensi, bukan alami
- Duality of patterning — bunyi bermakna yang digabungkan menjadi kata yang lebih bermakna
- Cultural transmission — bahasa ditransmisikan secara kultural, bukan genetik
Bahasa sebagai fenomena digital
Pada 2020-an, bahasa menjadi fenomena digital. Teks digital — email, pesan singkat, posting media sosial, artikel wiki — menjadi habitat baru bahasa. Large Language Models belajar dari habitat digital ini, dan mereka menunjukkan kemampuan linguistik yang sebelumnya dianggap mustahil untuk mesin. Apakah mereka benar-benar “mengerti” bahasa, atau hanya memanipulasi simbol? Ini adalah salah satu perdebatan terbesar di AI Agent modern.
Ciri-ciri Unik Bahasa: Design Features (Charles Hockett)
Pada 1960, Charles Hockett merumuskan 13 design features yang membedakan bahasa manusia dari sistem komunikasi hewan lain. Hockett awalnya percaya bahwa 9 fitur pertama juga dimiliki primata non-manusia (khususnya gibbon), sementara 4 fitur terakhir hanya dimiliki manusia.
9 fitur yang juga dimiliki primata
- Vocal-auditory channel — bahasa menggunakan suara di udara (bukan gesture, jejak, atau listrik)
- Rapid fading — sinyal cepat hilang setelah dipancarkan (bandingkan tulisan yang permanen)
- Broadcast transmission dan directional reception — suara bisa terdengar ke segala arah, tapi bisa juga dilokalisasi sumbernya
- Interchangeability — penutur dan pendengar bisa saling bertukar peran
- Total feedback — penutur mendengar apa yang dia ucapkan
- Specialization — sinyal bahasa tidak memiliki fungsi biologis lain (bandingkan panting anjing)
- Semanticity — sinyal membawa makna
- Arbitrariness — hubungan bunyi-makna adalah konvensi (kata “kucing” tidak ada hubungannya dengan kucing)
- Discreteness — bahasa terdiri dari unit diskrit (fonem, morfem) yang bisa dibedakan kategorial
4 fitur yang hanya dimiliki manusia
- Displacement — bisa membicarakan hal yang jauh secara ruang atau waktu (“Kemarin di Tokyo…”)
- Productivity — bisa menghasilkan kalimat yang belum pernah ada
- Cultural transmission — bahasa diturunkan secara kultural, bukan genetik
- Duality of patterning — bunyi bermakna yang tak bermakna sendiri (fonem) digabung menjadi unit yang bermakna (morfem) yang digabung menjadi kalimat
3 fitur tambahan (ditambahkan Hockett di kemudian hari)
- Prevarication (kebohongan) — kemampuan berbohong (“anjing itu tidak menggigit saya”)
- Reflexiveness — bahasa bisa membicarakan dirinya sendiri (“Kata ‘anjing’ terdiri dari 5 huruf”)
- Learnability — bahasa bisa dipelajari oleh anak tanpa instruksi formal
Kritik terhadap Hockett
Kajian modern (termasuk Raviv & colleagues 2015) mengkritik Hockett bahwa fokus pada komunikasi (bukan kognisi) menyesatkan. Banyak fitur komunikasi juga ada pada lebah (tarian waggle), kera, dan burung. Yang membuat bahasa manusia unik bukan fitur komunikasinya, tapi kontennya — pikiran, konsep, dan niat di baliknya.
Teori Asal-Usul Bahasa
Teori Ilahi (Divine Theory)
Dalam banyak tradisi agama, bahasa adalah pemberian dari makhluk ilahi. Contoh terkenal:
- Alkitab (Perjanjian Lama): Tuhan mengajarkan Adam nama-nama semua binatang (Kejadian 2:19-20). Ini mengimplikasikan bahasa adalah ciptaan, bukan evolusi.
- Kisah Menara Babel (Kejadian 11:1-9): Awalnya semua manusia berbicara satu bahasa, lalu Tuhan membingungkan bahasa mereka untuk menghentikan pembangunan Menara Babel. Ini menjadi salah satu mitos asal-mula “keragaman bahasa” di banyak budaya.
- Tradisi Hindu (Veda): Bahasa (Vāc) adalah dewi yang muncul saat penciptaan.
- Mitologi Yunani: Hermes memberikan bahasa kepada manusia sebagai alat kebohongan dan perdagangan.
- Mitologi Norse: Odin memperoleh “rune” (tulisan) dari pengorbanan dirinya sendiri.
Teori ilahi ini tidak ilmiah, tapi tetap penting secara historis dan budaya. Dalam tradisi Islam, misalnya, bahasa Arab sering dianggap “bahasa surgawi” (lisan al-daraj).
Teori Alam (Natural Sound Theories)
Sekelompok teori dari abad ke-19 yang mencoba menjelaskan bahasa sebagai tiruan dari bunyi alam:
- Bow-wow theory (Max Müller): Bahasa berasal dari tiruan suara alam. Kata “ayam” berasal dari suara ayam, kata “gong” dari suara gong. Kritik: kebanyakan kata bahasa tidak onomatope.
- Pooh-pooh theory: Bahasa berasal dari ekspresi emosional spontan — desahan, teriakan, tangisan yang kemudian dikonvensi. Kata “aduh”, “astaga”, “duh” adalah contoh modern.
- Ding-dong theory (Max Müller juga): Ada resonansi harmonis antara bunyi dan makna — bunyi [m] dan [n] cocok untuk konsep “ini” atau “di sini”, bunyi [i] dan [u] untuk hal kecil. Kritik: tidak ada bukti ilmiah untuk klaim ini.
- Yo-he-ho theory (Ludwig Noire, 1857): Bahasa berasal dari kerja fisik komunal — ritme teriakan pekerja yang bergantian untuk mengangkat batu. Bahasa berevolusi dari work songs. Ini yang paling masuk akal dari keempatnya.
Teori Gestural (Gestural Origin)
Salah satu teori tertua dan paling kredibel: bahasa dimulai dari gesture, bukan suara.
- Quintus Ennius (~200 SM) sudah mencatat: “He who cannot talk, makes himself understood with his hand.”
- Gordon Hewes (1973) mengemukakan bahwa bahasa primitif adalah sistem gestural karena tangan lebih terkontrol daripada pita suara.
- Michael Corballis (From Hand to Mouth, 2002): Bahasa berevolusi dari sistem mirror neuron (neuron cermin) yang digunakan untuk meniru gesture. Cikal bakal bahasa adalah gesture pantomimik — isyarat yang meniru seluruh tubuh.
- Mirror neurons (Rizzolatti et al., 1996): Neuron di area F5 monyet (homolog dengan area Broca pada manusia) aktif baik saat monyet melakukan tindakan maupun saat melihat monyet lain melakukannya. Ini dasar untuk imitasi dan pemahaman tindakan orang lain — dua kemampuan prasyarat bahasa.
Bukti mendukung teori gestural: bahasa isyarat (sign language) sepenuhnya kompleks dan naturalistik, menunjukkan bahwa bahasa tidak harus vokal. Lebih lanjut, anak-anak yang belajar bahasa isyarat memiliki perkembangan bahasa yang sama dengan anak-anak yang belajar bahasa lisan.
Teori Sosial (Social Theory)
Bahasa berevolusi untuk memenuhi kebutuhan sosial — bukan untuk mengeskpresikan pikiran individual, tapi untuk berkoordinasi dalam kelompok.
- Vygotsky (1934): Bahasa adalah alat mediasi sosial. Anak-anak pertama-tama belajar bahasa sebagai alat sosial (berkomunikasi dengan orang lain), dan baru kemudian menginternalisasikannya sebagai alat berpikir (Vygotsky 1934: “development of logic in the child… is a direct function of his socialized speech”).
- Zone of Proximal Development (ZPD): Vygotsky menunjukkan bahwa anak-anak belajar lebih baik ketika mereka dibantu oleh orang yang lebih mampu, melalui bahasa. Ini mengimplikasikan bahasa adalah alat pedagogis sebelum menjadi alat berpikir.
- Michael Tomasello (Constructing a Language, 2003): Bahasa muncul dari shared intentionality — kemampuan unik manusia untuk bekerja sama dalam pursuit tujuan bersama. Simpanse pintar, tapi tidak punya shared intentionality.
Teori Gossip dan Bonding Sosial (Robin Dunbar)
Salah satu teori sosial paling terkenal:
- Robin Dunbar (Grooming, Gossip and the Evolution of Language, 1996): Bahasa berevolusi dari grooming primata. Primata lain维系 social bonds dengan saling grooming, tapi grooming membutuhkan waktu yang tidak scalable.
- Angka 150 (Dunbar’s number): Ukuran kelompok sosial manusia adalah ~150 individu — berasal dari korelasi linear antara ukuran neokorteks dan ukuran kelompok pada primata.
- Perhitungan Dunbar: Untuk维系 kelompok 150 individu dengan grooming satu-satu, manusia primitif perlu menghabiskan 40% waktu mereka untuk grooming — secara fisik tidak mungkin.
- Solusi: Bahasa — “vocal grooming” yang memungkinkan beberapa individu diikat sekaligus, dengan tangan bebas untuk aktivitas lain. Bahasa awalnya adalah gossip — pertukaran informasi sosial tentang siapa yang bisa dipercaya, siapa yang curang, siapa yang menikah dengan siapa.
“For early humans, grooming as a way to social success posed a problem: given their large social groups of 150 or so, our earliest ancestors would have had to spend almost half their time grooming one another—an impossible burden. What Dunbar suggests… is that humans developed language to serve the same purpose, but far more efficiently.” — Harvard University Press
Studi observasi modern mendukung: ~2/3 percakapan manusia adalah tentang informasi sosial (gossip), bukan tentang hunting, makanan, atau predator. Ini mengimplikasikan fungsi sosial bahasa adalah yang paling penting.
Teori Adaptif / Evolusioner
Charles Darwin (1871, The Descent of Man) sudah berteori bahwa bahasa berevolusi melalui seleksi alam. Tapi baru pada 1990, Pinker & Bloom (Behavioral and Brain Sciences) memberikan argumen yang kuat.
- Pinker & Bloom (1990): Bahasa adalah adaptasi (adaptation) — fitur biologis yang berevolusi karena meningkatkan fitness, bukan spandrel (efek samping dari adaptasi lain).
- Adaptation vs spandrel: Gould & Lewontin (1979) berargumen bahwa banyak fitur biologis adalah “spandrel” — efek samping dari fitur lain. Chomsky menerima bahwa bahasa mungkin spandrel, tapi Pinker & Bloom berargumen bahasa terlalu kompleks dan spesifik untuk menjadi spandrel.
“Language passes [the test for natural selection]. We examine the motivations for the competing nonselectionist position and suggest that they have little to recommend them.” — Pinker & Bloom (1990)
Teori Simbolik (Terrence Deacon)
- Terrence Deacon (The Symbolic Species, 1997): Bahasa bukan evolusi dari sistem sinyal, tapi dari simbol. Simbol adalah tanda yang arbitrarily dikaitkan dengan objek karena ada konvensi bersama. Hewan punya sinyal (yang terkait langsung dengan kondisi internal), tapi hanya manusia yang punya simbol.
- Argumen Deacon: Yang berevolusi adalah kemampuan untuk mengasosiasikan tanda dengan objek secara konvensional, dan kemampuan untuk mengajarkan konvensi ini ke generasi berikutnya.
Perspektif Biologis: Gen, Otak, dan Anatomi
Gen FOXP2 (“The Language Gene”)
Salah satu penemuan paling terkenal di neurolinguistik:
- 1998: KE Family — Satu keluarga Inggris (diidentifikasi dengan nama samaran KE) di mana separuh anggotanya memiliki speech and language disorder (kesulitan artikulasi, tata bahasa, dan pemahaman).
- 2001: Lai et al. (Nature): Mengidentifikasi bahwa gangguan ini terkait dengan mutasi pada gen FOXP2 di kromosom 7.
- 2002: Enard et al. (Nature): Menunjukkan bahwa gen FOXP2 manusia berbeda hanya pada 2 asam amino dari gen FOXP2 simpanse — perubahan yang terjadi ~200.000 tahun lalu. Ini juga terjadi di luar otak (juga di paru-paru, usus), menunjukkan efek pleiotropik.
- 2007: Krause, Pääbo et al. (Nature): Sequencing DNA dari fosil Neanderthal (tulang dari Gua Vindija, Kroasia) menunjukkan bahwa Neanderthal juga memiliki versi FOXP2 yang identik dengan manusia modern. Ini berarti mutasi FOXP2 terjadi sebelum pemisahan garis keturunan manusia dan Neanderthal (~500.000 tahun lalu), bukan setelahnya.
Tapi FOXP2 bukan “the language gene” — itu terlalu sederhana. FOXP2 adalah gen yang mengontrol sintesis protein untuk plastisitas sinaptik di ganglia basal, dan juga ditemukan pada:
- Burung penyanyi (songbirds) — membantu pembelajaran nyanyian
- Kelelawar — membantu ekolokasi
- Tikus — diperlukan untuk vokalisasi ultrasonic
FOXP2 lebih merupakan “alat untuk pembelajaran motorik vokal” daripada “gen untuk bahasa” dalam pengertian narrow. Mutasi FOXP2 pada manusia kemungkinan besar membantu fine-tuning kemampuan artikulasi, bukan menciptakan bahasa.
Area Broca dan Wernicke
Dua area otak yang paling penting untuk bahasa:
- 1861: Paul Broca menemukan bahwa pasien dengan kerusakan di area Broca (Brodmann 44/45, di lobus frontal kiri) mengalami Broca’s aphasia — produksi bicara yang lambat, terbata-bata, dan kehilangan tata bahasa, tapi pemahaman relatif utuh. Pasien tahu apa yang ingin dikatakan, tapi tidak bisa mengatakannya.
- 1874: Carl Wernicke menemukan area kedua di lobus temporal kiri (sekarang Wernicke’s area) — pasien dengan kerusakan di sini mengalami Wernicke’s aphasia — produksi bicara lancar tapi kosong makna, dan pemahaman rusak. Pasien berbicara dengan kalimat panjang tapi tidak ada yang nyambung.
- Arcuate fasciculus: Jalur saraf yang menghubungkan area Broca dan Wernicke. Kerusakan di jalur ini menyebabkan conduction aphasia — pasien tahu apa yang ingin dikatakan dan bisa memahaminya, tapi tidak bisa mengulanginya dengan benar.
Yang menarik: area Broca homolog dengan area F5 monyet (yang mengandung mirror neurons untuk kontrol motorik tangan dan mulut). Ini mendukung teori gestural — area Broca berevolusi dari area kontrol motorik primata, dan “direkrut” untuk produksi bicara.
Lateralisasi Otak
Bahasa biasanya diproses di belahan otak kiri — sekitar 95% orang kidal (right-handed) memiliki pusat bahasa di kiri. Sekitar 70% orang kidal (left-handed) juga kidal-bahasa. Ini lateralisasi adalah unik — pada simpanse, tidak ada lateralisasi seketat ini.
Anatomi Vokal Tract
Bahasa vokal membutuhkan vokal tract yang mampu menghasilkan berbagai macam bunyi:
- Tulang hyoid: Satu-satunya tulang di tubuh yang tidak menempel ke tulang lain — mengambang di antara lidah dan laring. Tulang ini penting untuk artikulasi.
- 1989: Arensburg et al. (Nature) menemukan tulang hyoid Neanderthal di Gua Kebara, Israel, dari ~60.000 tahun lalu. Bentuknya identik dengan tulang hyoid manusia modern.
- 2013: D’Anastasio et al. (PLOS ONE): Analisis mikromekanis tulang hyoid Kebara menunjukkan arsitektur internal yang mirip manusia modern, konsisten dengan kapasitas bicara.
- Implikasi: Anatomi vokal Neanderthal sudah mendukung produksi bicara modern. Tapi anatomi vokal saja tidak cukup — diperlukan juga kontrol neural.
Mirror Neurons
- 1996: Rizzolatti et al. menemukan mirror neurons di area F5 monyet (homolog dengan area Broca manusia). Neuron-neuron ini aktif baik saat monyet melakukan tindakan maupun saat melihat monyet lain melakukannya.
- Signifikansi: Mirror neurons menyediakan dasar neural untuk imitasi dan pemahaman tindakan orang lain — dua kemampuan prasyarat bahasa. Tanpa mirror neurons, anak-anak tidak akan bisa meniru suara ibunya saat belajar bicara.
- Koneksi ke AI: Riset tentang mirror neurons menginspirasi pengembangan imitation learning dalam robotika dan AI, di mana agen belajar dengan mengamati agen lain.
Evolusi Bahasa dalam Konteks Evolusi Manusia
Kapan Bahasa Muncul?
Ini adalah salah satu perdebatan terbesar — dan tidak ada konsensus. Ada beberapa hipotesis utama:
| Hipotesis | Waktu | Bukti pendukung |
|---|
| ”Big bang” (Klein, 2000) | 50.000–100.000 tahun lalu | Ledakan artefak kompleks, lukisan gua, perhiasan |
| Late Pleistocene gradualism | 200.000–500.000 tahun lalu | Tulang hyoid Neanderthal modern, FOXP2 modern |
| Continuity (Botha, 2008) | 1,5–2 juta tahun lalu | Bahasa gradual berevolusi dari hominid awal |
| Language-as-adaptation | Bersamaan dengan Homo sapiens (~300.000 tahun lalu) | Adaptasi bertahap seperti Chomsky |
Chomsky 2014: “The faculty of language is likely to have emerged quite recently in evolutionary terms, some 70,000–100,000 years ago, and does not seem to have undergone modification since then.”
Tapi klaim Chomsky ini dikritik keras. Riset fosil menunjukkan anatomi vokal Neanderthal sudah mendukung bicara, dan mereka memiliki FOXP2 modern. Lebih masuk akal: bahasa berevolusi bertahap (gradual) dan dimulai jauh sebelum 70.000 tahun lalu.
Hominid dan Bahasa
- Australopithecus afarensis (~3,9 juta tahun lalu): Volume otak ~450 cc, hyoid masih primitive (kuda-kuda seperti gorila). Tidak punya kapasitas vokal untuk bicara modern.
- Homo erectus (~1,8 juta tahun lalu): Volume otak ~950 cc, kemungkinan punya kultural transmission yang kompleks. Mungkin punya bahasa primitif. Mereka adalah hominid pertama yang meninggalkan Afrika.
- Homo heidelbergensis (~600.000 tahun lalu): Volume otak ~1200 cc, hyoid mulai modern. Mungkin punya bahasa yang lebih kompleks.
- Homo neanderthalensis (~400.000–40.000 tahun lalu): Volume otak ~1500 cc (lebih besar dari manusia modern!). FOXP2 modern, tulang hyoid modern. Bukti kultural: penguburan ritual, perhiasan, penggunaan cat merah. Kemungkinan besar punya bahasa, meski kita tidak bisa tahu persis kompleksitasnya.
- Homo sapiens (~300.000 tahun lalu): Bahasa modern kemungkinan besar sudah ada. Ledakan artefak simbolis ~100.000 tahun lalu.
Bukti Arkeologis untuk Bahasa
Bukti tidak langsung untuk bahasa purba:
- Senjata proyektil (Saharan pump, ~70.000 tahun lalu): Butuh koordinasi dan komunikasi untuk berburu — mungkin butuh bahasa
- Lukisan gua tertua (Sulawesi, ~45.000 tahun lalu, Nature 2019; Chauvet, Perancis, ~32.000 tahun lalu): Symbolic thought, mungkin naratif
- Penguburan ritual (Skhul/Qafzeh, ~100.000 tahun lalu): Kemungkinan konsep afterlife
- Perhiasan (Blombos Cave, Afrika Selatan, ~100.000 tahun lalu): Manik-manik kerang
- Red ochre (Blombos, ~100.000 tahun lalu): Pigmen yang digunakan untuk dekorasi atau ritual
- Bone flute (Divje Babe, Slovenia, ~43.000 tahun lalu, kontroversial): Alat musik Neanderthal? Mungkin juga tidak.
- Tulang dengan notches (Blombos, ~100.000 tahun lalu): Mungkin kalender, penomoran, atau tally
Bukti langsung untuk bahasa (yaitu, rekaman suara atau tulisan) baru ada pada ~5.000 tahun lalu (tulisan Mesopotamia).
Bahasa Modern sebagai Laboratorium Asal-Usul Bahasa
Salah satu bukti terkuat untuk evolusi bahasa datang dari bahasa yang muncul dalam sejarah modern — kita bisa menyaksikan prosesnya secara real-time.
Nicaraguan Sign Language (NSL)
Salah satu kasus paling terkenal:
- 1970-an: Sekolah-sekolah untuk anak tunarungu dibuka di Managua, Nikaragua. Sebelumnya, anak-anak tunarungu Nikaragua tidak pernah bertemu satu sama lain — mereka hidup terisolasi dengan keluarga yang mendengar.
- Generasi pertama (mereka yang masuk sekolah 1978-1980): Masing-masing membawa home sign system (sistem isyarat idiosyncratic yang dikembangkan dengan keluarga). Ketika bertemu, mereka mengembangkan LSN (Lenguaje de Signos Nicaragüense) — semacam pidgin yang belum stabil.
- Generasi kedua (anak-anak yang lebih muda, masuk sekolah setelah 1980): Mereka belajar LSN dari teman sebaya, tapi mereka mengembangkan LSN menjadi lebih kompleks — menambah infleksi verba, classifier untuk kata benda, struktur sintaksis. Bahasa baru ini disebut ISN (Idioma de Señas Nicaragüense).
“Sequential cohorts of interacting young children collectively possess the capacity not only to learn, but also to create, language.” — Ann Senghas et al. (2004)
- Signifikansi: NSL adalah contoh pertama bahasa baru yang muncul dalam sejarah modern, dan prosesnya (pidgin → kreol) mirip dengan yang terjadi secara alami di seluruh dunia.
- Insight penting: Generasi pertama (orang dewasa) yang membawa home sign system tidak berhasil mengembangkan bahasa yang stabil. Yang berhasil adalah generasi kedua (anak-anak) yang mempelajari pidgin dan mengembangkannya menjadi bahasa penuh. Ini mendukung hipotesis critical period — hanya anak-anak yang bisa membuat bahasa menjadi kompleks.
Al-Sayyid Bedouin Sign Language (ABSL)
Kasus lain yang paralel:
- 1930-an: Komunitas tunarungu muncul di desa Al-Sayyid di Negev, Israel, karena perkawinan antar sepupu yang menyebarkan gen tunarungu.
- Tiga generasi ABSL sudah didokumentasi. Bahasa ini berkembang secara mandiri dari ASL atau bahasa isyarat lain.
- Sama seperti NSL, ABSL menunjukkan bahwa bahasa bisa muncul dari nol dalam satu generasi, tanpa model bahasa yang sudah ada.
Bahasa Kreol dan Pidgin
Di seluruh dunia, bahasa pidgin muncul ketika komunitas dengan bahasa berbeda harus berkomunikasi (untuk perdagangan, kerja paksa, atau kontak militer). Bahasa pidgin biasanya sederhana. Tapi ketika anak-anak tumbuh dengan pidgin sebagai bahasa utama, mereka secara spontan mengembangkannya menjadi bahasa penuh (kreol) dengan struktur gramatikal yang kompleks.
Contoh:
- Tok Pisin (Papua Nugini): Kreol berbasis bahasa Inggris. Sekarang bahasa nasional PNG.
- Haitian Creole: Kreol berbasis bahasa Prancis. Bahasa nasional Haiti.
- Sranan Tongo (Suriname): Kreol berbasis bahasa Inggris.
Bickerton (1981) berargumen bahwa semua kreol punya pola TMA (Tense-Mood-Aspect) yang serupa, dan mengusulkan Language Bioprogram Hypothesis — bahwa ada “bioprogram” bawaan yang menentukan struktur bahasa manusia. Tapi hipotesis ini dikritik (Gil 2012 menunjukkan bahwa hanya 8% kreol yang punya TMA wajib).
Perspektif Sosiokultural: Bahasa dan Pikiran
Sapir-Whorf Hypothesis
Salah satu hipotesis paling terkenal dan kontroversial dalam linguistik:
- Edward Sapir (1929) dan Benjamin Lee Whorf (1956): Bahasa mempengaruhi cara berpikir penuturnya. Bukan deterministik, tapi membentuk persepsi.
- Contoh klasik (Whorf): Bahasa Hopi (Amerika) tidak punya kata untuk “waktu” seperti bahasa Inggris. Penutur Hopi melihat “waktu” secara berbeda.
- Versi kuat (linguistic determinism): Bahasa menentukan pikiran — tidak bisa memikirkan sesuatu yang tidak punya kata untuknya.
- Versi lemah (linguistic influence): Bahasa mempengaruhi pikiran — penutur bahasa tertentu lebih mudah memikirkan konsep tertentu.
Bukti eksperimental mendukung versi lemah:
- Warna: Bahasa dengan kata untuk membedakan biru dan hijau (seperti Rusia goluboy dan siniy) membuat penutur lebih cepat membedakan warna tersebut.
- Arah: penutur bahasa dengan sistem orientasi absolut (mis. bahasa Guugu Yimithirr di Australia, yang hanya menggunakan utara/selatan/timur/barat) memiliki orientasi spasial yang lebih baik dari penutur bahasa Indo-Eropa.
- Gender: Bahasa dengan kata ganti gender netral (seperti Finlandia hän) mengurangi stereotip gender dalam pikiran penuturnya.
- Jumlah (numerical cognition): penutur bahasa tanpa kata untuk angka (beberapa bahasa Aborigin Australia) lebih buruk dalam mengingat jumlah besar.
Vygotsky (Thought and Language, 1934) memberikan kontribusi penting:
- Bahasa adalah alat mediasi sosial-kognitif. Pertama bahasa digunakan untuk berkomunikasi dengan orang lain (fungsi sosial), lalu diinternalisasi sebagai alat berpikir individual (fungsi kognitif).
- Inner speech: Saat anak-anak berpikir, mereka “berbicara” dengan diri mereka sendiri dalam inner speech — bukti bahwa bahasa telah diinternalisasi.
- Zone of Proximal Development (ZPD): Jarak antara apa yang bisa dilakukan anak sendiri dan apa yang bisa dilakukan dengan bantuan orang yang lebih mampu. Bahasa adalah alat utama untuk menggeser ZPD.
“The development of inner speech depends on outside factors; the development of logic in the child, as Piaget’s studies have shown, is a direct function of his socialized speech. The child’s intellectual growth is contingent on his mastering the social means of thought, that is, language.” — Vygotsky (1934)
Teori Pikiran dan Shared Intentionality
Theory of Mind (ToM) — kemampuan untuk memahami bahwa orang lain memiliki pikiran, keyakinan, dan niat yang berbeda dari diri sendiri — adalah prasyarat bahasa. Anda tidak bisa mengomunikasikan sesuatu kecuali Anda memahami bahwa orang lain tidak tahu apa yang Anda tahu.
- Michael Tomasello (Constructing a Language, 2003): Bahasa muncul dari shared intentionality — kemampuan unik manusia untuk bekerja sama dalam pursuit tujuan bersama, dengan pemahaman bahwa semua partisipan memiliki niat yang sama.
- Percobaan titik garam: Anak-anak usia 1 tahun yang melihat orang dewasa “salah” menaruh titik garam ke gelas akan menunjuk ke arah yang benar. Ini menunjukkan mereka memahami niat orang lain.
- Simpanse gagal pada tes yang sama — mereka tidak membedakan antara “salah secara fisik” dan “salah secara niat”.
Kompleksitas Bahasa: Apa yang Membuat Bahasa Begitu Spesial?
Rekurensi: Kemampuan yang Mungkin Hanya Milik Manusia
Rekurensi adalah kemampuan untuk menyisipkan klausa dalam klausa:
- “[Kucing yang menangkap [tikus yang mencuri [keju yang dibuat oleh [petani yang tinggal di [kota]]]]]”
Chomsky (1957, Syntactic Structures) berargumen bahwa rekursi adalah properti inti bahasa manusia — yang membedakan bahasa dari sistem komunikasi hewan manapun.
- Hauser, Chomsky, Fitch (2002, Science) membedakan:
- FLB (Faculty of Language in the Broad sense): sistem sensorimotor, sistem konseptual-intentional, dan mekanisme komputasi untuk rekursi
- FLN (Faculty of Language in the Narrow sense): hanya rekursi — komponen yang benar-benar unik untuk manusia
- Hipotesis: FLN mungkin berevolusi untuk alasan selain bahasa (numerasi, navigasi, relasi sosial), tapi kemudian “direkrut” untuk bahasa.
Displacement: Membicarakan Hal yang Tidak Ada di Sini
Hewan vokal hanya membicarakan hal yang ada di sini/sekarang. Kera vokalisasi tentang predator ketika predator terlihat, tidak sebelumnya. Tapi manusia bisa:
- “Saya akan ke Tokyo besok”
- “Dulu di kerajaan Majapahit…”
- “Bayangkan jika bumi berhenti berputar”
Displacement adalah fitur yang membedakan bahasa dari sistem komunikasi hewan manapun.
Productivity: Kalimat Baru Tanpa Batas
Setiap hari, kalimat baru diciptakan. Anda tidak akan pernah menemukan kamus yang berisi semua kalimat yang pernah diucapkan — karena kalimat baru terus diciptakan. Ini dimungkinkan oleh combinatorial syntax — aturan gramatikal yang memungkinkan unit-unit kecil (kata) digabungkan menjadi struktur yang lebih besar (frasa, klausa, kalimat).
Duality of Patterning
Bahasa manusia bekerja pada dua level sekaligus:
- Level 1: Bunyi yang tidak bermakna sendiri (fonem — p, t, k, a, i, u) digabungkan menjadi…
- Level 2: Unit bermakna (morfem — pati, pita, kita, pak, api) yang digabungkan menjadi…
- Level 3: Kalimat (“Pati meniup api”, “Kita ke api”, dst.)
Ini efisien — dari ~30-50 fonem, kita bisa menghasilkan 100.000+ kata (morfem) dan dari 100.000 kata, kita bisa menghasilkan jumlah kalimat yang tidak terbatas.
Koneksi ke AI / LLM
Salah satu hal paling menarik di 2020-an: bahasa menjadi subjek utama AI. Large Language Models mencapai kemampuan linguistik yang sebelumnya dianggap mustahil. Ini memunculkan pertanyaan filosofis dan ilmiah baru.
LLMs sebagai Model Bahasa
Transformer — arsitektur yang mendasari LLM — adalah model statistik bahasa. Ia belajar dari korpus teks besar dan memodelkan probabilitas urutan kata:
P(“Saya pergi ke” → “sekolah”) > P(“Saya pergi ke” → “bunga”)
Ini adalah model n-gram yang disederhanakan, tapi dengan arsitektur yang sangat dalam (deep learning).
Apakah LLMs “Mengerti” Bahasa?
Debat besar di AI:
- Chomsky & statistikawan: Bahasa terlalu kompleks untuk dipelajari dari data saja. Anak-anak tidak mungkin belajar bahasa dari korpus yang terbatas. Pasti ada Universal Grammar yang innate.
- Pinker & Bloom: Bahasa bisa dipelajari dari data, tapi melalui biaya evolusi — otak manusia sudah “di-tune” untuk belajar bahasa.
- Bender & Koller (2020, Climbing towards NLU): LLMs hanya belajar bentuk bahasa, bukan makna. Mereka tidak pernah mengalami dunia fisik, jadi mereka tidak bisa benar-benar “mengerti” referensi bahasa ke dunia.
- Emergent abilities (2022-2023): LLMs besar menunjukkan kemampuan reasoning, few-shot learning, dan chain-of-thought yang tidak diprediksi oleh ukuran model. Apakah ini “memahami”?
Embedding: Representasi Matematis Bahasa
Embedding adalah representasi kata/frasa sebagai vektor numerik di ruang multidimensi. Kata-kata dengan makna mirip memiliki embedding yang mirip secara geometris (jarak Euclidean kecil, sudut cosinus kecil).
- Word2Vec (Mikolov et al., 2013) menunjukkan bahwa embedding menangkap analog语义:
- king - man + woman ≈ queen
- Paris - France + Japan ≈ Tokyo
Ini mengimplikasikan bahwa bahasa bisa direduksi menjadi geometri — sebuah klaim yang tidak pernah dibayangkan Chomsky.
Transformer (Vaswani et al., 2017, “Attention Is All You Need”) memperkenalkan mechanism attention — model bisa “memperhatikan” bagian relevan dari input saat memproses.
- Context window — jumlah token yang bisa “diperhatikan” sekaligus — adalah keterbatasan utama LLM. Jendela yang lebih besar = lebih banyak konteks = pemahaman lebih baik.
- Retrieval-Augmented Generation (RAG) — menyuntikkan informasi relevan dari knowledge base eksternal ke dalam context window untuk meningkatkan akurasi LLM.
AI Agent: Bahasa sebagai Antarmuka
AI Agent modern menggunakan bahasa sebagai antarmuka universal — agent menerima instruksi dalam bahasa alami, merencanakan, menggunakan tool, dan berkomunikasi dengan agent lain.
Contoh: Claude Code, Cursor, Devin — semuanya menggunakan bahasa alami sebagai antarmuka utama. Bahasa tidak hanya jadi subjek AI, tapi jadi infrastruktur AI.
Emergent Communication: AI yang Mengembangkan Bahasa
Salah satu riset paling menarik di 2020-an: emergent communication — multi-agent AI systems yang belajar berkomunikasi dari nol:
- Lazaridou et al. (2017): Dua neural network dilatih untuk bermain referential game (satu melihat gambar, yang lain menebak gambar mana yang dilihat). Mereka mengembangkan “bahasa” yang efisien.
- Bouchacourt & Baroni (2018): Multi-agent yang dilatih dengan reinforcement learning mengembangkan protokol komunikasi yang memiliki compositionality — salah satu fitur utama bahasa manusia.
- Chaabouni et al. (2022): Menunjukkan bahwa bahasa yang muncul di antara agen AI memiliki Zipf-like distribution — pola yang juga ditemukan di semua bahasa manusia.
- NeLLCom (2023): Replikasi trade-off universal linguistik (word-order vs. case-marking) di antara neural agents — menunjukkan bahwa beberapa universal bahasa bisa muncul dari tekanan komunikasi, tanpa harus innate.
Pertanyaan besar: Jika bahasa muncul di antara agen AI dari tekanan koordinasi, apakah ini berarti bahasa manusia juga muncul dari tekanan koordinasi — bukan dari “Universal Grammar” innate?
Ini belum terjawab, tapi beberapa peneliti (termasuk Simon Kirby, Luc Steels) menganggap emergent communication AI sebagai laboratorium potensial untuk menguji teori evolusi bahasa.
Perdebatan Modern
Bahasa: Adaptation atau Spandrel?
Salah satu perdebatan paling abadi:
- Adaptation (Pinker & Bloom 1990): Bahasa terlalu kompleks dan spesifik untuk menjadi spandrel. Pasti ada tekanan selektif khusus untuk bahasa.
- Spandrel (Chomsky 1993, Gould & Lewontin 1979): Bahasa adalah efek samping dari evolusi kemampuan kognitif lain (teori pikiran, working memory, sequential processing).
Universal Grammar vs Statistical Learning
- Chomsky: Semua bahasa punya struktur universal (Universal Grammar). Anak-anak belajar bahasa dengan cepat karena otak mereka sudah “di-preload” dengan UG.
- Pinker: Bahasa adalah “instinct” — kemampuan bawaan, tapi tidak harus UG. Anak-anak belajar bahasa dengan language acquisition device yang membantu mereka mendeteksi pattern.
- Tomasello: Tidak ada UG yang tetap. Anak-anak belajar bahasa melalui statistical learning — mendeteksi pattern dari input bahasa yang mereka dengar.
- LLMs: Bukti kuat bahwa statistical learning bisa menghasilkan kemampuan linguistik yang sangat baik. Dengan cukup data dan arsitektur yang tepat, mesin bisa belajar struktur bahasa.
Continuity vs Discontinuity
- Continuity (Hominid continuity): Bahasa berevolusi secara gradual dari sistem komunikasi primata. Tidak ada “saltasi” atau lompatan tiba-tiba.
- Discontinuity (Chomsky): Bahasa muncul tiba-tiba, ~70.000-100.000 tahun lalu, sebagai “saltation” — perubahan besar yang tidak bisa dijelaskan dengan evolusi gradual.
Kapan Bahasa Modern Muncul?
- Hominid gradualists (Fitch, Corballis, Bickerton): Bahasa modern sudah ada 500.000-1.000.000 tahun lalu. Neanderthal mungkin punya bahasa.
- Recent saltationists (Klein, Berwick): Bahasa modern muncul tiba-tiba ~50.000 tahun lalu, bersamaan dengan ledakan artefak simbolis (“Upper Paleolithic Revolution”).
- Kompromi (Botha 2008): Bahasa tidak pernah “muncul” — selalu berevolusi secara gradual. Pertanyaan “kapan bahasa muncul” adalah kategori yang salah.
Implikasi untuk Memahami Kecerdasan
Pertanyaan “mengapa bahasa terbentuk” adalah salah satu pertanyaan paling sentral di ilmu kognitif dan AI modern. Beberapa implikasi:
Untuk AI
- Jika bahasa muncul dari tekanan koordinasi (seperti yang diimplikasikan oleh emergent communication AI), maka bahasa bisa jadi “alat koordinasi” yang sangat umum — bisa muncul di sistem apa saja yang perlu bekerja sama.
- LLM modern menunjukkan bahwa statistical learning dari korpus besar sudah cukup untuk menghasilkan kemampuan linguistik yang kompleks. Ini menantang asumsi innate Chomsky.
- Tapi LLMs tidak memiliki grounding (pengalaman sensorimotor dunia). Bender & Koller (2020) menyebut ini “octopus test” — seekor oktopus yang berkomunikasi lewat internet mungkin fasih berbahasa, tapi tidak mengerti referen.
Untuk Memahami Otak Manusia
- Bahasa adalah jendela ke nature manusia (Pinker). Memahami bahasa membantu kita memahami bagaimana pikiran bekerja.
- Area Broca homolog dengan area F5 monyet — menunjukkan bahwa kontrol motorik adalah dasar untuk bahasa. Ini bukan kebetulan — bahasa berevolusi dari sistem motorik.
- FOXP2 bukan “language gene” tapi berperan dalam pembelajaran motorik vokal — ini konsisten dengan teori bahwa bahasa berevolusi dari sistem motorik.
- Vygotsky’s ZPD mengimplikasikan bahwa bahasa adalah alat pedagogis — belajar dengan bantuan orang lain (melalui bahasa) lebih efektif daripada belajar sendiri.
- Digital garden adalah metafora untuk knowledge base yang ditumbuhkan secara iteratif — bahasa adalah “tanah” tempat taman ini tumbuh.
- Wiki seperti LLM Wiki ini sendiri adalah contoh bahasa sebagai alat mediasi kognitif — artikel yang saling terhubung, backlink, graph view — semuanya menggunakan bahasa untuk mengorganisir pengetahuan.
Studi Kasus: Bahasa Indonesia dan Evolusi Budaya
Bahasa Indonesia adalah kasus menarik untuk dilihat dari perspektif evolusi bahasa:
- Asal-usul: Bahasa Indonesia (kini disebut Bahasa Indonesia) berasal dari Melayu Pasar — lingua franca yang digunakan di pelabuhan-pelabuhan kepulauan Nusantara sejak abad ke-7.
- Standardisasi: Bahasa ini distandardisasi oleh Sumpah Pemuda 1928 sebagai bahasa persatuan, dan dianut sebagai bahasa nasional.
- Evolusi cepat: Dalam 100 tahun, bahasa Indonesia telah menyerap ribuan kata dari bahasa daerah (Jawa, Sunda, Minangkabau), bahasa asing (Sansekerta, Arab, Belanda, Inggris, Portugis), dan menciptakan neologisme.
- Kasus menarik: Bahasa Indonesia adalah contoh bahasa kreol yang sukses — dimulai sebagai pidgin antarpulau, distandardisasi, dan menjadi bahasa nasional untuk 270+ juta orang.
Tan Malaka, salah satu tokoh Indonesia yang perannya dalam sejarah kadang dilupakan, adalah penulis ulung dalam bahasa Indonesia — ia menulis Madilog (1943) dan puluhan karya lain yang memperkaya kosakata dan struktur bahasa Indonesia. Ironisnya, banyak karyanya dilarang di era Orde Baru, menunjukkan bahwa bahasa juga bisa menjadi arena politik.
Kesimpulan: Mengapa Bahasa Terbentuk?
Tidak ada satu jawaban yang lengkap. Bahasa terbentuk dari interaksi banyak faktor:
- Biologis — gen (FOXP2), area otak (Broca, Wernicke), anatomi vokal (hyoid, laring) yang berevolusi untuk mendukung produksi dan pemahaman bahasa
- Sosial — tekanan untuk维系 ikatan dalam kelompok yang semakin besar (Dunbar), untuk mengkoordinasikan aksi (hunting, defense), untuk mengajar generasi berikutnya
- Kognitif — teori pikiran, working memory, kemampuan untuk membayangkan hal yang tidak hadir (displacement)
- Kultural — bahasa diturunkan secara kultural, bukan genetik, dan mengalami perubahan cepat lintas generasi
Yang menarik: riset emergent communication di AI menunjukkan bahwa beberapa fitur bahasa (compositionality, Zipf’s law) bisa muncul dari tekanan koordinasi saja, tanpa harus innate. Ini membuka kemungkinan bahwa bahasa, setidaknya sebagian, adalah properti yang muncul (emergent) dari interaksi banyak agen yang perlu bekerja sama.
Pada akhirnya, bahasa adalah salah satu teknologi paling kuno dan paling kuat yang pernah dikembangkan manusia. Ia memungkinkan pemikiran abstrak, kooperasi skala besar, transmisi kumulatif budaya — dan, pada akhirnya, kecerdasan buatan yang bisa memanfaatkannya.
“Language is the dress of thought.” — Samuel Johnson
“We can only think in language, and language is always loaded with the presuppositions of a particular culture.” — Vygotsky (diadopsi dalam filsafat)
Sumber dan Bacaan
Buku-buku utama
- Steven Pinker, The Language Instinct (1994) — pengantar populer untuk evolusi bahasa
- Christine Kenneally, The First Word (2007) — kisah pencarian ilmiah asal-usul bahasa
- W. Tecumseh Fitch, The Evolution of Language (2010) — sintesis akademis paling lengkap
- Robin Dunbar, Grooming, Gossip and the Evolution of Language (1996) — teori gossip
- Terrence Deacon, The Symbolic Species (1997) — teori simbolik
- Derek Bickerton, Language and Species (1995) — bioprogram hypothesis
- John McWhorter, The Power of Babel (2001) — tentang keragaman dan kesamaan bahasa
- Lev Vygotsky, Thought and Language (1934, posthumous) — bahasa dan kognisi
Paper kunci
- Pinker & Bloom (1990), “Natural Language and Natural Selection”, Behavioral and Brain Sciences
- Lai et al. (2001), “A forkhead-domain gene is mutated in a severe speech and language disorder”, Nature
- Enard et al. (2002), “Molecular evolution of FOXP2”, Nature
- Hauser, Chomsky, Fitch (2002), “The Faculty of Language”, Science
- Arensburg et al. (1989), “A Middle Palaeolithic human hyoid bone”, Nature
- Krause, Pääbo et al. (2007), “The derived FOXP2 variant of modern humans was shared with Neandertals”, Current Biology
- Senghas et al. (2004), “Children Creating Language”, Psychological Science
- Kegl & Iwata (1989), “Lenguaje de Signos Nicaragüense”, Proceedings of the Pacific Linguistics Conference
- Bender & Koller (2020), “Climbing towards NLU”, ACL
- Lazaridou et al. (2017), “Emergence of Language with Multi-agent Games”, NeurIPS
- Raviv et al. (2015), “Language Evolution: Why Hockett’s Design Features are a Non-Starter”, Biology & Philosophy
Sumber daring
Lihat juga