Mengapa Bahasa Terbentuk

Bahasa sebagai produk evolusi, kognisi, dan kultur — dari mana asalnya, bagaimana otak memprosesnya, dan apa hubungannya dengan kecerdasan buatan modern.

Bahasa adalah salah satu fenomena paling misterius di alam semesta. Tidak ada spesies lain di Bumi — termasuk simpanse yang DNA-nya 98,7% identik dengan kita — yang memiliki sistem komunikasi dengan kompleksitas, rekursi, dan produktivitas tak terbatas seperti bahasa manusia. Pertanyaan “mengapa bahasa itu terbentuk” telah dijawab oleh banyak tradisi — dari mitologi (Menara Babel dalam Alkitab), filsafat (Plato认为 bahasa adalah cerminan realitas), hingga sains modern (Chomsky, Pinker, Fitch).

Artikel ini mengupas jawaban sains modern: bahasa muncul dari interaksi 7 juta tahun evolusi hominid, ratusan ribu tahun kultur, dan kemampuan kognitif unik manusia. Tiga faktor utama yang biasanya disepakati para ahli:

  1. Tekanan sosial — untuk维系 ikatan dalam kelompok yang semakin besar (Robin Dunbar: bahasa berevolusi dari “grooming” primata)
  2. Tekanan biologis — gen FOXP2, area Broca, tulang hyoid yang memungkinkan artikulasi
  3. Tekanan kognitifteori pikiran, working memory, dan kemampuan untuk memikirkan pikiran orang lain

Pertanyaan yang lebih menarik justru muncul di 2020-an: apakah Large Language Models yang belajar dari teks statistik bisa memahami bahasa? Studi-studi emergent communication menunjukkan bahwa agen AI bisa mengembangkan “bahasa” mereka sendiri melalui permainan koordinasi. Ini menantang asumsi bahwa bahasa harus innate.

“Language is a window into human nature.” — Steven Pinker, The Language Instinct (1994)

“The faculty of language is likely to have emerged quite recently in evolutionary terms, some 70,000–100,000 years ago.” — Noam Chomsky (2014)

“Language is a perfect example of the kind of complex system that natural selection is good at building.” — Steven Pinker & Paul Bloom (1990)

Bahasa: Definisi dan Ciri Khas

Definisi bahasa

Tidak ada satu definisi tunggal yang disepakati semua ahli. Berikut beberapa definisi kunci:

Bahasa vs komunikasi

Komunikasi adalah fenomena universal di dunia hewan — semua spesies sosial punya cara untuk memberi sinyal. Yang membuat bahasa manusia unik adalah:

Bahasa sebagai fenomena digital

Pada 2020-an, bahasa menjadi fenomena digital. Teks digital — email, pesan singkat, posting media sosial, artikel wiki — menjadi habitat baru bahasa. Large Language Models belajar dari habitat digital ini, dan mereka menunjukkan kemampuan linguistik yang sebelumnya dianggap mustahil untuk mesin. Apakah mereka benar-benar “mengerti” bahasa, atau hanya memanipulasi simbol? Ini adalah salah satu perdebatan terbesar di AI Agent modern.

Ciri-ciri Unik Bahasa: Design Features (Charles Hockett)

Pada 1960, Charles Hockett merumuskan 13 design features yang membedakan bahasa manusia dari sistem komunikasi hewan lain. Hockett awalnya percaya bahwa 9 fitur pertama juga dimiliki primata non-manusia (khususnya gibbon), sementara 4 fitur terakhir hanya dimiliki manusia.

9 fitur yang juga dimiliki primata

  1. Vocal-auditory channel — bahasa menggunakan suara di udara (bukan gesture, jejak, atau listrik)
  2. Rapid fading — sinyal cepat hilang setelah dipancarkan (bandingkan tulisan yang permanen)
  3. Broadcast transmission dan directional reception — suara bisa terdengar ke segala arah, tapi bisa juga dilokalisasi sumbernya
  4. Interchangeability — penutur dan pendengar bisa saling bertukar peran
  5. Total feedback — penutur mendengar apa yang dia ucapkan
  6. Specialization — sinyal bahasa tidak memiliki fungsi biologis lain (bandingkan panting anjing)
  7. Semanticity — sinyal membawa makna
  8. Arbitrariness — hubungan bunyi-makna adalah konvensi (kata “kucing” tidak ada hubungannya dengan kucing)
  9. Discreteness — bahasa terdiri dari unit diskrit (fonem, morfem) yang bisa dibedakan kategorial

4 fitur yang hanya dimiliki manusia

  1. Displacement — bisa membicarakan hal yang jauh secara ruang atau waktu (“Kemarin di Tokyo…”)
  2. Productivity — bisa menghasilkan kalimat yang belum pernah ada
  3. Cultural transmission — bahasa diturunkan secara kultural, bukan genetik
  4. Duality of patterning — bunyi bermakna yang tak bermakna sendiri (fonem) digabung menjadi unit yang bermakna (morfem) yang digabung menjadi kalimat

3 fitur tambahan (ditambahkan Hockett di kemudian hari)

Kritik terhadap Hockett

Kajian modern (termasuk Raviv & colleagues 2015) mengkritik Hockett bahwa fokus pada komunikasi (bukan kognisi) menyesatkan. Banyak fitur komunikasi juga ada pada lebah (tarian waggle), kera, dan burung. Yang membuat bahasa manusia unik bukan fitur komunikasinya, tapi kontennya — pikiran, konsep, dan niat di baliknya.

Teori Asal-Usul Bahasa

Teori Ilahi (Divine Theory)

Dalam banyak tradisi agama, bahasa adalah pemberian dari makhluk ilahi. Contoh terkenal:

Teori ilahi ini tidak ilmiah, tapi tetap penting secara historis dan budaya. Dalam tradisi Islam, misalnya, bahasa Arab sering dianggap “bahasa surgawi” (lisan al-daraj).

Teori Alam (Natural Sound Theories)

Sekelompok teori dari abad ke-19 yang mencoba menjelaskan bahasa sebagai tiruan dari bunyi alam:

Teori Gestural (Gestural Origin)

Salah satu teori tertua dan paling kredibel: bahasa dimulai dari gesture, bukan suara.

Bukti mendukung teori gestural: bahasa isyarat (sign language) sepenuhnya kompleks dan naturalistik, menunjukkan bahwa bahasa tidak harus vokal. Lebih lanjut, anak-anak yang belajar bahasa isyarat memiliki perkembangan bahasa yang sama dengan anak-anak yang belajar bahasa lisan.

Teori Sosial (Social Theory)

Bahasa berevolusi untuk memenuhi kebutuhan sosial — bukan untuk mengeskpresikan pikiran individual, tapi untuk berkoordinasi dalam kelompok.

Teori Gossip dan Bonding Sosial (Robin Dunbar)

Salah satu teori sosial paling terkenal:

“For early humans, grooming as a way to social success posed a problem: given their large social groups of 150 or so, our earliest ancestors would have had to spend almost half their time grooming one another—an impossible burden. What Dunbar suggests… is that humans developed language to serve the same purpose, but far more efficiently.” — Harvard University Press

Studi observasi modern mendukung: ~2/3 percakapan manusia adalah tentang informasi sosial (gossip), bukan tentang hunting, makanan, atau predator. Ini mengimplikasikan fungsi sosial bahasa adalah yang paling penting.

Teori Adaptif / Evolusioner

Charles Darwin (1871, The Descent of Man) sudah berteori bahwa bahasa berevolusi melalui seleksi alam. Tapi baru pada 1990, Pinker & Bloom (Behavioral and Brain Sciences) memberikan argumen yang kuat.

“Language passes [the test for natural selection]. We examine the motivations for the competing nonselectionist position and suggest that they have little to recommend them.” — Pinker & Bloom (1990)

Teori Simbolik (Terrence Deacon)

Perspektif Biologis: Gen, Otak, dan Anatomi

Gen FOXP2 (“The Language Gene”)

Salah satu penemuan paling terkenal di neurolinguistik:

Tapi FOXP2 bukan “the language gene” — itu terlalu sederhana. FOXP2 adalah gen yang mengontrol sintesis protein untuk plastisitas sinaptik di ganglia basal, dan juga ditemukan pada:

FOXP2 lebih merupakan “alat untuk pembelajaran motorik vokal” daripada “gen untuk bahasa” dalam pengertian narrow. Mutasi FOXP2 pada manusia kemungkinan besar membantu fine-tuning kemampuan artikulasi, bukan menciptakan bahasa.

Area Broca dan Wernicke

Dua area otak yang paling penting untuk bahasa:

Yang menarik: area Broca homolog dengan area F5 monyet (yang mengandung mirror neurons untuk kontrol motorik tangan dan mulut). Ini mendukung teori gestural — area Broca berevolusi dari area kontrol motorik primata, dan “direkrut” untuk produksi bicara.

Lateralisasi Otak

Bahasa biasanya diproses di belahan otak kiri — sekitar 95% orang kidal (right-handed) memiliki pusat bahasa di kiri. Sekitar 70% orang kidal (left-handed) juga kidal-bahasa. Ini lateralisasi adalah unik — pada simpanse, tidak ada lateralisasi seketat ini.

Anatomi Vokal Tract

Bahasa vokal membutuhkan vokal tract yang mampu menghasilkan berbagai macam bunyi:

Mirror Neurons

Evolusi Bahasa dalam Konteks Evolusi Manusia

Kapan Bahasa Muncul?

Ini adalah salah satu perdebatan terbesar — dan tidak ada konsensus. Ada beberapa hipotesis utama:

HipotesisWaktuBukti pendukung
”Big bang” (Klein, 2000)50.000–100.000 tahun laluLedakan artefak kompleks, lukisan gua, perhiasan
Late Pleistocene gradualism200.000–500.000 tahun laluTulang hyoid Neanderthal modern, FOXP2 modern
Continuity (Botha, 2008)1,5–2 juta tahun laluBahasa gradual berevolusi dari hominid awal
Language-as-adaptationBersamaan dengan Homo sapiens (~300.000 tahun lalu)Adaptasi bertahap seperti Chomsky

Chomsky 2014: “The faculty of language is likely to have emerged quite recently in evolutionary terms, some 70,000–100,000 years ago, and does not seem to have undergone modification since then.”

Tapi klaim Chomsky ini dikritik keras. Riset fosil menunjukkan anatomi vokal Neanderthal sudah mendukung bicara, dan mereka memiliki FOXP2 modern. Lebih masuk akal: bahasa berevolusi bertahap (gradual) dan dimulai jauh sebelum 70.000 tahun lalu.

Hominid dan Bahasa

Bukti Arkeologis untuk Bahasa

Bukti tidak langsung untuk bahasa purba:

Bukti langsung untuk bahasa (yaitu, rekaman suara atau tulisan) baru ada pada ~5.000 tahun lalu (tulisan Mesopotamia).

Bahasa Modern sebagai Laboratorium Asal-Usul Bahasa

Salah satu bukti terkuat untuk evolusi bahasa datang dari bahasa yang muncul dalam sejarah modern — kita bisa menyaksikan prosesnya secara real-time.

Nicaraguan Sign Language (NSL)

Salah satu kasus paling terkenal:

“Sequential cohorts of interacting young children collectively possess the capacity not only to learn, but also to create, language.” — Ann Senghas et al. (2004)

Al-Sayyid Bedouin Sign Language (ABSL)

Kasus lain yang paralel:

Bahasa Kreol dan Pidgin

Di seluruh dunia, bahasa pidgin muncul ketika komunitas dengan bahasa berbeda harus berkomunikasi (untuk perdagangan, kerja paksa, atau kontak militer). Bahasa pidgin biasanya sederhana. Tapi ketika anak-anak tumbuh dengan pidgin sebagai bahasa utama, mereka secara spontan mengembangkannya menjadi bahasa penuh (kreol) dengan struktur gramatikal yang kompleks.

Contoh:

Bickerton (1981) berargumen bahwa semua kreol punya pola TMA (Tense-Mood-Aspect) yang serupa, dan mengusulkan Language Bioprogram Hypothesis — bahwa ada “bioprogram” bawaan yang menentukan struktur bahasa manusia. Tapi hipotesis ini dikritik (Gil 2012 menunjukkan bahwa hanya 8% kreol yang punya TMA wajib).

Perspektif Sosiokultural: Bahasa dan Pikiran

Sapir-Whorf Hypothesis

Salah satu hipotesis paling terkenal dan kontroversial dalam linguistik:

Bukti eksperimental mendukung versi lemah:

Vygotsky: Bahasa sebagai Alat Mediasi

Vygotsky (Thought and Language, 1934) memberikan kontribusi penting:

“The development of inner speech depends on outside factors; the development of logic in the child, as Piaget’s studies have shown, is a direct function of his socialized speech. The child’s intellectual growth is contingent on his mastering the social means of thought, that is, language.” — Vygotsky (1934)

Teori Pikiran dan Shared Intentionality

Theory of Mind (ToM) — kemampuan untuk memahami bahwa orang lain memiliki pikiran, keyakinan, dan niat yang berbeda dari diri sendiri — adalah prasyarat bahasa. Anda tidak bisa mengomunikasikan sesuatu kecuali Anda memahami bahwa orang lain tidak tahu apa yang Anda tahu.

Kompleksitas Bahasa: Apa yang Membuat Bahasa Begitu Spesial?

Rekurensi: Kemampuan yang Mungkin Hanya Milik Manusia

Rekurensi adalah kemampuan untuk menyisipkan klausa dalam klausa:

Chomsky (1957, Syntactic Structures) berargumen bahwa rekursi adalah properti inti bahasa manusia — yang membedakan bahasa dari sistem komunikasi hewan manapun.

Displacement: Membicarakan Hal yang Tidak Ada di Sini

Hewan vokal hanya membicarakan hal yang ada di sini/sekarang. Kera vokalisasi tentang predator ketika predator terlihat, tidak sebelumnya. Tapi manusia bisa:

Displacement adalah fitur yang membedakan bahasa dari sistem komunikasi hewan manapun.

Productivity: Kalimat Baru Tanpa Batas

Setiap hari, kalimat baru diciptakan. Anda tidak akan pernah menemukan kamus yang berisi semua kalimat yang pernah diucapkan — karena kalimat baru terus diciptakan. Ini dimungkinkan oleh combinatorial syntax — aturan gramatikal yang memungkinkan unit-unit kecil (kata) digabungkan menjadi struktur yang lebih besar (frasa, klausa, kalimat).

Duality of Patterning

Bahasa manusia bekerja pada dua level sekaligus:

Ini efisien — dari ~30-50 fonem, kita bisa menghasilkan 100.000+ kata (morfem) dan dari 100.000 kata, kita bisa menghasilkan jumlah kalimat yang tidak terbatas.

Koneksi ke AI / LLM

Salah satu hal paling menarik di 2020-an: bahasa menjadi subjek utama AI. Large Language Models mencapai kemampuan linguistik yang sebelumnya dianggap mustahil. Ini memunculkan pertanyaan filosofis dan ilmiah baru.

LLMs sebagai Model Bahasa

Transformer — arsitektur yang mendasari LLM — adalah model statistik bahasa. Ia belajar dari korpus teks besar dan memodelkan probabilitas urutan kata:

P(“Saya pergi ke” → “sekolah”) > P(“Saya pergi ke” → “bunga”)

Ini adalah model n-gram yang disederhanakan, tapi dengan arsitektur yang sangat dalam (deep learning).

Apakah LLMs “Mengerti” Bahasa?

Debat besar di AI:

Embedding: Representasi Matematis Bahasa

Embedding adalah representasi kata/frasa sebagai vektor numerik di ruang multidimensi. Kata-kata dengan makna mirip memiliki embedding yang mirip secara geometris (jarak Euclidean kecil, sudut cosinus kecil).

Ini mengimplikasikan bahwa bahasa bisa direduksi menjadi geometri — sebuah klaim yang tidak pernah dibayangkan Chomsky.

Transformer dan Attention

Transformer (Vaswani et al., 2017, “Attention Is All You Need”) memperkenalkan mechanism attention — model bisa “memperhatikan” bagian relevan dari input saat memproses.

AI Agent: Bahasa sebagai Antarmuka

AI Agent modern menggunakan bahasa sebagai antarmuka universal — agent menerima instruksi dalam bahasa alami, merencanakan, menggunakan tool, dan berkomunikasi dengan agent lain.

Contoh: Claude Code, Cursor, Devin — semuanya menggunakan bahasa alami sebagai antarmuka utama. Bahasa tidak hanya jadi subjek AI, tapi jadi infrastruktur AI.

Emergent Communication: AI yang Mengembangkan Bahasa

Salah satu riset paling menarik di 2020-an: emergent communication — multi-agent AI systems yang belajar berkomunikasi dari nol:

Pertanyaan besar: Jika bahasa muncul di antara agen AI dari tekanan koordinasi, apakah ini berarti bahasa manusia juga muncul dari tekanan koordinasi — bukan dari “Universal Grammar” innate?

Ini belum terjawab, tapi beberapa peneliti (termasuk Simon Kirby, Luc Steels) menganggap emergent communication AI sebagai laboratorium potensial untuk menguji teori evolusi bahasa.

Perdebatan Modern

Bahasa: Adaptation atau Spandrel?

Salah satu perdebatan paling abadi:

Universal Grammar vs Statistical Learning

Continuity vs Discontinuity

Kapan Bahasa Modern Muncul?

Implikasi untuk Memahami Kecerdasan

Pertanyaan “mengapa bahasa terbentuk” adalah salah satu pertanyaan paling sentral di ilmu kognitif dan AI modern. Beberapa implikasi:

Untuk AI

Untuk Memahami Otak Manusia

Untuk Pendidikan dan Digital Garden

Studi Kasus: Bahasa Indonesia dan Evolusi Budaya

Bahasa Indonesia adalah kasus menarik untuk dilihat dari perspektif evolusi bahasa:

Tan Malaka, salah satu tokoh Indonesia yang perannya dalam sejarah kadang dilupakan, adalah penulis ulung dalam bahasa Indonesia — ia menulis Madilog (1943) dan puluhan karya lain yang memperkaya kosakata dan struktur bahasa Indonesia. Ironisnya, banyak karyanya dilarang di era Orde Baru, menunjukkan bahwa bahasa juga bisa menjadi arena politik.

Kesimpulan: Mengapa Bahasa Terbentuk?

Tidak ada satu jawaban yang lengkap. Bahasa terbentuk dari interaksi banyak faktor:

  1. Biologis — gen (FOXP2), area otak (Broca, Wernicke), anatomi vokal (hyoid, laring) yang berevolusi untuk mendukung produksi dan pemahaman bahasa
  2. Sosial — tekanan untuk维系 ikatan dalam kelompok yang semakin besar (Dunbar), untuk mengkoordinasikan aksi (hunting, defense), untuk mengajar generasi berikutnya
  3. Kognitif — teori pikiran, working memory, kemampuan untuk membayangkan hal yang tidak hadir (displacement)
  4. Kultural — bahasa diturunkan secara kultural, bukan genetik, dan mengalami perubahan cepat lintas generasi

Yang menarik: riset emergent communication di AI menunjukkan bahwa beberapa fitur bahasa (compositionality, Zipf’s law) bisa muncul dari tekanan koordinasi saja, tanpa harus innate. Ini membuka kemungkinan bahwa bahasa, setidaknya sebagian, adalah properti yang muncul (emergent) dari interaksi banyak agen yang perlu bekerja sama.

Pada akhirnya, bahasa adalah salah satu teknologi paling kuno dan paling kuat yang pernah dikembangkan manusia. Ia memungkinkan pemikiran abstrak, kooperasi skala besar, transmisi kumulatif budaya — dan, pada akhirnya, kecerdasan buatan yang bisa memanfaatkannya.

“Language is the dress of thought.” — Samuel Johnson

“We can only think in language, and language is always loaded with the presuppositions of a particular culture.” — Vygotsky (diadopsi dalam filsafat)

Sumber dan Bacaan

Buku-buku utama

Paper kunci

Sumber daring

Lihat juga