Con người thường tự hào về sự phức tạp và khó đoán trong cách chúng ta sử dụng ngôn ngữ. Tuy nhiên, một hiện tượng kỳ lạ được gọi là định luật Zipf đã thách thức ý tưởng này và sự sắp xếp và tần suất từ trong hầu hết các ngôn ngữ trên thế giới đều tuân theo một quy luật toán học cố định, dù nguyên nhân đằng sau vẫn còn là bí ẩn.
Hơn 80 năm trước, nhà ngôn ngữ học George Kingsley Zipf đã phát hiện rằng tần suất các từ xuất hiện trong ngôn ngữ tuân theo một định luật lũy thừa. Cụ thể, từ phổ biến nhất trong một ngôn ngữ - như "the" trong tiếng Anh - được sử dụng gấp đôi từ phổ biến thứ hai, gấp ba lần từ phổ biến thứ ba, và tiếp tục giảm dần với tỷ lệ này.
Hiện tượng này không chỉ xảy ra ở tiếng Anh mà còn ở mọi ngôn ngữ được nghiên cứu, từ tiếng Hindi, tiếng Quan Thoại, đến tiếng Tây Ban Nha. Đáng ngạc nhiên hơn, ngay cả các ngôn ngữ chưa giải mã như trong Bản thảo Voynich hay các văn bản cổ cũng tuân theo định luật Zipf. Các tác phẩm văn học như On the Origin of Species của Charles Darwin hay thậm chí Hamlet của Shakespeare cũng không ngoại lệ.
Vì sao ngôn ngữ lại tuân theo định luật này?
Sự tồn tại của định luật Zipf đặt ra nhiều câu hỏi lớn. Một giả thuyết được George Zipf đề xuất là sự cân bằng giữa nỗ lực và hiệu quả. Người nói hoặc viết thường sử dụng các từ phổ biến để giảm thiểu nỗ lực, trong khi người nghe hoặc đọc tìm kiếm sự rõ ràng trong những từ ít phổ biến hơn. Kết quả là, ngôn ngữ hình thành theo cách tối ưu hóa thông tin truyền đạt.
Một ý tưởng khác cho rằng các từ phổ biến hơn có xu hướng "hiệu ứng quả cầu tuyết", tức là càng được sử dụng nhiều, chúng càng trở nên phổ biến hơn. Tuy nhiên, không có lời giải thích nào thực sự được chấp nhận hoàn toàn.
Khám phá ngôn ngữ qua lăng kính định luật Zipf
Dù các nhà ngôn ngữ học và toán học vẫn chưa tìm ra nguyên nhân sâu xa, định luật Zipf mở ra cách nhìn mới về sự vận hành của ngôn ngữ. Điều này cũng làm nổi bật tính logic kỳ lạ của giao tiếp, cho thấy ngôn ngữ không hoàn toàn ngẫu nhiên mà tuân theo những quy luật tiềm ẩn.
Bạn thậm chí có thể kiểm tra tính hợp lệ của định luật này bằng cách áp dụng nó lên các văn bản cá nhân. Dán một cuốn tiểu thuyết hoặc bài viết dài vào một phần mềm phân tích ngôn ngữ, bạn sẽ thấy cách từ ngữ tuân theo quy luật này đáng kinh ngạc như thế nào.
Dù chúng ta chưa hiểu rõ lý do, định luật Zipf vẫn là minh chứng thú vị cho sự gắn bó giữa toán học và ngôn ngữ, đặt ra những câu hỏi lớn về cách ngôn ngữ hình thành và phát triển trong văn hóa nhân loại.
Lấy link