Trong cả hai phân tích về đệm phổ biến ở nam và đệm phổ biến ở nữ, chúng ta đều thấy mức độ sử dụng cao của những đệm vốn có nguồn gốc từ họ. Điển hình là các họ phổ biến nhất gồm Nguyễn, Trần, Lê, Phạm có tỷ lệ dùng khá cao trong việc làm đệm cho họ tên người.
Thường thì cái này có nguyên nhân từ việc lấy họ mẹ làm đệm cho tên con (còn họ của con thì vẫn theo tên bố như truyền thống). Tuy nhiên trong dữ liệu SG01 không có dữ liệu về tên cha mẹ, nên phân tích này sẽ không có các thống kê liên quan như vậy. Nhưng nó sẽ có các thống kê khác, chẳng hạn như so sánh việc dùng họ làm đệm như vậy phổ biến hơn ở giới nào, và việc biến đổi qua thời gian của việc sử dụng này (tức là người ta có khuynh hướng tăng hay giảm việc sử dụng họ làm đệm qua thời gian).
Một số khái niệm:
- Đệm nhất: là đệm đầu tiên ngay sau họ, xuất hiện ở tất cả các tên có hơn 2 từ.
Ví dụ:
- Tên 3 từ: Họ + Đệm nhất + Tên
- Tên 4 từ: Họ + Đệm nhất + Đệm hai + Tên
- Tên 5 từ: Họ + Đệm nhất + Đệm hai + Đệm ba + Tên
Đệm hai là đệm chỉ xuất hiện ở tên có hơn 3 từ.
Đệm ba là đệm chỉ xuất hiện ở tên có hơn 4 từ.
Thống kê rút trích dữ liệu từ mẫu SG01.
#1. Đệm dạng họ chủ yếu xuất hiện trong đệm nhất, hiếm khi được sử dụng trong đệm hai, đệm ba
Các tên có đệm hai sử dụng đệm dạng họ với tỷ lệ rất thấp.
Nữ | Nam | |
Nguyễn | 0.012% | 0.1% |
Trần | 0.007% | 0.04% |
Lê | 0.11% | 0.33% |
Phạm | 0.001% | 0.015% |
Còn tỷ lệ đệm ba dạng họ còn thấp hơn nữa, hầu như không xuất hiện.
Như vậy so với đệm nhất (bảng ngay bên dưới) thì đệm hai có tỷ lệ sử dụng đệm dạng họ không đáng kể.
#2. Nữ giới sử dụng đệm dạng họ nhiều hơn đáng kể so với nam giới
Dưới đây là bảng thống kê so sánh về việc sử dụng đệm có nguồn gốc từ họ giữa nam và nữ (làm tròn đến số thập phân thứ nhất). Bảng này là phân tích đệm nhất (tức là đệm đầu tiên ngay sau họ) của toàn bộ dữ liệu (bất kỳ tên nào có 3 từ đổ lên đều có đệm nhất):
Nữ | Nam | |
Nguyễn | 6.2% | 4.1% |
Trần | 2.8% | 2.1% |
Lê | 3.3% | 2.3% |
Phạm | 1.5% | 0.8% |
Như vậy chúng ta có thể thấy một cách rõ ràng và thống nhất là tên nữ giới có khuynh hướng sử dụng họ làm đệm nhiều hơn, dựa trên 4 họ trên thì mức độ chênh lệch là gần 1,5 lần.
Nếu nhìn vào bảng các họ phổ biến nhất thì chúng ta thấy họ Nguyễn phổ biến hơn họ Trần khoảng 3 lần, họ Trần phổ biến hơn họ Lê 1.2 lần, và họ Trần phổ biến hơn họ Phạm gần 2 lần. Các kết quả đó phần lớn không tương ứng với việc dùng họ làm đệm. Ngoài họ Trần và Phạm có tỷ lệ sử dụng làm đệm so sánh với nhau cũng tương đồng với thống kê về mức độ phổ biến của họ, còn lại thì khác nhau đáng kể.
Họ Nguyễn phổ biến hơn họ Trần gần 3 lần, nhưng mức độ sử dụng làm đệm chỉ phổ biến hơn 2 lần.
Họ Trần phổ biến hơn họ Lê, nhưng đưa vào làm đệm thì họ Lê lại phổ biến hơn. Đây là trường hợp thú vị để tìm hiểu nguyên nhân. Có thể vấn đề về ngữ nghĩa, ngữ âm, hay số lượng ký tự ngắn gọn khiến họ Lê dễ làm đệm hơn các họ khác?
#3. Đệm dạng họ chủ yếu xuất hiện trong tên 4 từ
Thống kê về đệm nhất(**) dạng họ xuất hiện trong tên 3 từ, 4 từ, 5 từ ở nam và nữ giới:
Tên 3 từ | Tên 4 từ | Tên 5 từ (*) | |
Nguyễn | Nữ: 0.04% Nam: 0.13% |
Nữ: 9.4% Nam: 15.1% |
Nữ: 22.5% Nam: 20.2% |
Trần | Nữ: 0.01% Nam: 0.13% |
Nữ: 4.2% Nam: 7.4% |
Nữ: 8.9% Nam: 8.5% |
Lê | Nữ: 0.36% Nam: 0.48% |
Nữ: 4.7% Nam: 7.3% |
Nữ: 11.9% Nam: 10.8% |
Phạm | Nữ: 0.002% Nam: 0.024% |
Nữ: 2.2% Nam: 3.1% |
Nữ: 3.7% Nam: 3.3% |
Cách hiểu: Ví dụ tên 4 từ, Nguyễn (Nữ: 9.4%, Nam: 15.1%) nghĩa là trong tên 4 từ, họ Nguyễn làm đệm nhất với tỷ lệ 9.4% trong tên nữ giới, và 15.1% trong tên nam giới.
Như vậy cấu trúc của họ tên có đệm-dạng-họ phần lớn sẽ như thế này:
Họ + [Đệm dạng họ] + Đệm 2 + Tên
Rất hiếm khi đệm dạng họ xuất hiện trong tên dạng: Họ + [Đệm dạng họ] + Tên
Tức là đệm dạng họ phần lớn chỉ là đệm nhất và xuất hiện trong tên 4 từ đổ lên mà thôi.
(*) Lưu ý nhỏ: dù đệm dạng họ xuất hiện trong tên 5 từ với tỷ lệ rất cao, nhưng tỷ lệ tên có 5 từ chiếm chưa đến 0,7% trong tên nữ và 0,2% trong tên nam. Tên 3 và 4 từ chiếm 99% số lượng tên. Xem thêm số lượng từ trong họ tên người Việt.
(**) Vì đệm hai, đệm ba chiếm tỷ lệ sử dụng đệm họ rất nhỏ nên chúng ta không xét đến nữa.
#4. Kết quả có mâu thuẫn không? Vậy nam giới hay nữ giới mới sử dụng đệm dạng họ nhiều hơn?
Có một điều thú vị nếu bạn để ý. Nếu tính tỷ lệ tên sử dụng đệm dạng họ bất kể số lượng từ, nhưng phân loại theo giới, thì nữ có tỷ lệ sử dụng nhiều hơn nam (xem mục #2: 6,2% nữ giới có đệm nhất là Nguyễn, trong khi nam là 4,1%). Nhưng nếu phân loại theo cả giới và số lượng từ thì nam giới lại hơn đáng kể ở cả hai dạng họ tên chủ yếu là 3 & 4 từ, còn 5 từ (chiếm tỷ lệ rất thấp*) thì khá tương đồng. Tại sao lại kỳ lạ như vậy?
Điều này rất đáng để xem xét kỹ, nếu không chúng ta sẽ hiểu nhầm các kết quả thống kê.
Sở dĩ có sự khác biệt này là vì ở nữ giới số lượng tên có 4 từ chiếm áp đảo: khoảng 64% nữ giới có tên 4 từ. Trong khi đó tên 4 từ ở nam chỉ khoảng 26%. Trong khi đệm dạng họ tập trung 80 – 90% ở tên 4 từ. Điều này dẫn đến dù tính theo số lượng từ thì tỷ lệ nam giới dùng đệm dạng họ cao hơn, nhưng tính trên tổng thể thì lại thấp hơn.
#5. Diễn biến qua các năm
Do tên 3 từ và 5 từ có số lượng không đáng kể đệm-dạng-họ, nên thống kê bên dưới chỉ tập trung vào tên 4 từ. Năm 2007 đến 2011 là chỉ năm sinh. Giá trị được làm tròn đến số thập phân thứ nhất.
Ở Nữ giới
Nguyễn | Trần | Lê | Phạm | |
2007 | 8.2% | 3.9% | 5% | 2% |
2008 | 9.4% | 3.9% | 4.9% | 2.2% |
2009 | 9.6% | 4.3% | 4.6% | 2.1% |
2010 | 9.7% | 4.3% | 4.5% | 2.4% |
2011 | 9.9% | 4.6% | 5.3% | 2.4% |
Với nữ giới tỷ lệ đệm dạng họ tăng nhẹ với họ Nguyễn, Trần, Phạm, giảm nhẹ với họ Lê.
Nam giới:
Nguyễn | Trần | Lê | Phạm | |
2007 | 14.5% | 7.2% | 7.4% | 3.3% |
2008 | 15.8% | 7.5% | 7.5% | 2.9% |
2009 | 15% | 7.6% | 7.9% | 3.2% |
2010 | 14.9% | 7.4% | 8% | 3% |
2011 | 15.9% | 7.5% | 7.1% | 3.1% |
Với nam giới tỷ lệ đệm dạng họ tương đối ổn định qua các năm.
Vì khoảng thời gian ngắn, chỉ trải dài qua 5 năm nên biến động khó quan sát. Tôi có các mẫu họ tên khác với khoảng thời gian kéo dài hơn sẽ được phân tích trong thời gian tới, và nó có khả năng giúp chúng ta dễ quan sát hơn.
#6. Tổng kết
Lấy năm 2011 làm ví dụ, thì có khoảng 22% nữ giới và 33% nam giới có tên 4 từ xuất phát từ nhu cầu có đệm nhất dạng họ trong tên, và đó mới chỉ xét đến bốn đệm dạng họ phổ biến nhất, nếu xét đầy đủ con số này chắc chắn lớn hơn nữa. Điều đó cho thấy nguyên nhân dẫn đến họ tên người ngày càng dài ra không đơn thuần chỉ xuất phát từ nhu cầu thẩm mỹ (xem thêm các nguyên tắc đặt tên cho con). Câu chuyện này phân tích kỹ ra rất thú vị về mặt văn hóa, nó có thể cho thấy nhu cầu của người mẹ, sự thay đổi của bối cảnh xã hội…
Cuối cùng khi có dữ liệu phong phú hơn, chúng ta sẽ xác minh thêm thông tin:
- Đệm dạng họ có tỷ lệ bao nhiêu % xuất hiện từ họ của mẹ?