Dựa trên mẫu DKL01 gồm hơn 207 ngàn họ tên người hợp lệ tôi đem ra phân tích để tìm các họ phổ biến nhất của tỉnh Đắk Lắk. Kết quả như sau (cách đọc dữ liệu, từ trái qua lần lượt Thứ tự. Họ người | Số lần tìm thấy trong mẫu | Tỷ lệ phần trăm. Ví dụ 2. Trần | 21005 | 10.136% có nghĩa là họ Trần phổ biến thứ 2, tìm thấy 21005 người có họ này trong mẫu, tỷ lệ 10,136% người có họ này trong mẫu):
Thứ tự | Họ | Số lượng tìm thấy | Tỷ lệ % |
1 | Nguyễn | 61431 | 29.644% |
2 | Trần | 21005 | 10.136% |
3 | Lê | 17354 | 8.374% |
4 | Phạm | 12292 | 5.932% |
5 | Hoàng | 8410 | 4.058% |
6 | Phan | 6580 | 3.175% |
7 | Bùi | 5558 | 2.682% |
8 | Võ | 5335 | 2.574% |
9 | Hồ | 4505 | 2.174% |
10 | Vũ | 4120 | 1.988% |
11 | Đặng | 3940 | 1.901% |
12 | Đỗ | 3678 | 1.775% |
13 | Trương | 3485 | 1.682% |
14 | Huỳnh | 3346 | 1.615% |
15 | Ngô | 3273 | 1.579% |
16 | Đinh | 3210 | 1.549% |
17 | Dương | 2540 | 1.226% |
18 | Trịnh | 2095 | 1.011% |
19 | Nông | 2038 | 0.983% |
20 | Mai | 2024 | 0.977% |
21 | Hà | 1999 | 0.965% |
22 | Đoàn | 1921 | 0.927% |
23 | Lương | 1833 | 0.885% |
24 | Cao | 1773 | 0.856% |
25 | Đào | 1568 | 0.757% |
26 | Y | 1146 | 0.553% |
27 | Lưu | 1055 | 0.509% |
28 | Lý | 1022 | 0.493% |
29 | Triệu | 1019 | 0.492% |
30 | Phùng | 766 | 0.37% |
31 | Đàm | 740 | 0.357% |
32 | Chu | 688 | 0.332% |
33 | Văn | 686 | 0.331% |
34 | Vi | 625 | 0.302% |
35 | Thái | 620 | 0.299% |
36 | Lâm | 608 | 0.293% |
37 | Tạ | 578 | 0.279% |
38 | Vương | 559 | 0.27% |
39 | Tô | 529 | 0.255% |
40 | Hứa | 468 | 0.226% |
41 | Đậu | 463 | 0.223% |
42 | Châu | 455 | 0.22% |
43 | Quách | 316 | 0.152% |
44 | Lục | 316 | 0.152% |
45 | Ma | 290 | 0.14% |
46 | Lại | 289 | 0.139% |
47 | Tống | 268 | 0.129% |
48 | La | 245 | 0.118% |
49 | Bế | 242 | 0.117% |
50 | Mã | 212 | 0.102% |
51 | Mông | 209 | 0.101% |
52 | Đồng | 206 | 0.099% |
53 | Kiều | 204 | 0.098% |
54 | Thân | 195 | 0.094% |
55 | Tăng | 165 | 0.08% |
56 | Sầm | 147 | 0.071% |
57 | Lò | 145 | 0.07% |
58 | Từ | 143 | 0.069% |
59 | Vy | 139 | 0.067% |
60 | Long | 135 | 0.065% |
61 | Bạch | 135 | 0.065% |
62 | Lăng | 133 | 0.064% |
63 | Lã | 125 | 0.06% |
64 | Lộc | 117 | 0.056% |
65 | Lữ | 116 | 0.056% |
66 | Bàn | 115 | 0.055% |
67 | A | 114 | 0.055% |
68 | Doãn | 109 | 0.053% |
69 | Giàng | 104 | 0.05% |
70 | Sùng | 98 | 0.047% |
71 | Giang | 97 | 0.047% |
72 | Nhữ | 96 | 0.046% |
73 | Mạc | 96 | 0.046% |
74 | Lô | 93 | 0.045% |
75 | Ngân | 88 | 0.042% |
76 | Cù | 86 | 0.041% |
77 | Nay | 80 | 0.039% |
78 | Thào | 79 | 0.038% |
79 | Lang | 76 | 0.037% |
80 | Ngọc | 72 | 0.035% |
81 | Diệp | 69 | 0.033% |
82 | Điểu | 69 | 0.033% |
83 | Niê | 69 | 0.033% |
84 | Phương | 65 | 0.031% |
85 | Vàng | 63 | 0.03% |
86 | Mó | 60 | 0.029% |
87 | Nghiêm | 59 | 0.028% |
88 | Hàn | 59 | 0.028% |
89 | Khổng | 57 | 0.028% |
90 | Tôn-nữ | 56 | 0.027% |
91 | Tôn | 55 | 0.027% |
92 | Giáp | 55 | 0.027% |
93 | Ninh | 53 | 0.026% |
94 | Lường | 52 | 0.025% |
95 | Thiều | 51 | 0.025% |
96 | Lành | 48 | 0.023% |
97 | Tôn-thất | 48 | 0.023% |
98 | Đường | 46 | 0.022% |
99 | Hầu | 46 | 0.022% |
100 | Tiêu | 45 | 0.022% |
Tổng 100 họ chiếm tỷ lệ trong tổng số là: 98,6%. Còn nếu chỉ tính 10 họ phổ biến nhất thì con số rơi vào khoảng 73,7%.
Người đọc có thể so sánh thông tin trên với kết quả thống kê tương tự nhưng là đại diện cho mẫu của Việt Nam.
Ưu nhược điểm của thống kê này
Thống kê trên sử dụng mẫu có nguồn thuần nhất, độ tin cậy cao, chất lượng nhập liệu tốt, và đến từ cùng một vùng địa lý. Tuy nhiên mẫu trên loại bỏ tương đối nhiều các họ tên của người dân tộc thiểu số (khoảng 13% so với mẫu được đưa vào thống kê) mà thể hiện dưới dạng không phải văn bản tiếng Việt, bạn có thể tham khảo thêm thông tin về mẫu DKL01 dẫn ở đầu bài để nắm chi tiết.
Ảnh minh họa đầu bài: flickr.com/photos/44528798@N04/20717951210/