Mẫu họ tên người VNTH01 bao gồm 1682729 (hơn 1,6 triệu) họ tên người hợp lệ. Khu vực địa lý hết sức đa dạng, bao gồm cả 3 miền Bắc, Trung, Nam. Đây là mẫu họ tên người lớn nhất chúng tôi hiện có.
Đặc điểm:
- Được tổng hợp từ nhiều nguồn.
- Các nguồn đáng tin cậy.
- Phần lớn dữ liệu đầu vào có chuẩn chính tả cao.
- Không mang đặc trưng vùng miền nào cụ thể.
- Không theo tỷ lệ dân số của từng tỉnh, cũng không theo tỷ lệ dân số của từng miền.
- Trên 98% dữ liệu là của người sinh sau năm 1980.
Ưu điểm:
- Mẫu có số lượng tên người rất lớn.
- Rất hữu ích để đưa ra các thông tin mang tính liệt kê thay vì chỉ thống kê thuần túy theo số lượng.
Nhược điểm:
- Không theo tỷ lệ, do vậy các thống kê thứ hạng không mang tính đại diện chung chính xác cho cả nước, cũng khó mang tính đại diện chính xác cho các vùng. Tuy nhiên vẫn có độ tin cậy nhất định.
Tổng quan về dữ liệu:
Tổng hàng dữ liệu (tất cả): 1729654
Tổng dữ liệu họ tên hợp lệ (nam & nữ): 1682729
–
Tổng dữ liệu họ tên nam hợp lệ: 777626
Tổng dữ liệu họ tên nữ hợp lệ: 905103
–
Tổng dữ liệu họ tên nam hợp lệ (có 2 từ): 8234 (1.059%)
Tổng dữ liệu họ tên nữ hợp lệ (có 2 từ): 1619 (0.179%)
–
Tổng dữ liệu họ tên nam hợp lệ (có 3 từ): 688302 (88.5%)
Tổng dữ liệu họ tên nữ hợp lệ (có 3 từ): 420909 (46.5%)
–
Tổng dữ liệu họ tên nam hợp lệ (có 4 từ): 80460 (10.3%)
Tổng dữ liệu họ tên nữ hợp lệ (có 4 từ): 479640 (53%)
–
Tổng dữ liệu họ tên nam hợp lệ (có 5 từ): 602 (<0.1%)
Tổng dữ liệu họ tên nữ hợp lệ (có 5 từ): 2828 (<0.4%)
–
Tổng dữ liệu họ tên nam hợp lệ (> 5 từ): 28 (<0.004%)
Tổng dữ liệu họ tên nữ hợp lệ (> 5 từ): 107 (<0.012%)
–
Tổng dữ liệu họ tên nam hợp lệ (có 3 – 5 từ / những tên có đệm): 769364
Tổng dữ liệu họ tên nữ hợp lệ (có 3 – 5 từ / những tên có đệm): 903377
–
Hợp lệ nghĩa là thỏa mãn đồng thời các tiêu chí sau: (a) họ tên đúng chính tả; (b) có ít nhất 2 từ; (c) ngày tháng năm sinh thực; (d) trong khoảng năm được chọn; (e) giới tính là nam hoặc nữ.
–
Các danh sách, thống kê hiện có từ mẫu này: