MỘT SỐ PHÉP TÍNH THỐNG KÊ MÔ TẢ
MỘT SỐ PHÉP TÍNH THỐNG KÊ MÔ TẢ
Tài liệu này không nhắc lại chương trình thống kê cơ bản mà chỉ đưa ra các ứng dụng của nó trong nghiên cứu khoa học khi thực hiện đề tài.
Trước khi tính toán, cần hiểu có những loại biến số nào.
Có 2 nhóm biến số: Định tính và Định lượng.
Biến số định tính (chỉ tính chất), trong các biến định tính có biến định danh nói chung: Nominal variable, ví dụ màu sắc xanh, đỏ vàng, các loại nghề nghiệp, các tên bệnh.v.v., biến phân hạng – Ordinal variable là biến có các giá trị bằng số rời rạc, xếp theo một thứ tự nhất định, từ thấp đến cao hoặc từ cao đến thấp, ví dụ: giai đoạn 1, 2, 3 hoặc giai đoạn 1a, 1b, 2a, 2b. Biến nhị thức hay nhị phân (là dạng đặc biệt của biến định danh), chỉ nhận 1 trong 2 giá trị (bằng số hoặc bằng chữ).
Biến số định lượng (chỉ số lượng), đặc trưng là các biến đều phải có đơn vị đo lường (như mg. m, UI/L …, là các số liên tục. Các biến có thể tuân theo phân bố chuẩn và không chuẩn.
1.1. Số trung bình (M hay mean )
Số trung bình (mean) số học và trung bình nhân. Sử dụng với biến định lượng. Ở đây chỉ trình bày số trung bình số học.M = ∑ xi/n (nếu mẫu lớn) hoặc M = ∑ xi/(n-1) với mẫu nhỏ.
Trong một số trường hợp, nếu phân bố không chuẩn (lệch phải hoặc lệch trái) trước khi tính số trung bình người ta chuyển số liệu thành 2√ xi hay ngược lại lấy giá trị logarit của xi (lnxi).
Độ lệch chuẩn SD (hay ), thể hiện sự khác nhau giữa các cá thể trong mẫu nghiên cứu:
SD = ∑(M- xi )2/2√ n
Sai số chuẩn (SE), thể hiện sự sai lệch giữa mẫu nghiên cứu và quần thể:
SE = SD /2√ n
Khoảng tin cậy 95% của số trung bình nói lên số trung bình có thể đúng đến 95% trong khoảng thấp nhất là M - 1,96SE và cao nhất là M + 1,96SE; công thức:
CI95% = M ± 1,96SE
1.2. Trung vị (media)
Là giá trị của phép đo thứ xi ở giữa dãy các số liệu mà ở đó có 50% phép đo khác nhỏ hơn và 50% phép đo khác lớn hơn nó. Thường sử dụng trong trường hợp các số liệu tản mát, không theo phân bố chuẩn, như mức chi tiêu y tế bình quân của các hộ gia đình.
1.3. Tỷ lệ (p)
Tỷ lệ có thể được tính theo %, %o hoặc nhỏ hơn. Tỷ lệ có thể là tỷ suất, khi mô tả tần suất hay xác suất xuất hiện của hiện tượng, ví dụ: tỷ lệ hiện mắc tiêu chảy trong cộng đồng.
Tỷ lệ %: p = ∑ xi * 100/n và tỷ lệ %o p = ∑ xi * 1000/n.
SD của tỷ lệ = p (1-p).
SE của tỷ lệ = SD/2√ n.
Khoảng tin cậy 95%: CI95% = p ± 1,96SE.
Cần phân biệt giữa tỷ lệ (proportion) với nguy cơ (risk), tỷ suất (rate) và mức chênh (odds) qua ví dụ sau:
Nghiên cứu theo dõi trên một quần thể 1000 nam giới nghiện thuốc lá từ 10 năm trở lên trong thời gian 2 năm (2000 đến 2001) kết quả phát hiện được mỗi năm có 8 người bị ung thư phổi.
Nguy cơ mắc (risk)= 16/1000 = 0,016 (hay tỷ lệ mắc là 16%o).
Tỷ suất (rate) = số người có hậu quả ung thư phổi chia cho số người chịu nguy cơ /năm (person-time at risk) = 16/(1000+992) = 0,008 trường hợp mắc/người-năm.
(Giải thích: số người chịu nguy cơ vào năm thứ nhất là 1000 người, do năm thứ nhất đã có 8 người bị ung thư, nên số người theo dõi năm thứ 2 chỉ còn 992).
Tỷ lệ % cũng có thể chỉ là phân bố, ví dụ: phân bố số người mắc một bệnh nào đó trong cộng đồng theo nhóm tuổi (thường tính ra % số người mắc trong tổng số các nhóm bằng 100%). Hai phép đo tỷ lệ đều thể hiện bằng % nhưng ý nghĩa rất khác nhau, rất tiếc là nhiều học viên, nghiên cứu viên thường nhầm lẫn ý nghĩa của tỷ lệ phân bố với tỷ lệ mắc.
Ví dụ: tỷ lệ nhiễm HIV trong cộng đồng những người được xét nghiệm trên nhóm nam là 0,2%, nữ là 0,05%, nếu tính phân bố trong những người nhiễm, cứ 100 người nhiễm tỷ lệ phân bố HIV ở nhóm nam thanh niên là 80%, nữ là 20%, trường hợp này không được phép hiểu là 80% nam bị nhiễm HIV. Tương tự như thế, ví dụ hàng năm có 5000 bệnh nhân đến khám, trong đó 1000 người phát hiện bị bệnh tim mạch, tỷ lệ phân bố là 20%, không được coi tỷ lệ mắc 20%, mà chỉ là 20% số đến Khoa để khám chữa bệnh là bệnh nhân tim mạch.
Đây là tải liệu rất quý! được Thầy giảng dạy chia sẻ giúp anh chị em học về thống kê nghiên cứu trong lĩnh vực học.
Cảm ơn đã ghé thăm Blog! Hãy đăng ký KênhYouTube để nhận video mới nhất về chăm sóc sức khỏe, …
* Đọc thêm: