|
|
|
Quản lý, phân tích số liệu |
   |
|
|
|
Trang chủ
>
Main menu
>
Phương pháp luận
>
Quản lý, phân tích số liệu | Phương pháp kiểm định tương tác trong phân tích số liệu nghiên cứu khoa học - Assessment of Interaction | Giới
thiệu
Đôi khi, mối liên quan giữa hai biến bị thay đổi bởi một biến kiểm
soát khác. Điều
này có nghĩa độ mạnh và/hoặc hướng của sự kết hợp thay đổi tùy theo giá trị của một hay nhiều biến được thêm vào.
Định
nghĩa
Tương
tác (Interaction) tồn
tại khi mối tương quan thực sự giữa hai biến thay đổi do giá trị của biến thứ
ba thay đổi.
|
Ví dụ
Để chứng minh
cho những điều trên, thongke.info sẽ sử dụng bộ
số liệu gồm 1.277 phụ nữ trong
độ tuổi sinh sản trên địa bàn tỉnh A. Phần mềm Stata được sử dụng để phân tích. Chúng ta muốn kiểm tra các mối liên quan giữa
việc sử dụng các phương pháp tránh
thai hiện đại của phụ nữ và số con hiện sống mà một người phụ nữ có.
Câu hỏi nghiên cứu: Việc
có thêm
một con có tác động gì đến việc
sử dụng các biện pháp tránh thai hiện đại ở phụ nữ trong
độ tuổi sinh sản trên địa bàn tỉnh A?
Chúng ta dự đoán rằng một người phụ nữ càng có nhiều con thì người phụ nữ đó
sẽ càng có nhiều
khả năng sử dụng
các biện pháp tránh
thai hiện đại để tránh
thai. Tuy nhiên, chúng ta nghi ngờ rằng mối liên
quan này thay đổi theo tuổi của người phụ nữ. Bởi vì cả số lượng
con và độ tuổi đều có thể tiên lượng việc sử dụng các biện pháp tránh thai. Ngoài ra, phụ nữ trẻ và
phụ nữ lớn tuổi có
thể có những thái độ và
thực hành khác nhau liên quan tới quy mô gia đình và việc sử dụng biện pháp tránh thai. Để tìm ra mối liên quan này, chúng tôi thực hiện theo các bước sau đây: Phân tích đơn biến
Các biến được mô
tả dưới đây.
Biến
phụ thuộc (kết quả):Sử
dụng các biện pháp tránh thai hiện đại [use_modern] - No=0=
Không sử dụng biện pháp tránh thai nào hoặc sử dụng biện pháp tránh thai truyền
thống
- Yes=1= Sử dụng biện
pháp tránh thai hiện đại (vòng tránh thai, bao cao su hay thuốc)

Biến độc lập:
- Biến quan tâm : Số trẻ hiện sống
(biến liên tục) [total_child_alive]
- Biến nghi ngờ tương
tác: Tuổi tính theo năm
(biến liên tục) [age]

Phân tích đôi biến
Sử dụng phân tích đôi
biến, chúng ta có thể kiểm tra mối tương quan giữa các biến độc lập với việc sử
dụng biện pháp tránh thai hiện đại. Vì cả hai biến độc lập đều là biến liên tục,
do đó chúng ta sử dụng kiểm định t-test.
Có
mối liên quan có ý nghĩa thống kê giữa số con
hiện sống, và tuổi của người phụ nữ với
việc sử dụng biện pháp
tránh thai hiện đại (P <0,01).
Để tìm bằng chứng của sự tương tác, chúng ta kiểm tra độ
mạnh của mối liên quan giữa kết quả với biến độc lập quan tâm ở các mức độ khác nhau của biến thứ ba. Trong ví dụ này, chúng ta sử dụng lệnh logit để tính tỷ suất chênh (OR) giữa
việc sử dụng biện pháp tránh thai hiện đại (có với không) với mỗi con được sinh thêm ở các độ tuổi khác nhau của
người phụ nữ- 25 tuổi, 35tuổi và 45 tuổi.
A)
25 tuổi 
B) 35 tuổi 
C)
45 tuổi 
Kết quả cho thấy rằng có sự tương tác bởi mối liên
quan giữa việc sử dụng biện pháp tránh thai hiện đại và số con hiện sống là khác nhau giữa
các phụ nữ ở độ tuổi 25 (OR = 7.48),
độ tuổi 35 (OR = 1.00)
và độ tuổi 45 (OR =
2,08).
Phân tích đa biến
Bây giờ
chúng ta muốn phân
tích mối liên quan giữa việc sử dụng biện
pháp tránh thai hiện đại và số con hiện sống bị ảnh hưởng như thế nào bởi độ tuổi. Đầu tiên, chúng ta đưa vào mô hình đánh giá tác động chính (main effect) của số
con hiện sống và độ tuổi của bà mẹ. Phân tích hồi quy đa biến được sử dụng vì có nhiều hơn một biến
độc lập nhị phân
(Lưu ý: biến nhị phân được mã hóa
là 0 và 1).
Kết quả cho thấy biến số lượng con hiện sống vẫn có liên quan có ý nghĩa thống kê với việc sử dụng biện pháp
tránh thai hiện đại, được kiểm soát bởi độ tuổi của bà mẹ (P <0,001). Chúng ta cũng có thể nói rằng có mối liên
quan giữa độ tuổi của bà mẹ với việc sử dụng biện pháp
tránh thai hiện đại, được kiểm soát bởi số con hiện sống (P <0,001). Bà mẹ có thêm một con (hiện sống) có khả năng sử
dụng biện pháp tránh thai hiện đại cao gấp 1.76 lần với khoảng
tin cậy 95% nằm trong khoảng 1,48-2,10.
Tạo một biến tương tác
Cách tiếp cận phổ biến nhất của mô
hình tương tác là
thêm một biến tương tác “cross-product”
vào mô hình. Biến
này được tạo ra bằng cách nhân hai biến độc lập với nhau. Trong
trường hợp này, chúng ta tạo ra biến tương tác bằng cách nhân biến số con hiện sống với độ tuổi của người phụ nữ.
Đưa biến tương tác vào mô hình
Sau khi tạo biến
tương tác, đưa vào trong mô hình.
Kiểm định Wald
Sử dụng kiểm định
Wald để xác định biến tương tác có ý nghĩa thống kê trong mô hình.
Biến tương tác
có ý nghĩa thống kê (P <0,001), có nghĩa
là mối liên quan giữa việc sử dụng biện pháp tránh thai hiện đại và số con hiện sống phụ thuộc vào độ tuổi của phụ nữ.
Tìm tỷ suất chênh
Bây giờ
chúng ta biết rằng có mối liên quan giữa việc sử dụng biện pháp tránh thai hiện đại với số con hiện sống và mối liên quan này thay đổi theo độ tuổi của
bà mẹ. Để đo lường mức
độ của mối tương quan này, chúng
ta ước tính các tỷ suất chênh đối với phụ nữ ở các độ tuổi khác nhau. Sử
dụng lệnh lincom để tính tỷ
suất chênh và khoảng tin cậy 95%
(CI).
A) So sánh 2 người phụ
nữ ở độ tuổi 25 - một người có nhiều hơn 1 con so với người còn lại
Lưu ý: Bởi vì hai người có cùng độ tuổi, nên nó là hằng số. Điều này có nghĩa là bạn không cần phải thêm biến "tuổi" trong phương trình lệnh lincom. Chỉ thêm các
biến có khác biệt giữa những phụ nữ đang so sánh
B) So sánh 2 người phụ
nữ ở độ tuổi 35 - một người có nhiều hơn 1 con so với người còn lại 
C) So sánh 2 người phụ nữ ở độ tuổi 45 - một người
có nhiều hơn 1 con so với người còn lại 
Kết luận
Mối liên quan giữa số
con hiện sống và việc sử dụng biện
pháp tránh thai hiện đại phụ thuộc
vào độ tuổi của người phụ nữ. Khi độ
tuổi tăng, mối
liên quan giữa việc sử dụng biện pháp tránh thai hiện đại và số lượng trẻ giảm dần.
Trong số các phụ nữ
ở độ tuổi 25, việc sinh thêm một con có liên quan tới việc
tăng 3.4 lần khả năng sử dụng biện
pháp tránh thai hiện đại. So sánh với phụ nữ ở độ tuổi 45 sinh thêm một con chỉ tăng 1.28 lần khả năng sử dụng các
biện pháp tránh thai hiện đại so với những người khác cùng độ tuổi mà có ít con hơn. Điều
này cũng được trình bày trong đồ thị dưới
đây. Độ dốc ở độ tuổi 25 dốc hơn so với độ tuổi 45, cho thấy
rằng mối liên quan hệ giữa
số con hiện sống và việc sử dụng
biện pháp tránh thai hiện đại trong nhóm tuổi này là mạnh hơn.
Sarah Keithly – thongke.info Nguyễn Trương Nam
Số lượt đọc:
10060
-
Cập nhật lần cuối:
22/08/2012 08:54:15 AM Hướng dẫn khôi phục dữ liệu sau khi gặp sự cố "corrupted"27/01/2013 11:11' PM Khi các bạn đang nhập liệu, nguồn của máy tính đột ngột bị mất (do lỏng đường dây, do mất điện đột ngột) mà bạn vẫn chưa kip lưu thì sau khi bạn khởi động lại máy tính và mở form epidata đang nhập liệu, máy tính sẽ báo lỗi như sau “One or more records are corrupted”.
Các bạn sẽ cố gắng tìm mọi cách để mở file đó ra, nhưng sẽ không thể mở được trực tiếp bằng phần mềm Epidata. Như vậy các bạn sẽ phải nhập lại toàn bộ số phiếu mình đã nhập trong form đó nếu bạn không có file backup.
Thongke.info xin giới thiệu với các bạn một cách rất đơn giản để khắc phục sự cố này. Thống kê và phương pháp phân tích số liệu - Sử dụng Stata12/01/2013 10:09' AM Xin chào các bạn,
- Khái niệm về thống kê cơ bản
- Lựa chọn trắc nghiệm thống kê
- Thực hành thống kê với Stata
Bảng thuật ngữ Dịch tễ học và Thống kê14/11/2012 11:49' AM Xin chào các bạn, Trong quá trình học tập và làm việc liên quan tới Dịch tễ học và Thống kê chắc hẳn các bạn đã từng được nghe hoặc biết đến các thuật ngữ như: Case-control Study, Cohort Study, Cross-sectional Study, Chi Square, Crude odds ratio, vv. Hay các thuật ngữ đươc viết tắt: OR, RR, EFp, EFe, vv. Hiện nay có nhiều thuật ngữ được dịch khác nhau dựa trên những quan điểm nhìn nhận khác nhau của các nhà Dịch tế và Thống kê học. Thongke.info xin giới thiệu bảng thuật ngữ Dịch tễ học và Thống kê trên quan điểm của thongke.info. Những vấn đề cơ bản của thống kê thực hành30/10/2012 09:58' AM Thống kê thực hành không nhằm mục đích vào giải quyết những vấn đề lý thuyết của thống kê và thống kê toán. Thống kê thực hành bao gồm các nội dung của quá trình nghiên cứu thống kê cụ thể. Các nội dung này được tiếp cận nhất quán trên tư tưởng của thống kê toán, đặc biệt là phương pháp mẫu ngẫu nhiên trong nghiên cứu thống kê cũng như các công cụ cần thiết trong thực hành, nghiên cứu thống kê. Với mục đích nói trên, thống kê thực hành đề cập đến những nội dung cụ thể sau: Thống kê mô tả26/10/2012 09:46' PM Thống kê mô tả luôn là cách thức mở đầu cho các phân tích thống kê nói chung và phân tích kinh tế xã hội nói riêng. Có nhiều cách hiểu và đánh giá vai trò của thống kê mô tả, với quan niệm thống kê mô tả là bước khai phá số liệu, các nội dung trong chương này trình bày thống kê mô tả với hai mục đích chính: một là, thống kê mô tả như một cách thức tổng hợp số liệu và mô tả các đặc trưng quan trọng của các biến; hai là, dùng thống kê mô tả phát hiện các đặc trưng và quan hệ tiềm ẩn trong tổng thể, đặc biệt là các quan hệ nhiều biến.
Thongke.info xin giới thiệu với các bạn bài viết: thống kê mô tả, các bạn có thể download bài viết tại đây.
Thongke.info xin cám ơn PGS.TS Ngô Văn Thứ đã chia sẻ bài viết.
Bài đã đăng: Cách gộp các biến biến rời rạc (ngày), (tháng), (năm) thành biến thời gian đầy đủ - date (ngày/tháng/năm) – Sử dụng Stata26/07/2012 08:58' PM Ở phần trước thongke.info đã giới thiệu tới các bạn cách chuyển biến dạng chữ (String variable) có chứa ngày tháng năm sang dạng ngày tháng năm chuẩn (date) trong Stata. Trong bài này, thongke.info xin giới thiệu cách các bạn cách gộp các biến biến rời rạc ea1(ngày), eb1(tháng), ec1(năm) thành biến date(ngày/tháng/năm) và cách tách biến ngày tháng năm chuẩn thành các biến rời rạc (ngày, tháng và năm) Trường hợp 1: Cách gộp các biến biến rời rạc ea1(ngày), eb1(tháng), ec1(năm) thành biến date(ngày/tháng/năm) Xử lý missing data sử dụng phương pháp MI – Multiple Imputation trong Stata26/07/2012 08:44' PM Trong bài “phương pháp xử lý giá trị missing trong stata” kì trước được trình bày trong mục “Phương pháp luận/quản lý, xử lý số liệu”, thongke.info đã giới thiệu 2 phương pháp xử lý giá trị missing: kiểm tra giá trị thực và thay thế giá trị missing và thay thế giá trị missing bằng các giá trị trung bình, trung vị.
Trong bài này, thongke.info giới thiệu với các bạn phương pháp dự đoán/ước tính giá trị missing – IMPUTATION dựa trên mô hình phân tích hồi quy đa biến, sử dụng phương pháp Multiple Imputation – MI trong Stata.
Chúng ta sẽ xem xét ví dụ: một chương trình can thiệp có mục tiêu nâng cao kiến thức phòng tránh HIV cho thanh thiếu niên đường phố. Chương trình thực hiện nghiên cứu tìm hiểu các yếu tố tác động đến kiến thức về HIV của thanh thiếu niên đường phố. Chuyển biến dạng chữ có chứa ngày tháng sang biến dạng ngày tháng trong Stata26/07/2012 08:19' PM Ngày tháng năm (date) là một trong các dạng biến đặc biệt và quan trọng trong quá trình phân tích số liệu, nhất là trong các điều tra dinh dưỡng vì liên quan đến tuổi của bà mẹ, tuổi của trẻ nhỏ. Tuy nhiên trong quá trình thu thập số liệu hay nhập liệu thì biến ngày tháng đã không được định dạng đúng về dạng ngày tháng (date) mà lại ở dạng chữ (string) hay dạng số (numberic) do đó chúng ta không thể tính tuổi của ĐTNC (bà mẹ, trẻ nhỏ) hay những giá trị khác liên quan đến biến ngày tháng được. Phần này thongke.info xin giới thiệu tới các bạn cách để chuyển biến dạng chữ (String variable) có chứa ngày tháng năm sang dạng ngày tháng năm chuẩn (date) trong stata.
Trường hợp 1: Biến ngày tháng dạng chữ (string variable có chứa 4 chữ cho trường năm, ví dụ 2007) Ví dụ: biến date với format dạng chữ, có chứa số liệu ngày tháng như sau: Kiểm tra mối tương quan giữa các biến bằng phương pháp vẽ biểu đồ và kiểm định sử dụng STATA25/07/2012 01:24' PM Trong phân tích số liệu và thống kê học, phân tích tương quan là một cách để đo lường mối liên quan giữa hai hay nhiều biến với nhau. Trong nghiên cứu khoa học chúng ta thường dựa vào mối liên quan giữa các biến để tính toán và dự báo sự thay đổi của một biến dựa vào thông tin mà chúng ta biết được về các biến liên quan đó. Ví dụ như dựa vào mối tương quan giữa thu nhập và giáo dục, chúng ta có thể thấy những người có trình độ học vấn cao hơn sẽ có thu nhập cao hơn. Khi chúng ta biết được trình độ học vấn của một người, ta có thể dự đoán được thu nhập trong tương lai của họ.
Trong bài này, thongke.info sẽ giới thiệu cụ thể mối tương quan giữa hai biến bằng các phương pháp vẽ đồ thị và sử dụng các hệ số tương quan sử dụng phần mềm Stata. Hướng dẫn sử dụng lệnh relate trong Epidata để kết nối các file dữ liệu có cùng một mã ID11/07/2012 05:35' PM Hướng dẫn
sử dụng lệnh relate trong Epidata để kết nối các file dữ liệu có cùng
một mã ID (ứng dụng trong điều tra nhân khẩu hộ gia đình).
Phần trước thongke.info đã giới thiệu tới các
bạn cách tạo form nhập liệu, cách viết lệnh consistency check trong Epidata. Phần
này thongke.info xin được giới thiệu tới các bạn lệnh relate trong Epidata.
Chúng ta sử dụng lệnh relate khi các bạn có
các rec file riêng biệt và muốn link các rec file đó lại với nhau với cùng một
mã ID.
Ví dụ: Khi
các bạn có một điều tra nhân khẩu hộ gia đình với mục tiêu là điều tra thông
tin chung của hộ gia đình, thông tin về từng thành viên trong gia đình. Phương pháp xử lý giá trị missing trong Stata05/07/2012 03:45' PM Trong quá trình thu thập số liệu, nhập liệu có những biến sẽ có giá trị missing. Nguyên nhân có thể do phỏng vấn viên quên hỏi, do nhập liệu viên nhập sót hoặc do thiết kế bộ câu hỏi có những câu hỏi chỉ dành riêng cho nhóm đối tượng nào đó. Ví dụ như hỏi về việc chăm sóc thai nghén sẽ chỉ hỏi ở những người phụ nữ đã từng mang thai, hay hỏi về sử dụng dịch vụ y tế trong 1 tháng qua thì sẽ chỉ hỏi với những đối tượng đã đến cơ sở y tế 1 tháng qua… Chúng ta cần phát hiện và xử lý các giá trị missing này để đảm bảo tính chính xác của các kết quả phân tích. a. Phát hiện các giá trị missing Quản lý số liệu17/06/2012 10:46' AM Thongke.info xin giới thiệu với các bạn bài viết về quản lý số liệu, trong bài viết sẽ cung cấp nhưng phương pháp: thiết kế bộ câu hỏi thu thập số liệu, thử nghiệm bộ câu hỏi trước khi nhập liệu, tạo bộ câu hỏi (.Ques, .Rec, .Chk), nhập số liệu (nhập hai lần), kiểm tra số liệu, kiểm tra logic và tính nhất quán của bộ số liệu, làm sạch số liệu (frequency, cross-tabs, bảng phân bố), và lưu trữ.
Các bạn có thể download bài giảng quản lý số liệu tại đây. | |
|
|
|
|
|
|
|