Tin tức

Trang chủ

Giới thiệu

Phương pháp luận

Quản lý, phân tích số liệu

Cơ sở dữ liệu, xuất bản phẩm

Đào tạo và tư vấn

Diễn đàn

	Thiết kế nghiên cứu
	Thiết kế công cụ thu nhập số liệu
	Phương pháp thu nhập số liệu
	Quản lý, phân tích số liệu
	Trình bày kết quả phân tích xuất bản
	Nghiên cứu định tính

	Quản lý số liệu (Data management)
	Phân tích số liệu (Data analysis)
	Bộ số liệu mẫu (dùng cho thực hành)

	Cơ sở dữ liệu địa lý, nhân khẩu
	Cơ sở dữ liệu chuyên ngành
	Xuất bản phẩm

	Đào tạo trực tuyến etraining
	Đào tạo tập trung
	Đào tạo
	Tư vấn
	Các bài giảng theo chủ đề
	Dịch vụ ISMS

Nhập liệu

Xử lý số liệu

Phân tích đơn biến

Phân tích đôi biến (Bivariate analysis)

Kiểm định khi bình phương (chi Square test)

So sánh giá trị trung bình (mean test)

Kiểm định t (t-test)

ANOVA

Phân tích nhân tố khám phá (factor analysis)

Hồi quy logic (logistic regression)

Hồi quy tuyến tính (linear regression)

Phương pháp luận

	Thiết kế nghiên cứu
	Thiết kế công cụ thu nhập số liệu
	Phương pháp thu nhập số liệu
	Quản lý, phân tích số liệu
	Trình bày kết quả phân tích xuất bản
	Nghiên cứu định tính

Quản lý, phân tích số liệu

Trang chủ > Main menu > Phương pháp luận > Quản lý, phân tích số liệu
Chuyển biến dạng chữ có chứa ngày tháng sang biến dạng ngày tháng trong Stata
Ngày tháng năm (date) là một trong các dạng biến đặc biệt và quan trọng trong quá trình phân tích số liệu, nhất là trong các điều tra dinh dưỡng vì liên quan đến tuổi của bà mẹ, tuổi của trẻ nhỏ. Tuy nhiên trong quá trình thu thập số liệu hay nhập liệu thì biến ngày tháng đã không được định dạng đúng về dạng ngày tháng (date) mà lại ở dạng chữ (string) hay dạng số (numberic) do đó chúng ta không thể tính tuổi của ĐTNC (bà mẹ, trẻ nhỏ) hay những giá trị khác liên quan đến biến ngày tháng được. Phần này thongke.info xin giới thiệu tới các bạn cách để chuyển biến dạng chữ (String variable) có chứa ngày tháng năm sang dạng ngày tháng năm chuẩn (date) trong stata. Trường hợp 1: Biến ngày tháng dạng chữ (string variable có chứa 4 chữ cho trường năm, ví dụ 2007) Ví dụ: biến date với format dạng chữ, có chứa số liệu ngày tháng như sau: Khi chúng ta muốn chuyển biến dạng chữ (string variable) sang biến dạng ngày tháng (date) theo đúng thứ tự như biến ban đầu là ngày/tháng/năm, do file sẽ như sau: Với stata phiên bản từ 10 trở lên *gen date2 = date(date, "DMY")* *format date2 %td* Với stata phiên bản 9 *gen date2 = date(date, "dmy*") format date2 %td Sau khi các bạn chạy lệnh trên, kết quả như sau: Dạng biến số đã được chuyển từ string thành float, với định dạng %td. Trường hợp 2: Khi biến ngày tháng được định dạng ở dạng chữ (string variable) với trường năm có 2 số Ví dụ: biến date với format dạng chữ, có chứa số liệu ngày tháng như sau: Khi chúng ta muốn chuyển biến dạng chữ (string variable) sang biến dạng ngày tháng (date) theo đúng thứ tự như biến ban đầu là ngày/tháng/năm, do file sẽ như sau: Với stata phiên bản từ 10 trở lên gen date3 = date(date, "DM20Y") format date3 %td Với stata phiên bản 9 gen date3 = date(date, "dm20y") format date3 %td Mặc dù biến date trên có bao gồm cả giá trị có đầy đủ 4 số trong trường năm (23/04/2012), tuy nhiên điều này không hề ảnh hưởng do đó lệnh trên vẫn được giữ nguyên, được sử dụng khi tất cả các năm có 2 chữ số thuộc cùng một thế kỷ. Sau khi các bạn chạy lệnh trên, kết quả như sau: Dạng biến số đã được chuyển từ string thành float, với định dạng %td. Note: Với những giá trị năm từ 2000 trở lên (2000, 2001, 2002....) thì các bạn sẽ sử dụng lệnh như trên, tuy nhiên với những giá trị năm từ 1900 đến 1999 thì các bạn sẽ thay thành “dm19y” hoặc “DM20Y” tùy thuộc vào từng phiên bản Stata bạn dùng. Tương tự với các giá trị năm khác như 1800, 1700.... Trường hợp 3: Khi biến ngày tháng được định dạng ở dạng chữ (string variable) với trường năm bao gồm cả 2 chữ số, 4 chữ số và thuộc 2 thế kỷ khác nhau như các năm: 1990, 2000... Tuy nhiên trường hợp này phụ thuộc rất nhiều vào bộ số liệu của bạn. Ví dụ bạn có số liệu biến date ở dạng chữ như sau: Khi chúng ta muốn chuyển biến dạng chữ (string variable) sang biến dạng ngày tháng (date) theo đúng thứ tự như biến ban đầu là ngày/tháng/năm, do file sẽ như sau: Với stata phiên bản từ 10 trở lên gen date4 = date(date, "DMY", 2012) format date4 %td Với stata phiên bản 9 gen date4 = date(date, "dmy", 2012) format date*4 %td Các bạn lưu ý, trong trường hợp này 2012 là số năm lớn nhất có thể xảy ra do đó chúng ta sẽ ghi 2012 ở trọng lệnh như trên. Do đó các bạn sẽ thay 2012 bằng một năm khác sao cho phù hợp với data của bạn. Kết quả sẽ như sau: Dạng biến số đã được chuyển từ string thành float, với định dạng %td. Phần sau, thongke.info sẽ giới thiệu tới các bạn cách chuyển biến ngày tháng (date) ở các dạng rời rạc (ví dụ: biến c1 là ngày, biến d1 là tháng và e1 là năm) thành biến ngày tháng dạng chuẩn (date: ngày/tháng/năm). Một số thông tin được tham khảo từ* UCLA Academic Technology Services. *Nguyễn Thị Linh* *Nguyễn Trương Nam - Thongke.info* Số lượt đọc: 6059 - Cập nhật lần cuối: 22/08/2012 09:36:00 AM Về trang trước Bản in Gửi email Về đầu trang Về đầu trang Bài mới: Hướng dẫn khôi phục dữ liệu sau khi gặp sự cố "corrupted" 27/01/2013 11:11' PM Hướng dẫn khôi phục dữ liệu sau khi gặp sự cố "corrupted" 27/01/2013 11:11' PM Khi các bạn đang nhập liệu, nguồn của máy tính đột ngột bị mất (do lỏng đường dây, do mất điện đột ngột) mà bạn vẫn chưa kip lưu thì sau khi bạn khởi động lại máy tính và mở form epidata đang nhập liệu, máy tính sẽ báo lỗi như sau “One or more records are corrupted”. Các bạn sẽ cố gắng tìm mọi cách để mở file đó ra, nhưng sẽ không thể mở được trực tiếp bằng phần mềm Epidata. Như vậy các bạn sẽ phải nhập lại toàn bộ số phiếu mình đã nhập trong form đó nếu bạn không có file backup. Thongke.info xin giới thiệu với các bạn một cách rất đơn giản để khắc phục sự cố này. Thống kê và phương pháp phân tích số liệu - Sử dụng Stata 12/01/2013 10:09' AM Thống kê và phương pháp phân tích số liệu - Sử dụng Stata 12/01/2013 10:09' AM Xin chào các bạn, Trong mục phương pháp luận/Quản lý, phân tích số liệu, Thongke.info đã giới thiệu bài viết sử dụng SPSS trong thống kê mô tả và bên cạnh các bài viết sử dụng phần mềm Stata như: Xử lý missing data sử dụng phương pháp MI - Multiple Inputation, kiểm tra mối tương quan giữa các biến, xử lý giá trị missing, vv. Hôm nay Thongke.info tiếp tục giới thiệu bài viết: Thống kê và phân tích số liệu - Sử dụng phần mềm Stata. Nội dung bài viết: Khái niệm về thống kê cơ bản Lựa chọn trắc nghiệm thống kê Thực hành thống kê với Stata Bảng thuật ngữ Dịch tễ học và Thống kê 14/11/2012 11:49' AM Bảng thuật ngữ Dịch tễ học và Thống kê 14/11/2012 11:49' AM Xin chào các bạn, Trong quá trình học tập và làm việc liên quan tới Dịch tễ học và Thống kê chắc hẳn các bạn đã từng được nghe hoặc biết đến các thuật ngữ như: Case-control Study, Cohort Study, Cross-sectional Study, Chi Square, Crude odds ratio, vv. Hay các thuật ngữ đươc viết tắt: OR, RR, EFp, EFe, vv. Hiện nay có nhiều thuật ngữ được dịch khác nhau dựa trên những quan điểm nhìn nhận khác nhau của các nhà Dịch tế và Thống kê học. Thongke.info xin giới thiệu bảng thuật ngữ Dịch tễ học và Thống kê trên quan điểm của thongke.info. Những vấn đề cơ bản của thống kê thực hành 30/10/2012 09:58' AM Những vấn đề cơ bản của thống kê thực hành 30/10/2012 09:58' AM Thống kê thực hành không nhằm mục đích vào giải quyết những vấn đề lý thuyết của thống kê và thống kê toán. Thống kê thực hành bao gồm các nội dung của quá trình nghiên cứu thống kê cụ thể. Các nội dung này được tiếp cận nhất quán trên tư tưởng của thống kê toán, đặc biệt là phương pháp mẫu ngẫu nhiên trong nghiên cứu thống kê cũng như các công cụ cần thiết trong thực hành, nghiên cứu thống kê. Với mục đích nói trên, thống kê thực hành đề cập đến những nội dung cụ thể sau: Sử dụng SPSS trong thống kê mô tả 30/10/2012 09:28' AM Sử dụng SPSS trong thống kê mô tả 30/10/2012 09:28' AM Ở trong mục quản lý, phân tích số liệu/phân tích số liệu, thongke.info đã giới thiệu với các bạn một số bài viết thực hành phân tích số liệu sử dụng phần mềm SPSS như: phân tích đơn biến,phân tích đôi biến, kiểm định khi bình phương, hồi quy logic, hồi quy tuyến tính, vv. Ở bài viết này ... Thống kê mô tả 26/10/2012 09:46' PM Thống kê mô tả 26/10/2012 09:46' PM Thống kê mô tả luôn là cách thức mở đầu cho các phân tích thống kê nói chung và phân tích kinh tế xã hội nói riêng. Có nhiều cách hiểu và đánh giá vai trò của thống kê mô tả, với quan niệm thống kê mô tả là bước khai phá số liệu, các nội dung trong chương này trình bày thống kê mô tả với hai mục đích chính: một là, thống kê mô tả như một cách thức tổng hợp số liệu và mô tả các đặc trưng quan trọng của các biến; hai là, dùng thống kê mô tả phát hiện các đặc trưng và quan hệ tiềm ẩn trong tổng thể, đặc biệt là các quan hệ nhiều biến. Thongke.info xin giới thiệu với các bạn bài viết: thống kê mô tả, các bạn có thể download bài viết tại đây. Thongke.info xin cám ơn PGS.TS Ngô Văn Thứ đã chia sẻ bài viết. Phương pháp kiểm định tương tác trong phân tích số liệu nghiên cứu khoa học - Assessment of Interaction 02/08/2012 09:36' AM Phương pháp kiểm định tương tác trong phân tích số liệu nghiên cứu khoa học - Assessment of Interaction 02/08/2012 09:36' AM Giới thiệu Đôi khi, mối liên quan giữa hai biến bị thay đổi bởi một biến Bài đã đăng: Kiểm tra mối tương quan giữa các biến bằng phương pháp vẽ biểu đồ và kiểm định sử dụng STATA 25/07/2012 Kiểm tra mối tương quan giữa các biến bằng phương pháp vẽ biểu đồ và kiểm định sử dụng STATA 25/07/2012 01:24' PM Trong phân tích số liệu và thống kê học, phân tích tương quan là một cách để đo lường mối liên quan giữa hai hay nhiều biến với nhau. Trong nghiên cứu khoa học chúng ta thường dựa vào mối liên quan giữa các biến để tính toán và dự báo sự thay đổi của một biến dựa vào thông tin mà chúng ta biết được về các biến liên quan đó. Ví dụ như dựa vào mối tương quan giữa thu nhập và giáo dục, chúng ta có thể thấy những người có trình độ học vấn cao hơn sẽ có thu nhập cao hơn. Khi chúng ta biết được trình độ học vấn của một người, ta có thể dự đoán được thu nhập trong tương lai của họ. Trong bài này, thongke.info sẽ giới thiệu cụ thể mối tương quan giữa hai biến bằng các phương pháp vẽ đồ thị và sử dụng các hệ số tương quan sử dụng phần mềm Stata. Hướng dẫn sử dụng lệnh relate trong Epidata để kết nối các file dữ liệu có cùng một mã ID 11/07/2012 Hướng dẫn sử dụng lệnh relate trong Epidata để kết nối các file dữ liệu có cùng một mã ID 11/07/2012 05:35' PM Hướng dẫn sử dụng lệnh relate trong Epidata để kết nối các file dữ liệu có cùng một mã ID (ứng dụng trong điều tra nhân khẩu hộ gia đình). Phần trước thongke.info đã giới thiệu tới các bạn cách tạo form nhập liệu, cách viết lệnh consistency check trong Epidata. Phần này thongke.info xin được giới thiệu tới các bạn lệnh relate trong Epidata. Chúng ta sử dụng lệnh relate khi các bạn có các rec file riêng biệt và muốn link các rec file đó lại với nhau với cùng một mã ID. Ví dụ: Khi các bạn có một điều tra nhân khẩu hộ gia đình với mục tiêu là điều tra thông tin chung của hộ gia đình, thông tin về từng thành viên trong gia đình. Phương pháp xử lý giá trị missing trong Stata 05/07/2012 Phương pháp xử lý giá trị missing trong Stata 05/07/2012 03:45' PM Trong quá trình thu thập số liệu, nhập liệu có những biến sẽ có giá trị missing. Nguyên nhân có thể do phỏng vấn viên quên hỏi, do nhập liệu viên nhập sót hoặc do thiết kế bộ câu hỏi có những câu hỏi chỉ dành riêng cho nhóm đối tượng nào đó. Ví dụ như hỏi về việc chăm sóc thai nghén sẽ chỉ hỏi ở những người phụ nữ đã từng mang thai, hay hỏi về sử dụng dịch vụ y tế trong 1 tháng qua thì sẽ chỉ hỏi với những đối tượng đã đến cơ sở y tế 1 tháng qua… Chúng ta cần phát hiện và xử lý các giá trị missing này để đảm bảo tính chính xác của các kết quả phân tích. a. Phát hiện các giá trị missing Quản lý số liệu 17/06/2012 Quản lý số liệu 17/06/2012 10:46' AM Thongke.info xin giới thiệu với các bạn bài viết về quản lý số liệu, trong bài viết sẽ cung cấp nhưng phương pháp: thiết kế bộ câu hỏi thu thập số liệu, thử nghiệm bộ câu hỏi trước khi nhập liệu, tạo bộ câu hỏi (.Ques, .Rec, .Chk), nhập số liệu (nhập hai lần), kiểm tra số liệu, kiểm tra logic và tính nhất quán của bộ số liệu, làm sạch số liệu (frequency, cross-tabs, bảng phân bố), và lưu trữ. Các bạn có thể download bài giảng quản lý số liệu tại đây. Ứng dụng phân tích hồi quy (Regression) 20/05/2012 Ứng dụng phân tích hồi quy (Regression) 20/05/2012 01:22' PM Trong quá trình học tập, nghiên cứu, và làm việc trong lĩnh vực nghiên cứu khoa học các bạn đã từng nghe đến phân tích hồi quy. Vậy hồi quy là gì? Và tại sao chúng ta cần phân tích hồi quy? Bài giảng ứng dụng phân tích hồi quy sẽ trả lời cho các bạn câu hỏi đó và đồng thời giới thiệu với các bạn các bước xây dựng mô hình hồi quy, hồi quy tuyến tính đa biến và hồi quy logic. Download bài giảng ứng dụng phân tích hồi quy. Tạo bảng trống/bảng giả cho phân tích số liệu (Dummy tables) 20/05/2012 Tạo bảng trống/bảng giả cho phân tích số liệu (Dummy tables) 20/05/2012 12:12' PM Xin chào các bạn, Dummy tables là các bảng giả (mock tables) tạo ra trước khi phân tích số liệu, được tạo dựa trên câu hỏi nghiên cứu và kế hoạch phân tích, và giúp định hướng cụ thể các phân tích để trả lời câu hỏi nghiên cứu. Bảng dummy chính là kế hoạch phân tích chi tiết và cũng là công cụ để giúp thảo luận và thống nhất phân tích trong nhóm các nghiên cứu viên, vv. Nội dung bài viết: Lý do tạo bảng trống - Dummy tables Các loại bảng trống Tạo bảng trống Giới thiệu các loại bảng trống Ví dụ tạo các loại bảng trống Làm sạch số liệu và tạo biến trong SPSS 20/05/2012 Làm sạch số liệu và tạo biến trong SPSS 20/05/2012 10:54' AM Làm sạch số liệu là một bước quan trọng để sử dụng số liệu trước khi phân tích. Làm sạch số liệu ban đầu có thể thực hiện ngay trong quá trình thực địa, nghĩa là khâu quản lý và giám sát chất lượng tại thực địa tốt. Điều này sẽ làm hạn chế các lỗi, sai sót trong bộ số liệu và việc sử dụng các phần mềm (SPSS, Stata) để làm sạch số liệu sau này sẽ tiết kiệm thời gian và đỡ phức tạp hơn. Các bạn có thể thao khảo bài viết "Giám sát chất lượng". Trong bài viết này, thongke.info sẽ giới thiệu với các bạn: Cách làm sạch số liệu sử dụng phần mềm SPSS Tạo biến mới sử dụng phần mềm SPSS Kiểm tra phân bố chuẩn sử dụng phần mềm SPSS