|
|
Dùng lệnh sorting kiểm tra số liệu trong Stata |
|
|
|
|
Trang chủ
>
Quản lý, phân tích số liệu
>
Quản lý số liệu (Data management)
>
Xử lý số liệu
>
Kiểm tra số liệu (Checking data)
>
Dùng lệnh sorting kiểm tra số liệu trong Stata | Dùng lệnh sorting để kiểm tra giá trị bất thường trong Stata | Thongke.info
tiếp tục giới thiệu với các bạn cách để kiểm tra các giá trị bất thường
của số liệu bằng lệnh sort (lệnh sắp xếp thứ tự).
Lênh sort sẽ giúp chúng ta
sắp xếp các giá trị của một hoặc nhiều biến theo thứ tự tăng dần hoặc giảm dần.
Để ta dễ dàng quan sát được những giá trị bất thường của biến.
Syntax:
sort [tên biến]
gsort [-] [+]
[tên biến]
*Lưu ý: Lệnh này chỉ
dùng để sắp xếp từng biến theo thứ tự tăng dần
Ví
dụ 1: Sắp xếp thu nhập hàng tháng (q10-đơn vị triệu đồng) theo thứ tự từ nhỏ đến
lớn
sort
q10 hoặc gsort +q10
list
q10
Ví
dụ 2: Sắp xếp thu nhập hàng tháng (q10) theo thứ tự từ lớn đến nhỏ
gsort
+q10
list q10
Nhìn
vào kết quả liệt kê các giá trị của biến thu nhập, ta thấy thu nhập 100 triệu đồng
là quá lớn so với các giá trị còn lại, đây chính là một giá trị bất thường cần
được kiểm tra lại.
Ngoài
tác dụng trong việc sắp xếp biến, kiểm tra các giá trị bất thường ta có thể ứng
dụng lệnh sort để sắp xếp biến trong quá trình phân tích bằng lệnh
bysort
[tên biến]: lệnh phân tích Ví
dụ: Ta tìm hiểu về tỉ lệ sinh con thứ 2 (q38) ở những người có con đầu là con
gái và những người có con đầu là con trai (q371a-biến giới tính của con đầu)
bysort
q371a: tab q38
|
|
|
|
|
|
|
|