Tin mới
Hồi quy OLS
(17 Bài viết)
Độ phù hợp hồi quy Stepwise

Độ phù hợp hồi quy Stepwise

Nhược điểm lớn nhất của hồi quy Stepwise là cho phép các biến không có liên quan vào trong mô hình, do vậy, hồi quy Stepwise có thể tạo ra các mối quan hệ ảo hay tác động giả lên biến phụ thuộc trong mô hình....
read more
Lựa chọn dạng hàm

Lựa chọn dạng hàm

Để xác định mô hình hồi quy tuyến tính cổ điển CLRM, chúng ta phải lựa chọn một dạng hàm cụ thể. Chúng ta có thể chọn bất kì dạng hàm nào mà các tham số được ước lượng là tuyến tính. Nếu chúng ta chọn sai dạng hàm, thì mô hình được xác định nhầm và không phù hợp với dữ liệu...
read more
Lựa chọn mô hình – Stepwise vs BMA

Lựa chọn mô hình – Stepwise vs BMA

Xây dựng mô hình thống kê là một nghệ thuật toán học. Vì lý do đó, các nhà nghiên cứu phải cân nhắc rất nhiều yếu tố để đi đến một mô hình đẹp. Mô hình đẹp là một mô hình đơn giản mô tả sát nhất với thực tế. Một mô hình phản ánh 100% thực tế đôi khi không còn là “mô hình” nữa, vì tính quá phức tạp không thể ứng dụng được của nó. Ngược lại, một mô hình chỉ mô tả thực tế khoảng 1% thì cũng không thể sử dụng được. Xây dựng mô hình, do đó, không chỉ tùy thuộc vào các phép tính thống kê, toán học, mà còn phải xem xét đến các yếu tố thực tế để bảo đảm cho sự hữu ích của mô hình. Nói như Good va2 Hardin[1] (2006, trang 152): “Don’t be too quick to turn on the computer. Bypassing the brain to compute by reflex is a sure recipe for disaster.”...
read more
Lựa chọn trọng số: pweight hay fweight

Lựa chọn trọng số: pweight hay fweight

Một trong những sai lầm phổ biến nhất xảy ra khi phân tích dữ liệu từ cuộc điều tra mẫu là lựa chọn trọng số của mẫu không phù hợp. Có 4 loại trọng số mẫu thường được sử dụng trong phân tích dữ liệu điều tra là: Trọng số xác suất: pweight (pw); Trọng số tần suất: fweight (fw); Trọng số phân tích: aweight (aw); Trọng số ảnh hưởng: iweight (iw)...
read more
Tương quan Pearson – Stata

Tương quan Pearson – Stata

Giá trị hệ số xác định R bình phương trong hồi quy tuyến tính giản đơn chính là tham số ước lượng của hệ số tương quan Person. Nội dung bài viết này trình bày về hệ số tương quan Pearson....
read more
Tương quan hạng Spearman – Stata

Tương quan hạng Spearman – Stata

Tương quan hạng Spearman được sử dụng thay thế tương quan Pearson để kiểm tra mối quan hệ giữa hai biến được xếp hạng hoặc một biến được xếp hạng và một biến đo lường không yêu cầu có phân phối chuẩn...
read more
Hồi quy tuyến tính – OLS – Stata

Hồi quy tuyến tính – OLS – Stata

Mô hình hồi quy tuyến tính được sử dụng để xác định mối quan hệ tuyến tính giữa một (hồi quy tuyến tính giản đơn) hoặc nhiều biến giải thích (hồi quy tuyến tính đa biến) với một biến phụ thuộc dạng liên tục. Thông thường có 3 phương pháp được sử dụng phổ biến để ước lượng mô hình hồi quy tuyến tính: Ước lượng bình phương thông thường nhỏ nhất (OLS); Ước lượng bình phương tổng quát nhỏ nhất (GLS); Ước lượng hợp lý cực đại (ML)...
read more
Đọc kết quả ước lượng OLS – Stata

Đọc kết quả ước lượng OLS – Stata

Tiếp theo bài phương pháp ước lượng hồi quy tuyến tính, bài viết này sẽ trình bày cách đánh giá độ tin cậy của mô hình và hướng dẫn đọc kết quả ước lượng OLS. Nội dung bao gồm 2 phần: đầu tiên là phần đánh giá độ tin cậy của mô hình hồi quy tuyến tính; tiếp đến là hướng dẫn đọc kết quả ước lượng OLS trên phần mềm Stata....
read more
Bảng tra phân phối F – F distribution table

Bảng tra phân phối F – F distribution table

Giới thiệu về phân phối F Phân phối F (hay thống kê F) là một phân phối lệch phải (right-skewed distribution) được sử dụng phổ biến trong phân tích phương sai. Khi đề cập đến thống kê F thì trước hết cần xác định 2 bậc tự do k1, k2...
read more
Bảng tra thống kê Durbin-Watson

Bảng tra thống kê Durbin-Watson

Kiểm định thống kê Durbin-Watson là một loại kiểm định được sử dụng phổ biến để phát hiện vấn đề tự tương quan trong mô hình tự hồi quy bậc 1. Sau khi chạy hồi quy, có thể sử dụng câu lệnh dwstat để có được giá trị thống kê Durbin-Watson tính toán (dw). Kết quả của dw sẽ được so sánh với các giá trị dL, dU tra bảng (ở mức ý nghĩa alpha và số biến giải thích trong mô hình). Các giá trị này được tổng hợp ở bảng bên dưới...
read more
Phân biệt độ lệch chuẩn với sai số chuẩn

Phân biệt độ lệch chuẩn với sai số chuẩn

Trong các tạp chí khoa học, chúng ta thường thấy những kí hiệu dạng x ± y, trong đó x là số trung bình, còn y thì có khi là độ lệch chuẩn (standard deviation – SD), đôi khi là sai số chuẩn (standard error – SE) hoặc SEM (standard error of the mean). Cách trình bày này thông dụng đến nỗi một số chuyên gia và các ban biên tập phải lên tiếng khuyến cáo (đưa ra quy ước chung). Theo đó:...
read more
Đôi điều về tính chất BLUE của ước lượng

Đôi điều về tính chất BLUE của ước lượng

Chúng ta gần như rất quen thuộc với các khái niệm như kết hợp tuyến tính (linearity), độ tin cậy (consistent), tính không chệch (unbiased) hoặc tính nhất quán, hiệu quả (effective) của ước lượng. Đó chính là các tính chất BLUE của ước lượng. Vậy một ước lượng như thế nào được gọi là BLUE. Sau đây là đôi điều “tản mạn” về tính chất BLUE của ước lượng....
read more
Tác động tương tác giữa 2 biến liên tục

Tác động tương tác giữa 2 biến liên tục

Chúng ta thường gặp trường hợp tương tác giữa một biến nhị phân với một biến liên tục. Trong trường hợp này, hệ số của biến tương tác sẽ cho biết sự chênh lệch về tác động trung bình của biến liên tục ở hai nhóm. Tuy nhiên, trong nhiều trường hợp vẫn có sự tương tác giữa 2 biến liên tục, chẳng hạn như sự tương tác giữa tuổi tác và cân nặng đến tình trạng sức khỏe. Trong trường hợp này, hệ số tương tác giữa 2 biến liên tục sẽ được giải thích như thế nào? Bài viết sau sẽ minh họa và giải thích sự tương tác giữa 2 biến liên tục trong hồi quy OLS (Interaction effects between continuous variables)....
read more
Phân biệt gen vs egen, listwise vs pairwise deletion

Phân biệt gen vs egen, listwise vs pairwise deletion

Trong mỗi kỹ thuật thống kê, chúng ta cần biết chắc là đang thao tác trên các quan sát hợp lý (non-missing) hay có tồn tại các giá trị missing. Do vậy, hiểu và quản lý các giá trị missing là một việc rất quan trọng trong bất kì loại phân tích thống kê nào. Bài viết sẽ trình bày cách mã hóa và phân biệt listwise vs pairwise delection trong hồi quy và cách tạo biến gen vs egen trong trường hợp dữ liệu tồn tại missing....
read more
Các tiêu chuẩn thông tin trong lựa chọn mô hình

Các tiêu chuẩn thông tin trong lựa chọn mô hình

Tương tự như thống kê độ phù hợp trong mô hình hồi quy, R2 thì các tiêu chuẩn thông tin cũng bao gồm thành phần độ phù hợp dựa trên giá trị log-likelihood và thành phần phức tạp dựa trên tham số được ước lượng của mô hình. Tiêu chuẩn thông tin như AIC, AICc, HQ, BIC/SIC cung cấp cho chúng ta công cụ so sánh các dạng mô tả khác nhau của mô hình và lựa chọn mô hình phù hợp giữa chúng. Mô hình đơn giản là mô hình được lựa chọn. Bài viết sẽ trình bày ý nghĩa, cách tính toán, so sánh các tiêu chuẩn thông tin cùng với các lưu ý về cách sử dụng các tiêu chuẩn này trong việc lựa chọn mô hình....
read more
Hồi quy OLS đa biến

Hồi quy OLS đa biến

Mô hình hồi quy hai biến là mô hình giản đơn nhất. Trong nhiều trường hợp mô hình này không phù hợp vì thường có nhiều biến tác độngđến biến phụ thuộc Y. Do đó cần phải mở rộng mô hình hồi quy hai biến thành mô hình có chứa nhiều biến hơn...
read more
Giới thiệu về hồi quy OLS đơn biến

Giới thiệu về hồi quy OLS đơn biến

Hồi quy là nghiên cứu sự tác động của biến độc lập đến biến phụ thuộc và nếu biết được giá trị của biến độc lập thì ta ước lượng được giá trị của biến phụ thuộc....
read more
Hide Buttons