From Wikipedia, the free encyclopedia
Bộ tứ Anscombe bao gồm bốn tập dữ liệu, mỗi bộ gồm mười một cặp (x, y), có những mô tả thống kê cơ bản gần như giống hệt nhau, nhưng lại có phân bố và hình dạng rất khác nhau khi được vẽ đồ thị. Chúng được xây dựng vào năm 1973 bởi nhà thống kê Francis Anscombe để cho thấy tầm quan trọng của việc vẽ đồ thị trước khi phân tích dữ liệu cũng như tác động của giá trị ngoại lai và những yếu tố khác lên các tính chất thống kê. Ông viết bài báo để phản biện lại suy nghĩ cua một số nhà thống kê rằng "tính toán số liệu là chính xác, nhưng đồ thị thì không".[1]
Với cả bốn tập dữ liệu:
Tính chất | Giá trị | Độ chính xác |
---|---|---|
Trung bình của x | 9 | tuyệt đối |
Phương sai mẫu của x | 11 | tuyệt đối |
Trung bình của y | 7.50 | 2 chữ số thập phân |
Phương sai mẫu của y | 4.125 | ±0.003 |
Hệ số tương quan giữa x và y | 0.816 | 3 chữ số thập phân |
Đường thẳng hồi quy tuyến tính | y = 3.00 + 0.500x | lần lượt là 2 và 3 chữ số thập phân |
Hệ số xác định của hồi quy tuyến tính | 0.67 | 2 chữ số thập phân |
Bộ bốn này vẫn thường được dùng để cho thấy tầm quan trọng của việc nhìn vào dữ liệu bằng minh họa trước khi bắt đầu phân tích mối liên hệ, cũng như chỉ ra sự thiếu sót của những số liệu thống kê cơ bản dùng để mô ta một tập dữ liệu.[2][3][4][5][6]
Bộ dữ liệu đầy đủ như sau. Giá trị x của ba tập dữ liệu đầu là giống nhau.[1]
I | II | III | IV | ||||
---|---|---|---|---|---|---|---|
x | y | x | y | x | y | x | y |
10.0 | 8.04 | 10.0 | 9.14 | 10.0 | 7.46 | 8.0 | 6.58 |
8.0 | 6.95 | 8.0 | 8.14 | 8.0 | 6.77 | 8.0 | 5.76 |
13.0 | 7.58 | 13.0 | 8.74 | 13.0 | 12.74 | 8.0 | 7.71 |
9.0 | 8.81 | 9.0 | 8.77 | 9.0 | 7.11 | 8.0 | 8.84 |
11.0 | 8.33 | 11.0 | 9.26 | 11.0 | 7.81 | 8.0 | 8.47 |
14.0 | 9.96 | 14.0 | 8.10 | 14.0 | 8.84 | 8.0 | 7.04 |
6.0 | 7.24 | 6.0 | 6.13 | 6.0 | 6.08 | 8.0 | 5.25 |
4.0 | 4.26 | 4.0 | 3.10 | 4.0 | 5.39 | 19.0 | 12.50 |
12.0 | 10.84 | 12.0 | 9.13 | 12.0 | 8.15 | 8.0 | 5.56 |
7.0 | 4.82 | 7.0 | 7.26 | 7.0 | 6.42 | 8.0 | 7.91 |
5.0 | 5.68 | 5.0 | 4.74 | 5.0 | 5.73 | 8.0 | 6.89 |
Người ta không biết Anscombe đã tạo ra bộ dữ liệu này bằng cách nào.[7] Kể từ khi nó được xuất bản, một số phương pháp đã được phát triển để tạo ra những bộ dữ liệu tương tự với thống kê giống hệt và biểu đồ khác nhau.[7][8]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.