Mở đầu trang 62 Toán 11 Tập 1: Một cửa hàng đã ghi lại số tiền bán xăng cho 35 khách hàng đi xe máy. Mẫu số liệu gốc có dạng: x1, x2, ..., x35 trong đó xi là số tiền bán xăng cho khách hàng thứ i. Vì một lí do nào đó, cửa hàng chỉ có mẫu số liệu ghép nhóm dạng sau:
Dựa trên mẫu số liệu ghép nhóm này, làm thế nào để ước lượng các số đặc trưng đo xu thế trung tâm (số trung bình, trung vị, tứ phân vị, mốt) cho mẫu số liệu gốc?
Lời giải:
Sau bài học này, ta sẽ giải quyết được bài toán trên như sau:
+) Số trung bình
Trong mỗi khoảng số tiền, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:
Tổng số khách hàng là n = 35. Số tiền bán xăng trung bình của 35 khách hàng là
Do đó, số trung bình cho mẫu số liệu gốc khoảng 63 nghìn đồng.
+) Số trung vị, tứ phân vị
Cỡ mẫu là n = 35.
Gọi x1, x2, ..., x35 là số tiền xăng của 35 khách hàng và giả sử dãy này đã được sắp xếp theo thứ tự tăng dần. Khi đó, trung vị là x18. Do x18 thuộc nhóm [30; 60) nên nhóm này chứa trung vị. Do đó, p = 2; a2 = 30; m2 = 15; m1 = 3; a3 – a2 = 60 – 30 = 30 và ta có
Tứ phân vị thứ nhất Q1 là x9. Do x9 thuộc nhóm [30; 60) nên nhóm này chứa Q1. Do đó, p = 2; a2 = 30; m2 = 15; m1 = 3; a3 – a2 = 60 – 30 = 30 và ta có
Tứ phân vị thứ ba Q3 là x27. Do x27 thuộc nhóm [60; 90) nên nhóm này chứa Q3. Do đó, p = 3; a3 = 60; m3 = 10; m1 + m2 = 3 + 15 = 18; a4 – a3 = 90 – 60 = 30 và ta có
Tứ phân vị thứ hai Q2 = Me = 59.
Do đó, trung vị của mẫu số liệu gốc khoảng 59 và các tứ phân vị khoảng 41,5; 59; 84,75.
+) Mốt
Tần số lớn nhất là 15 nên nhóm chứa mốt là nhóm [30; 60). Ta có, j = 2, a2 = 30, m2 = 15, m1 = 3, m3 = 10, h = 30. Do đó
Vậy mốt của mẫu số liệu gốc xấp xỉ 51,18.
1. Số trung bình của mẫu số liệu ghép nhóm
HĐ1 trang 62 Toán 11 Tập 1: Khảo sát thời gian tự học của các học sinh trong lớp theo mẫu bên.
a) Hãy lập bảng thống kê cho mẫu số liệu ghép nhóm thu được.
b) Có thể tính chính xác thời gian tự học trung bình của các học sinh trong lớp không?
c) Có cách nào tính gần đúng thời gian tự học trung bình của các học sinh trong lớp dựa trên mẫu số liệu ghép nhóm này không?
Lời giải:
a) Giả sử lớp 11A có 30 học sinh và sau khi khảo sát, ta có được bảng thống kê như sau:
b) Ta không thể tính chính xác thời gian tự học trung bình của các học sinh trong lớp vì không có mẫu số liệu cụ thể về thời gian tự học của từng học sinh.
c) Có thể tính gần đúng thời gian tự học trung bình của các học sinh trong lớp dựa trên mẫu số liệu ghép nhóm bằng cách chọn thời gian đại diện cho mỗi nhóm, sau đó sử dụng tần số tương ứng để tính số trung bình, cụ thể:
- Thời gian tự học dưới 1,5 giờ, ta chọn giá trị đại diện là 0,75 giờ, tần số tương ứng là 5.
- Thời gian tự học từ 1,5 đến dưới 3 giờ, ta chọn giá trị đại diện là , tần số tương ứng là 15.
- Thời gian tự học từ 3 đến dưới 4,5 giờ, ta chọn giá trị đại diện là , tần số tương ứng là 8.
- Thời gian tự học là từ 4,5 giờ trở lên, ta chọn giá trị đại diện là 5,25, tần số tương ứng là 2.
Số trung bình là
Vậy thời gian tự học trung bình của học sinh lớp 11A xấp xỉ khoảng 2,6 giờ.
Chú ý: Mỗi bạn có kết quả khảo sát khác nhau phụ thuộc vào số lượng học sinh trong lớp và thời gian tự học của mỗi học sinh trong lớp. Kết quả trên là một ví dụ tham khảo.
Luyện tập 1 trang 63 Toán 11 Tập 1: Tìm hiểu thời gian xem ti vi trong tuần trước (đơn vị: giờ) của một số học sinh thu được kết quả sau:
Thời gian (giờ) | [0; 5) | [5; 10) | [10; 15) | [15; 20) | [20; 25) |
Số học sinh | 8 | 16 | 4 | 2 | 2 |
Tính thời gian xem ti vi trung bình trong tuần trước của các bạn học sinh này.
Lời giải:
Trong mỗi khoảng thời gian, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:
Thời gian (giờ) | 2,5 | 7,5 | 12,5 | 17,5 | 22,5 |
Số học sinh | 8 | 16 | 4 | 2 | 2 |
Tổng số học sinh là n = 8 + 16 + 4 + 2 + 2 = 32. Thời gian xem ti vi trung bình trong tuần trước của các học sinh là
2. Trung vị của mẫu số liệu ghép nhóm
HĐ2 trang 63 Toán 11 Tập 1: Cho mẫu số liệu ghép nhóm về chiều cao của 21 câu na giống.
Gọi x1, x2, ..., x21 là chiều cao của các cây giống, đã được sắp xếp theo thứ tự tăng dần. Khi đó, x1, ..., x3 thuộc [0; 5), x4, ..., x11 thuộc [5; 10), ... Hỏi trung vị thuộc nhóm nào?
Lời giải:
Ta có: cỡ mẫu n = 21, là số lẻ nên trung vị là giá trị chính giữa của mẫu số liệu và là giá trị ở vị trí thứ 11 của mẫu số liệu. Mà x11 thuộc [5; 10) nên trung vị của mẫu số liệu thuộc nhóm [5; 10).
Luyện tập 2 trang 64 Toán 11 Tập 1: Ghi lại tốc độ bóng trong 200 lần giao bóng của một vận động viên môn quần vợt cho kết quả như bảng bên.
Tốc độ v (km/h) | Số lần |
150 ≤ v < 155 | 18 |
155 ≤ v < 160 | 28 |
160 ≤ v < 165 | 35 |
165 ≤ v < 170 | 43 |
170 ≤ v < 175 | 41 |
175 ≤ v < 180 | 35 |
Tính trung vị của mẫu số liệu ghép nhóm này.
Lời giải:
Cỡ mẫu là n = 200.
Gọi x1, x2, ..., x200 là tốc độ giao bóng của vận động viên trong 20 lần giao bóng và giả sử dãy này đã được sắp xếp theo thứ tự tăng dần. Khi đó, trung vị là . Do 2 giá trị x100, x101 thuộc nhóm [165; 170) (vì 18 + 28 + 35 + 43 = 124) nên nhóm này chứa trung vị. Do đó, p = 4; a4 = 165; m4 = 43; m1 + m2 + m3 = 18 + 28 + 35 = 81; a5 – a4 = 170 – 165 = 5 và ta có
3. Tứ phân vị của mẫu số liệu ghép nhóm
HĐ3 trang 64 Toán 11 Tập 1: Với mẫu số liệu ghép nhóm cho trong HĐ2, hãy cho biết tứ phân vị thứ nhất Q1 và tứ phân vị thứ ba Q3 thuộc nhóm nào.
Lời giải:
Vì n = 21 nên tứ phân vị thứ nhất là trung vị của dãy gồm 10 số liệu đầu tiên và chính là trung bình cộng của giá trị ở vị trí thứ 5 và thứ 6, do đó mà x5, x6 thuộc nhóm [5; 10) nên tứ phân vị thứ nhất Q1 thuộc nhóm [5; 10).
Tứ phân vị thứ ba là trung vị của dãy gồm 10 số liệu nằm bên phải trung vị là dãy x12, x13, ..., x21 nên . . Ta có: 3 + 8 + 7 = 18, do đó x16, x17 thuộc nhóm [10; 15) nên tứ phân vị thứ ba Q3 thuộc nhóm [10; 15).
Luyện tập 3 trang 65 Toán 11 Tập 1: Tìm tứ phân vị thứ nhất và tứ phân vị thứ ba cho mẫu số liệu ghép nhóm ở Luyện tập 2.
Lời giải:
Cỡ mẫu là n = 200.
Tứ phân vị thứ nhất Q1 là . Do x50, x51 đều thuộc nhóm [160; 165) nên nhóm này chứa Q1. Do đó, p = 3; a3 = 160; m3 = 35; m1 + m2 = 18 + 28 = 46; a4 – a3 = 165 – 160 = 5 và ta có
Tứ phân vị thứ ba Q3 là . Do x150, x151 đều thuộc nhóm [170; 175) nên nhóm này chứa Q3. Do đó, p = 5; a5 = 170; m5 = 41; m1 + m2 + m3 + m4 = 18 + 28 + 35 + 43 = 124; a6 – a5 = 175 – 170 = 5 và ta có
4. Mốt của mẫu số liệu ghép nhóm
HĐ4 trang 66 Toán 11 Tập 1: Với số liệu cho trong Luyện tập 1:
a) Có thể tìm được giá trị chính xác cho mốt của mẫu số liệu gốc về thời gian xem ti vi của học sinh không?
b) Mốt thuộc nhóm nào là hợp lí nhất? Nên lấy số nào trong nhóm để ước lượng được cho mốt?
Lời giải:
a) Không thể tính được giá trị chính xác cho mốt của mẫu số liệu gốc về thời gian xem ti vi của học sinh, do không có thời gian cụ thể của từng học sinh.
b) Tần số lớn nhất là 16 nên mốt thuộc nhóm [5; 10) là hợp lí nhất. Ta ước lượng mốt của mẫu số liệu bằng cách xác định số thứ tự của nhóm chứa mốt là j = 2; aj = a2 = 5; m2 = 16; m1 = 8; m3 = 4; độ dài của nhóm h = 5.
Do đó, mốt của mẫu số liệu xấp xỉ bằng
Luyện tập 4 trang 66 Toán 11 Tập 1: Thời gian (phút) để học sinh hoàn thành một câu hỏi thi được cho như sau:
Thời gian (phút) | [0,5; 10,5) | [10,5; 20,5) | [20,5; 30,5) | [30,5; 40,5) | [40,5; 50,5) |
Số học sinh | 2 | 10 | 6 | 4 | 3 |
Tìm mốt của mẫu số liệu ghép nhóm này.
Lời giải:
Tần số lớn nhất là 10 nên nhóm chứa mốt là nhóm [10,5; 20,5).
Ta có, j = 2; a2 = 10,5; m2 = 10; m1 = 2; m3 = 6; h = 20,5 – 10,5 = 10. Do đó, mốt của mẫu số liệu ghép nhóm này là
Vận dụng trang 66 Toán 11 Tập 1: Hãy tính các số đặc trưng cho mẫu số liệu trong Bảng 3.1 và giải thích ý nghĩa của các giá trị thu được.
Lời giải:
Ta có:
+) Số trung bình
Trong mỗi khoảng số tiền, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:
Tổng số khách hàng là n = 35. Số trung bình là
Số trung bình của mẫu số liệu ghép nhóm xấp xỉ cho số trung bình của mẫu số liệu gốc. Từ đó, ta thấy số tiền bán xăng trung bình của 35 khách hàng xấp xỉ 63 nghìn đồng và có thể dùng làm đại diện cho mẫu số liệu.
Ý nghĩa: Trung bình mỗi người đi xe máy vào mua xăng hết 63 000 đồng.
+) Số trung vị, tứ phân vị
Cỡ mẫu là n = 35.
- Gọi x1, x2, ..., x35 là số tiền xăng của 35 khách hàng và giả sử dãy này đã được sắp xếp theo thứ tự tăng dần. Khi đó, trung vị là x18. Do x18 thuộc nhóm [30; 60) nên nhóm này chứa trung vị. Do đó, p = 2; a2 = 30; m2 = 15; m1 = 3; a3 – a2 = 60 – 30 = 30 và ta có
Trung vị của mẫu số liệu ghép nhóm xấp xỉ cho trung vị của mẫu số liệu gốc, nó chia mẫu số liệu gốc thành hai phần, mỗi phần chứa 50% giá trị. Từ đó ta thấy trung vị của mẫu số liệu gốc xấp xỉ bằng 59, giá trị này là ngưỡng để chia mẫu số liệu gốc thành 2 phần.
- Tứ phân vị thứ nhất Q1 là x9. Do x9 thuộc nhóm [30; 60) nên nhóm này chứa Q1. Do đó, p = 2; a2 = 30; m2 = 15; m1 = 3; a3 – a2 = 60 – 30 = 30 và ta có
- Tứ phân vị thứ ba Q3 là x27. Do x27 thuộc nhóm [60; 90) nên nhóm này chứa Q3. Do đó, p = 3; a3 = 60; m3 = 10; m1 + m2 = 3 + 15 = 18; a4 – a3 = 90 – 60 = 30 và ta có
- Tứ phân vị thứ hai Q2 = Me = 59.
Do đó, các tứ phân vị của mẫu số liệu gốc xấp xỉ là Q1 = 41,5; Q2 = 59 và Q3 = 84,75, mỗi giá trị này là các ngưỡng để chia mẫu số liệu thành 4 phần, mỗi phần chứa 25% giá trị.
Ý nghĩa: Có khoảng 25% số khách hàng mua xăng với số tiền ít hơn 41 500 đồng; 50% số khách hàng mua xăng với số tiền ít hơn 59 000 đồng; 75% số khách hàng mua xăng với số tiền ít hơn 84 750 đồng.
+) Mốt
Tần số lớn nhất là 15 nên nhóm chứa mốt là nhóm [30; 60). Ta có, j = 2, a2 = 30, m2 = 15, m1 = 3, m3 = 10, h = 30. Do đó
Do đó, mốt của mẫu số liệu gốc xấp xỉ bằng 51,18. Vậy số khách hàng mua xăng với giá tiền khoảng 51,18 nghìn đồng là nhiều nhất.