Bài tập lớn thống kê ứng dụng. sử dụng phân tích hồi quy phân tích sự phù hợp của mô hình. PDF

Title Bài tập lớn thống kê ứng dụng. sử dụng phân tích hồi quy phân tích sự phù hợp của mô hình.
Author Hòa Thanh
Course Thống kê ứng dụng
Institution Trường Đại học Bách khoa Hà Nội
Pages 20
File Size 1.2 MB
File Type PDF
Total Downloads 517
Total Views 952

Summary

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘIVIỆN KINH TẾ VÀ QUẢN LÍ-------o0o-------TIỂU LUẬN MÔN :THỐNG KÊ ỨNG DỤNGCASE 4: FINDING THE BEST CAR VALUEGiáo viên hướng dẫn: Hà Thị Thư TrangNhóm 12:Họ và tên MSSVHà Nôi, tháng 1 năm 2022 ̣LỜI CẢM ƠNBản tiểu luân được hoàn thành trên cơ sở đóng góp của các thành vi...


Description

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÍ

-------o0o-------

TIỂU LUẬN MÔN : THỐNG KÊ ỨNG DỤNG

CASE 4: FINDING THE BEST CAR VALUE Giáo viên hướng dẫn: Hà Thị Thư Trang Nhóm 12: HA và tên

MSSV

Hà Nôi,Dtháng 1 năm 2022

LỜI CẢM ƠN Bản tiu luâ n được hoàn thành trên cơ sở đóng góp của các thành viên với vốn kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Thống Kê -ng D/ng. Đây cũng là một cơ hội thực hành khiến chúng em có th hiu rõ hơn về các phân tích và kim định đặc trưng có liên quan, áp d/ng kiến thức trên giảng đường đ làm quen và rút ra được nhưng kết luận bổ ích về những hiện tượng trong những mối tương quan khác nhau và sự ảnh hưởng lẫn nhau giữa các nhân tố. Chúng em xin gửi lời cảm ơn sâu sắc tới cô Hà Thị Thư Trang, Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội đã đồng hành cùng chúng em suốt quá trình nghiên cứu và học tập, cảm ơn cô đã tận tình giảng dạy và truyền th/ kiến thức, kinh nghiệm cũng như phong cách trình bày, đ chúng em có thêm những bài học quý báu. Do vốn kiến thức và kĩ năng còn hạn chế nên chắc hẳn bài tiu luân này không th tránh khỏi sai sót, chúng em rất mong nhận được sự góp ý động viên của cô đ chúng em có th hoàn thiện hơn, áp d/ng tốt hơn trong các công việc sau này. Chúng em xin chân thành cảm ơn Cô.

H Nô i, ngày 13/01/2022 Nhóm thực hiê n

2

MỤC LỤC L^I C`M ƠN..............................................................................................................2 ĐcNG GcP CfA ChC THiNH VIÊN.....................................................................3 I. ĐĂT  VlN ĐÊ..........................................................................................................5 1. Đề bài...................................................................................................................5 2. Xây dựng mô hình................................................................................................6 II. PHÂN TrCH...........................................................................................................8 1. Thống kê mô tả các biến.......................................................................................8 1.1 Tóm tắt dữ liêu................................................................................................8  1.2 Bảng tần số và đồ thị của dữ liệu....................................................................8 2. Phân tích theo các câu hỏi được gợi ý trong Case-Problems.............................13 2.1 Giá ( Price)....................................................................................................13 2.2 Chi Phí Năm Năm Của Chủ Sở Hữu ( Cost/Mile ).......................................14 2.3 Đim Kim Tra Đương Bô  ( Road-Test Score )............................................14 2.4 Dự Đoán Đô  Tin Câ y ( Predicted Reliability )..............................................16 3. Kết luâ n dựa trên các phân tích trên...................................................................16 4. Ước lượng mô hình hồi quy bô i.........................................................................17 4.1. Giải thích hàm hồi quy mẫu nhận được :.....................................................17 4.2 Kim định sự phù hợp của mô hình..............................................................18 III. K~T LUÂN.........................................................................................................21

3

I. ĐĂDT VJN ĐÊ 1. ĐL bài Khi quyết định mua mô t chiếc xe nào đó, giá trị thực không nhất thiết được xác định bởi số tiền bạn chi cho lần mua ban đầu. Thay vào đó, những chiếc xe đáng tin câ y và không tốn nhiều chi phí đ sở hữu thường đại diên cho những giá trị tốt nhất. Tuy nhiên cho dù sở hữu môt chiếc ô tô đáng tin cây hay r€ tiền đến đâu nó cũng phải hoạt đô ng tốt. Đ đo lường giá trị, Consumer Reports đã phát trin môt hê  thống gọi là đim giá trị ( Value Score ). Đim giá trị dựa trên chi phí năm năm của chủ sở hữu ( Cost/Mile ), đim kim tra đường bôtổng th ( Road-Test Score ) và xếp hạng đô   tin câ y được dự đoán ( Predicted Reliability ). Chi phí chủ sở hữu trong năm năm đầu tiên sở hữu, bao gồm khấu hao, nhiên liêu,  bảo trì và sửa chữa,v.v. Sử d/ng mức trung bình quốc gia là 12.000 dă m mô t năm, chi phí trung bình cho m•i dăm  lái xe được sử d/ng làm thước đo chi phí của chủ sở hữu trong năm năm. Đim kim tra đường bô  là kết quả của hơn 50 bài kim tra và đánh giá dựa trên thang đim 100, với đim số cao hơn cho thấy hiêu suất tốt hơn, sự thoải mái, tiên lợi và tiêt kiêm  nhiên liêu.  Đim số kim tra đường bô  cao nhất đạt được trong các bài kim tra do Consumer Reports thực hiên được là 99 đối với Lexus LS 460L. Xếp hạng dự đoán về đô  tin câ y (1 = K„m, 2 = Khá, 3 = Tốt, 4 = Rất tốt, 5 = Xuất sắc) dựa trên dữ liêu từ Khảo sát tự đô ng hàng năm của Consumer Reports. Mô t chiếc xe có đim giá trị là 1,0 được coi là “giá trị trung bình”. Môt chiếc xe có đim giá trị là 2,0 được coi là co giá trị tốt gấp đôi môt  chiếc xe có đim giá trị là 1,0; môt chiếc xe có đim giá trị 0,5 được coi là tốt bˆng mô t nửa so với mức trung bình; và như thế. Dữ liêu về 20 chiếc sedans gia đình, bao gồm cả giá ($) của m•i chiếc được kim tra ở bảng dưới đây: Car

Price ($)

Cost/Mile

RoadTest

Predicted Reliability

Value Score 4

Score Nissan Altima 2.5 S (4-cyl.) Kia Optima LX (2.4) Subaru Legacy 2.5i Premium Ford Fusion Hybrid Honda Accord LX-P (4-cyl.) Mazda6 i Sport (4-cyl.) Hyundai Sonata GLS (2.4) Ford Fusion SE (4-cyl.) Chevrolet Malibu LT (4-cyl.) Kia Optima SX (2.0T) Ford Fusion SEL (V6) Nissan Altima 3.5 SR (V6) Hyundai Sonata Limited (2.0T) Honda Accord EX-L (V6) Mazda6 s Grand Touring (V6) Ford Fusion SEL (V6, AWD) Subaru Legacy 3.6R Limited Chevrolet Malibu LTZ (V6) Chrysler 200 Limited (V6) Chevrolet Impala LT (3.6)

23,970.00 21,885.00 23,830.00 32,360.00 23,730.00 22,035.00 21,800.00 23,625.00 24,115.00 29,050.00 28,400.00 30,335.00 28,090.00 28,695.00 30,790.00 30,055.00 30,094.00 28,045.00 27,825.00 28,995.00

0.59 0.58 0.59 0.63 0.56 0.58 0.56 0.57 0.57 0.72 0.67 0.69 0.66 0.67 0.74 0.71 0.71 0.67 0.70 0.67

91 81 83 84 80 73 89 76 74 84 80 93 89 90 81 75 88 83 52 63

4 4 4 5 4 4 3 4 3 4 4 4 3 3 4 4 3 3 5 3

1.75 1.73 1.73 1.70 1.62 1.60 1.58 1.55 1.48 1.43 1.42 1.42 1.39 1.36 1.34 1.32 1.29 1.20 1.20 1.05

2. Xây d[ng mô h\nh

 Xác định dạng mô hình Đ phân tích những tác động của các nhân tố ảnh hưởng đến đim giá trị của xe nhóm em đã chọn sử d/ng phân tích hồi quy với mô hình hồi quy tuyến tính đ đưa ra những ước lượng và kết luận về biến ph/ thuộc của mô hình. Các biến được sử d/ng đ đưa vào trong bài là: Bi^n ph` thuôcDY Bi^n đôcDlâpDXi



Value Score Price

Đơn vị Đim Đô la

Cost/Mile

cost/mile

Road-Test Score

Đim

Predicted Reliability

Mức

Mô hình hồi quy tổng th mô tả mối quan hệ biến ph/ thuộc Y và các biến 5

độc lập có dạng : Value Score = β1 + β2 * Price + β3 * Cost/Mile + β4 * Road-Test Score + β5 * Predicted Reliability + µi Trong đó : -

β1: là hệ số chặn.

-

β2, β3, β4, β5: là các hệ số góc tương ứng với các biến độc lập.

-

µi : là sai số ngẫu nhiên.



Kỳ vọng về dấu của các biến độc lập :

-

Theo đề bài đim giá trị không ph/ thuô c vào giá, nhưng theo mong muốn  của khách hàng nói chung kì vọng giá mua xe s— đồng biến với đim giá trị – dấu (+).

-

Chi phí năm năm của chủ sở hữu càng nhiều thì đim giá trị s— càng nhỏ – dấu (-).

-

Đim đường bôcàng cao chứng tỏ chiếc xe càng nhiều giá trị – dấu (+). 

-

Mức xếp hạng về đôtin  cây càng cao xe càng giá trị – dấu (+).

II. PHÂN TÍCH

6

1. Thdng kê mô tf các bi^n 1.1 Tóm tgt dh liê uD

1.2 Bfng tần sd và đồ thị của dh liệu 1.2.1 Đimm Giá Trị ( Value Score ) Value tần số tích score Frequency tần số(%) lũy(%) 1 0 0% 0% 1,2 3 15% 15% 1,4 5 25% 40% 1,6 7 35% 75% 1,8 5 25% 100%

7

Nhâ n x!t: số đim chủ yếu là 1.4; 1.6; 1.8 những xe được đánh giá hầu hết là có đi€m trên giá trị trung bình từ khá đến tốt 1.2.2 Giá ( Price ) Price($) 21000 21000-23300 23300-25600 25600-27900 27900-30200 30200-32500

Frequenc T(n s) t+ch y T(n s) (%) l,y % 0% 0 0.00% 15% 3 15.00% 25% 5 40.00% 5% 1 45.00% 40% 8 85.00% 15% 3 100.00%

Histogram 9

120.00% 8

8

100.00% 100.00% 7 85.00%

Frequency

6

80.00%

5

5

60.00%

4 3

3

45.00%

40.00%

3

2

0

0.00% 0 21000 23300

40.00% 20.00%

1

15.00%

1

Price Frequency

0.00% 25600

27900

30200

32500

Price($)

Nhâ n x!t: dữ liêu về giá xe tâ p trung ở giữa, giá xe được khảo sát quá cao và quá thấp không nhiều 1.2.3 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile ) Cost/Mile

Frequency 0,55 0,6 0,65 0,7

tần số(%) 0 8 1 7

tần số tích lũy(%) 0% 40% 5% 35%

0% 40% 45% 80% 8

0,75

4

20%

100%

Nhâ n x!t: chi phí năm năm của chủ sở hữu có 0.6 và 0.7 chiếm phần lớn lần lượt là 40% và 35% trong tổng dữ liêu.  1.2.4 Đimm Kimm Tra Đương Bô ( Road-Test Score ) D Road-test Score 50 55 60 65 70 75 80 85 90 95 100

Frequency tần số(%) tần số tích lũy(%) 0 0% 0% 1 5% 5% 0 0% 5% 1 5% 10% 0 0% 10% 3 15% 25% 3 15% 40% 6 30% 70% 4 20% 90% 2 10% 100% 0 0% 100%

9

Nhâ n x!t: Đim kim tra đường bô  của các xe trong dữ liê u mẫu tâp trung chủ yếu trên 80 đim là mức đim cao. 1.2.5 Đô D tin câyDđưrc d[ đoán ( Predicted Reliability ) Predicte d reliabilit y 3 4 5

Frequenc y 7 11 2

tần số(%) 35% 55% 10%

tần số tích lũy(%) 35% 90% 100%

Histogra m 12 10 8 6 4 2 0

11 90%

7 35% 3

100%

100%

2 4

5

More 0

120% 100% 80% 60% 40% 20% 0%

Predicted reliability Frequency

Cumulative %

Nhâ n x!t: Đô  tin cây được dự đoán chủ yếu là Tốt và Rất Tốt. 10

2. Phân toch theo các câu hsi đưrc gri t trong Case-Problems Sử d/ng phần mềm excel đ ước lượng mô hình hồi quy tuyến tính đơn bˆng phương pháp OLS, ta có kết quả về sự ph/ thuô c của biến Value Score với các biến khác như sau: 2.1 Giá ( Price)

- Có R2 = 0.3277 có nghĩa là biến Price giải thích được 32.77% sự biến động của biến Value Score.  Hàm hồi quy mẫu nhân được là: = 2.3587 - 0.0000334 * Price - Giải thích : β1 = -0.0000334 cho biết khi giá xe tăng 1$ thì trung bình đim giá trị giảm 0.0000334 đim. - Kim định giả thiết với tham số :  H0 : β1 = 0 H1 : β1 ≠ 0 Với mức ý nghĩa 5% ta thấy : P – Value = 0.0083 < α = 0,05. Ta bác bỏ giả thiết H0. Vây biến Price có tác đô n g đến biến Value Score.

11

2.2 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )

- Có R2 = 0.5132 có nghĩa là biến Cost/Mile giải thích được 51.32% sự biến động của biến Value Score.  Hàm hồi quy mẫu nhân được là: = 2.9422 – 2.3119 * (Cost/Mile) - Giải thích : β1 = -2.3119 cho biết khi Chi Phí Năm Năm Của Chủ Sở Hữu tăng 1$ thì trung bình Dim Giá Trị giảm 2.3119 đim. - Kim định giả thiết với tham số :  H0 : β1 = 0 H1 : β1 ≠ 0 Với mức ý nghĩa 5% ta thấy : P – Value = 0.000381 < α = 0,05. Ta bác bỏ giả thiết H0. Vâ y biến Cost/Mile có tác đông  đến biến Value Score. 2.3 Đimm Kimm Tra Đương Bô ( Road-Test Score ) D

12

- Có R2 = 0.1694 có nghĩa là biến Road-Test Score giải thích được 16.94% sự biến động của biến Value Score.  Hàm hồi quy mẫu nhân được là: = 0.7978 + 0.0082 * Road-Test Score - Giải thích : β1 = 0.0082 cho biết khi Đim Kim Tra Đương Bô  tăng 1 đim thì trung bình Dim Giá Trị tăng 0.0082 đim. - Kim định giả thiết với tham số :  H0 : β1 = 0 H1 : β1 ≠ 0 Với mức ý nghĩa 5% ta thấy : P – Value = 0.0715 > α = 0,05. Ta chấp nhân giả thuyết H0. Vâ y biến Road-Test Score không có tác đô ng đến biến Value Score.

13

2.4 D[ Đoán Đô D Tin Câ yD( Predicted Reliability )

- Có R2 = 0.1229 có nghĩa là biến Predicted Reliability giải thích được 12.29% sự biến động của biến Value Score.  Hàm hồi quy mẫu nhân được là: = 1.0515 + 0.1084 * Predicted Reliability - Giải thích : β1 = 0.1084 cho biết khi Dự Đoán ĐôTin  Câ y tăng 1 mức thì trung bình Đim Giá Trị tăng 0.1084 đim. - Kim định giả thiết với tham số :  H0 : β1 = 0 H1 : β1 ≠ 0 Với mức ý nghĩa 5% ta thấy : P – Value = 0.1294 > α = 0,05. Ta chấp nhân giả thuyết H0. Vâ y biến Predicted Reliability không có tác đông  đến biến Value Score. 3. K^t luânDd[a trên các phân toch trên Sau khi thực hiê n phân tích hồi quy đơn biến Value Score theo các biến còn lại ta có th tổng hợp lại như sau: Biến Price, Cost/Mile có tác đông  tiêu cực đến biến ph/ thuô c, trong đó biến Cost/Mile giải thích được 51.32% sự biến động của biến Value Score là khá cao. 14

Biến Road-Test Score, Predicted Reliability có quan hêcùng chiều nhưng  không có tác đô ng đến biến ph/ thuôc => Viêc thực hiê n phân tích hồi quy đơn các biến cho kết quả về kì vọng dấu của các biến là chính xác, nhưng theo đề bài đã cho là không chính xác. Nhóm s— tiếp t/c thực hiê n hồi quy bô i đ đánh giá toàn diên hơn về sự tác đô ng của các biến đô c lâ p đến biến ph/ thuô c. 4. Ước lưrng mô h\nh hồi quy bô iD Sử d/ng phần mềm excel ta ước lượng mô hình trên bˆng phương pháp OLS, ta có kết quả thu được ở bảng sau :

B5ng 1

Qua kết quả chạy từ ứng d/ng excel, chúng ta thấy rˆng R2 hiêu chžnh là 0.9126, có nghĩa là mô hình giải thích được 91.26% sự thay đổi của Value Score có ph/ thuộc vào các biến trong mô hình.  Hàm hồi quy mẫu nhâ n được là: Value Score^ = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 * Road-Test Score + 0.1791 * Predicted Reliability 4.1. Gifi thoch hàm hồi quy mẫu nhận đưrc : - β2 = -0.000014 cho biết khi giá tăng 1 đô la thì đim giá trị trung bình giảm 15

0.000014 đim với điều kiê n các yếu tố khác không đổi - β3 = 1.5815 cho biết khi chi phí năm năm của chủ sở hữu tăng 1 cost/mile thì đim giá trị trung bình giảm 1.5815 đim với điều kiên các yếu tố khác không đổi - β4 = 0.0114 cho biết khi đim kim tra đường bôtăng 1 đim thì đim giá trị  trung bình tăng 0.0114 đim với điều kiên các yếu tố khác không đổi - β5 = 0.1791 cho biết khi mức đôtin  câ y dự đoán tăng 1 mức thì trung bình đim giá trị tăng 0.1719 đim với điều kiên các yếu tố khác không đổi 4.2 Kimm định s[ phw hrp của mô h\nh  Kiểm định ý nghĩa mô hình Kim định các cặp giả thiết : H0 : β2 = β3 = β4 = β5 = 0 H1 : Có ít nhất 1 trong các giá trị β không bˆng Từ bảng 4 ta có : F = 50.6046 và mức ý nghĩa của F, PF = 0,000000016< < 0,05 do đó ta có th kết luật mô hình trên là có ý nghĩa.  Kiểm định gi5 thiết với các tham s). H0 : β2 = 0 H1 : β2 ≠ 0 Với mức ý nghĩa 5% ở bảng 2 ta thấy : P – Value = 0.1002 > α = 0,05 → Biến Price không ảnh hưởng đến biến Value Score ở mức ý nghĩa 5%. Tương tự lần lượt kim định với các cặp giả thiết khác : H0 : βj = 0 H1 : βj ≠ 0 (3 ÷ 5 )

16

→ Các biến Cost/Mile, Road-Test Score, Predicted Reliability có ảnh hưởng đến biến Value Score ở mức ý nghĩa 5%.

 Loại b? biến không cA ý nghĩa ( Price) Thực hiê n hồi quy với dữ liêu cũ đã loại bỏ biến Price, thu được kết quả sau :

B5ng 2

Nhâ n x!t : Hê số R2 hiê u chžnh mới là 0.9013 < 0.9126 – hê  số R2 hiêu chžnh cũ (Bảng 1). Nên viê c bỏ bớt biến Price trong mô hình là không phù hợp.

 Kiểm định hiên tưFng đa cô ng tuyến Sử d/ng phần mềm SPSS đ tính thừa số phóng đại phương sai VIF, ta thu được kết quả sau :

17

Nhâ n x!t : các giá trị VIF nˆm trong khoảng từ 1 đến 5 cho thấy rˆng có môt mối tương quan vừa phải giữa các biến nhưng không quá nghiêm trọng nên có th bỏ qua

 Kiểm định gi5 định không cA tG tương quan giIa các ph(n dư. Dùng kim định Durbin Waston trên SPSS thu được kết quả :

Nhâ n x!t : 1 < D = 1.710 0.05 - Với kim định Shapiro-Wilk, p-value = 0.283 > 0.05 Vâ y cả hai kim định đều cho kết quả phần dư tuân theo phân phối chu£n

 Kiểm định phương sai sai s) thay đLi Dùng Eviews đ thực hiên kim định White thu được bảng kết quả dưới đây :

18

Nhâ n x!t : Nhìn vào bảng trên ta thấy giá trị p-value = 0.1337 > 0.05. Vâ y  mô hình không có phương sai sai số thay đổi.

19

III. KẾT LUÂDN Vấn đề biến Price không có tác đô ng tới biến ph/ thuô c có th do c¥ mẫu không đủ lớn. Do viêc bỏ biến Price không làm tăng mức đô  giải thích của mô hình nên nhóm em vẫn dữ nguyên mô hình ban đầu Sau khi tiến hành kim định các giả thuyết của mô hình, không phát hiên mô hình đã ước lượng vi phạm các giả định và kì vọng về dấu so với ban đầu. Có th nói rˆng mô hình: Value Score = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 * Road-Test Score + 0.1791 * Predicted Reliability là mô t mô hình tốt.

20...


Similar Free PDFs