Nhóm 5 Audiobook BTL - Thời kỳ 4.0 đã tạo nền tảng cho các ứng dụng công nghệ phát triển mạnh mẽ, chỉ PDF

Title Nhóm 5 Audiobook BTL - Thời kỳ 4.0 đã tạo nền tảng cho các ứng dụng công nghệ phát triển mạnh mẽ, chỉ
Author Quý Nguyễn Thanh
Course Quản trị bán hàng và phân phối sản phẩm
Institution Học viện Công nghệ Bưu chính Viễn thông
Pages 19
File Size 750.9 KB
File Type PDF
Total Downloads 36
Total Views 151

Summary

Download Nhóm 5 Audiobook BTL - Thời kỳ 4.0 đã tạo nền tảng cho các ứng dụng công nghệ phát triển mạnh mẽ, chỉ PDF


Description

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc Hà Nội, ngày 20 tháng 11 năm 2021 ĐỀ XUẤT PHƯƠNG ÁN GIẢM TỶ LỆ NGỪNG HOẠT ĐỘNG CỦA NGƯỜI DÙNG ỨNG DỤNG SÁCH NÓI AUDIOBOOK Kính gửi: Ban Giám đốc Công ty Book Intelligence Chúng tôi là: Bộ phận phòng Marketing Công ty Book Intelligence Trong 6 tháng vừa qua, tỷ lệ khách hàng ngừng mua lại dịch vụ chiếm 68% tổng lượng khách hàng của công ty. Điều này đáng báo động vì nếu không có biện pháp ngăn chặn kịp thời rất dễ dẫn đến tình trạng sụt giảm doanh thu nghiêm trọng. Để giảm tỷ lệ người dùng dừng hoạt động trên ứng dụng sách nói Audiobook, đồng thời giúp tăng trưởng doanh thu và cải thiện lợi nhuận cho công ty, chúng tôi đã tiến hành phân tích dữ liệu khách hàng nhằm khám phá ra những thuộc tính của người dùng cũng như gói dịch vụ có tác động đến hành vi mua lại của họ. Từ kết quả phân tích, chúng tôi đã chỉ ra được có 1 thuộc tính của gói dịch vụ là Giá của một gói sản phẩm, cùng với 2 đặc điểm của hành vi người dùng là Trạng thái để lại đánh giá của khách hàng và Lần truy cập gần nhất có ảnh hưởng đến xu hướng tiếp tục gia hạn dịch vụ sách nói. Với mong muốn làm giảm tỷ lệ rời bỏ của khách hàng, chúng tôi đã đề xuất một số gợi ý để cải thiện tình trạng này rất mong ban lãnh đạo có thể xem xét và phê duyệt. Chúng tôi cam kết kết quả phân tích trên có độ chính xác cao (~ 80%) và có thể tin cậy. Xin chân thành cảm ơn! Trưởng nhóm Trương Thị Cúc

ĐỀ XUẤT PHƯƠNG ÁN GIẢM TỶ LỆ KHÁCH HÀNG NGỪNG GIA HẠN GÓI DỊCH VỤ TRÊN ỨNG DỤNG SÁCH NÓI AUDIOBOOK CỦA CÔNG TY BOOK INTELLIGENCE

Chịu trách nhiệm bởi

Trương Thị Cúc Hà Thanh Huyền Vũ Thanh Huyền Mai Thị Hương Trần Thị Ngà

1

Hà Nội, ngày 20 tháng 11 năm 2021

2

TỔNG QUAN Thời kỳ 4.0 đã tạo nền tảng cho các ứng dụng công nghệ phát triển mạnh mẽ, chỉ cần lên một vài thao tác tìm kiếm đơn giản thì đã có hàng trăm gợi ý về ứng dụng audiobook hiển thị cho chúng ta với nhiều ngôn ngữ đa dạng, điều này cho thấy rằng thị trường audiobook đang cạnh tranh rất cao, chính vì thế mà việc giữa chân được khách hàng, khiến họ quay trở lại sử dụng sản phẩm của công ty Book Intelligence đang rất quan trọng và cần thiết đối với việc duy trì được doanh thu của công ty. Hiểu được tầm quan trọng của việc giữ chân khách hàng, bộ phận phòng ban Marketing đã tiến hành phân tích dữ liệu khách hàng được lấy từ bộ Audiobook data với 7024 quan sát tương ứng với 7024 khách hàng đang sử dụng dịch vụ sách nói của công ty trong 6 tháng vừa qua để tìm hiểu xem các gói dịch vụ nào, và yếu tố nào đang tác động mạnh đến quyết định mua lại của khách hàng, từ đó đề xuất các biện pháp ngăn chặn tình trạng rời bỏ của khách hàng và gia tăng tỷ lệ mua lại. Để phân tích tỷ lệ mua lại của khách hàng, chúng tôi đã sử dụng mô hình hồi quy Logistic để chỉ ra các yếu tố tác động đến quyết định sử dụng lại sản phẩm, dịch vụ của khách hàng trong ứng dụng sách nói Audiobook. Cụ thể chúng tôi chỉ ra được 3 yếu tố tác động đến tỷ lệ mua lại của khách hàng bao gồm: Giá của một gói sản phẩm (price_one), Trạng thái để lại đánh giá của khách hàng (review) và Thời lượng truy cập lần cuối (last_visited). Thông qua kết quả phân tích trên, chúng tôi đã phát hiện được các yếu tố đang có vai trò giúp giữ chân khách hàng, khiến họ mua lại sản phẩm/dịch vụ, mặc dù chưa thực sự tìm ra được nguyên nhân thực sự tại sao các yếu tố đó lại tác động đến quyết định mua lại của khách hàng. Do sự hạn chế về dữ liệu nên dựa trên tình hình hiện tại chúng tôi đề xuất các hoạt động Marketing sẽ tiến hành trong tháng tới, bao gồm: -

Kiến nghị một số phương hướng, kỹ thuật có thể thực hiện nhằm nghiên cứu kỹ hơn, khám phá ra những đặc điểm hành vi sử dụng của khách hàng app Audiobook.

-

Tạo chiến lược promotion (tiếp thị) để giữ chân và thúc đẩy khách hàng mua lại sử dụng các sản phẩm của công ty song song với việc gia tăng sử dụng sức ảnh hưởng của các yếu tố trên.

3

Trong phần sau của bản báo cáo, chúng tôi sẽ trình bày rõ hơn về các bước tiến hành phân tích dữ liệu, diễn giải kết quả và kiến nghị các phương án để giải quyết tình trạng xu hướng rời bỏ tăng lên của người dùng ứng dụng sách nói Audiobook tại công ty chúng ta.

4

MỤC LỤC 1. Giới thiệu

5

2. Mô hình thiết lập

5

3. Kết quả

6

4. Diễn giải và thảo luận

6

5. Ưu - nhược điểm quá trình phân tích dữ liệu 5.1. Ưu điểm 5.2. Nhược điểm

7 7 7

6. Kết luận 6.1. Đề xuất thực tiễn 6.2. Kiến nghị

8 8 10 16

5

NỘI DUNG CHÍNH 1. Giới thiệu Trong 6 tháng vừa qua, tỷ lệ khách hàng ngừng mua lại dịch vụ sách nói chiếm 68% tổng lượng khách hàng của công ty. Điều này đáng báo động vì nếu không có biện pháp ngăn chặn kịp thời rất dễ dẫn đến tình trạng sụt giảm doanh thu nghiêm trọng. Chúng tôi đã tiến hành phân tích dữ liệu được lấy từ bộ Audiobook data với 7024 quan sát tương ứng với 7024 khách hàng đang sử dụng các gói dịch vụ audiobook của công ty và 13 biến tương ứng với thông tin về mã khách hàng, đặc tính của các gói dịch vụ và hành vi tiêu dùng của họ trên ứng dụng Audiobook. 2. Mô hình thiết lập Do tỷ lệ rời bỏ được tính dựa trên số lượng khách hàng rời bỏ được biểu diễn dưới dạng biến nhị phân (0 là đã rời bỏ, không phải là khách hàng vẫn đang tiếp tục sử dụng dịch vụ), nên nhóm phân tích chúng tôi đã thiết lập mô hình dự báo tỷ lệ mua lại dựa trên mô hình hồi quy Logistic trong đó biến phụ thuộc chính là repurchase (Có 1/Không - 0). Từ bộ dữ liệu ban đầu, chúng tôi tiến hành phân tích hệ số tương quan giữa 11 biến độc lập (ngoại trừ biến id) và kiểm định hệ số VIF. Để tránh xuất hiện đa cộng tuyến trong mô hình, nhóm phân tích loại lần lượt 3 biến độc lập sau ra khỏi mô hình là: num_of_purchase, completion, price_overall. Mô hình hồi quy Logistic đề xuất có dạng:

6

Thời lượng của 1 gói sản phẩm (book_leng_one) Tổng thời lượng các gói sản phẩm (book_leng_overall) Giá của một gói sản phẩm (price_one) Khách hàng để lại đánh giá (review) Điểm đánh giá (review_ponit) Thời gian khách hàng đã sử dụnglượng Số lượng yêu cầu hỗ trợ (support_request) Thời lượng lần truy cập cuối (last_visited)

Khách hàng mua lại gói sản phẩm (repurchase)

Hình 1. Mô hình hồi quy logistic đề xuất

3. Kết quả Sau quá trình phân tích, chúng tôi đã xác định được 3 đặc tính có ảnh hưởng tác động đến tỷ lệ mua lại trên ứng dụng Audiobook cụ thể là: price_one (Giá của một gói sản phẩm), review (Trạng thái để lại đánh giá của khách hàng) và last_visited (Thời gian ở lại trên ứng dụng trong lần truy cập cuối cùng) Mô hình hồi quy Logistic với mức ngưỡng (threshold) bằng 0.35 giúp chúng tôi dự báo được xác xuất mua lại của khách hàng là bao nhiêu dựa trên sự biến động của các biến tác động. Với độ chính xác là 0.86 và AUC là 0.94, chúng tôi có thể kết luận mô hình được đề xuất có thể tin tưởng được. 4. Diễn giải và thảo luận Dựa vào hiểu biết và tâm lý của khách hàng ta có thể diễn giải được kết quả phân tích cụ thể như sau: Yếu tố giá không ảnh hưởng quá nhiều đến tỷ lệ mua lại của khách hàng. Điều đáng ngạc nhiên ở đây là khi giá một gói sản phẩm (price_one) tăng lên 1 đơn vị thì tỷ lệ mua lại tăng lên 0.94 lần. Mặc dù tỷ lệ tăng không đáng kể nhưng nó lại đi ngược lại với tâm lý chung là ưa chuộng giá rẻ, nhưng nó lại phù hợp với tâm lý khác của con người đó là giá càng cao thì chất lượng sản phẩm càng tốt. Hay nói cách khách chính là chất lượng tương xứng với giá thành. Có thể khách hàng cho rằng giá càng 7

cao thì nội dung cuốn đó càng phong phú và giá trị. Thời gian ở lại trên ứng dụng trong lần truy cập cuối cùng (Last_visited) là yếu tố ảnh hưởng khá nhiều tới hành vi mua lại của khách hàng trong vòng 6 tháng qua. Khi thời gian ở lại trên ứng dụng trong lần truy cập cuối cùng tăng lên 1 giờ thì tỷ lệ mua lại tăng lên 2.10 lần. Điều này rất dễ dàng lí giải theo tâm lí chung đó là thời gian ở lại trên ứng dụng càng lâu thì chứng tỏ khách hàng càng quan tâm đến sản phẩm, dẫn đến tỷ lệ mua lại của khách hàng tăng lên. Cuối cùng yếu tố có tác động mạnh mẽ nhất đến hành vi mua lại của khách hàng đó là trạng thái để lại đánh giá (Review) của khách hàng. Với những khách hàng có để lại đánh giá trên ứng dụng thì tỷ lệ mua lại gấp 2.44 so với những khách hàng không để lại đánh giá. Điều này có thể dễ dàng lý giải rằng, những khách hàng năng nổ trong việc để lại những đánh giá, bình luận thì đã xây dựng được mối quan hệ gắn kết nhất định với ứng dụng sách nói, họ dùng ứng dụng như một phần trong cuộc sống, nên tỷ lệ mua lại là cao hơn so với những người không để lại bình luận. Chúng ta cần đặc biệt chú ý xây dựng thêm nhiều mối quan hệ gắn kết như trên. Tất cả những giải thích trên đều là phỏng đoán của chúng tôi mà chưa được kiểm định tính chính xác. 5. Ưu - nhược điểm quá trình phân tích dữ liệu 5.1. Ưu điểm Dữ liệu sử dụng trong quá trình phân tích là historical data, dữ liệu thu thập liên quan đến các gói sản phẩm audio khách hàng đã mua trên ứng dụng Audiobook nên việc thu thập dữ liệu khá dễ dàng và tiết kiệm chi phí. Quá trình phân tích giúp xác định các yếu tố đang tác động đến quyết định mua lại gói sản phẩm của khách hàng. Tìm hiểu lý do khách hàng rời bỏ, ngừng gia hạn và đưa ra giải pháp phù hợp để khắc phục. Công ty Book Intelligence dựa theo kết quả phân tích đưa ra các chính sách, giải pháp để giảm tỷ lệ khách hàng rời bỏ, tập trung cải thiện các yếu tố tác động lớn đến việc khách hàng tiếp tục gia hạn gói sản phẩm, đồng thời tăng khả năng khách hàng mua lại.

8

5.2. Nhược điểm Bộ dữ liệu chỉ liên quan đến các sản phẩm audio khách hàng đã mua, một vài trường dữ liệu cơ bản về hành vi nghe audio mà không có các dữ liệu như các yếu tố nhân khẩu học, tâm lý khách hàng,... vì vậy chưa dự báo được chính xác nhất lý do khách hàng ngừng sử dụng ứng dụng Audiobook. Cũng như chưa đánh giá được chung nhất hàng vi của khách hàng vì hành vi dựa trên nhiều yếu tố tác động khác nhau của môi trường bên trong và bên ngoài doanh nghiệp. Thông qua phân tích, chỉ đánh giá được một số yếu tố tác động đến khả năng mua lại sản phẩm của khách hàng nhưng không có đủ thông tin để thực sự xác định được nguyên nhân nào khiến khách hàng mua lại. Bộ dữ liệu này chỉ thể hiện được hành vi mua sách nói của khách hàng trong một hoàn cảnh cụ thể mà không xét đến những yếu tố khác, trong khi môi trường xung quanh luôn không ngừng thay đổi có thể tác động đến hành vi và ý định tiếp tục sử dụng ứng dụng sách nói của công ty này. 6. Kết luận 6.1. Đề xuất thực tiễn Yếu tố ảnh hưởng nhiều nhất đến tỷ lệ quay lại của khách hàng của Audiobook là việc các khách hàng để lại đánh giá. Chính vì vậy, bên cạnh việc nâng cao chất lượng sản phẩm audio để đem lại những trải nghiệm tốt cho khách hàng, Book Intelligence cần đưa ra thêm nhiều chính sách khuyến khích các khách hàng để lại đánh giá sau mua. Sau mỗi đánh lượt đánh giá sản phẩm audio, khách hàng sẽ được cộng thêm số thời gian nghe audio trên ứng dụng. Qua bộ dữ liệu, chúng tôi nhận thấy công ty chúng ta chưa có các gói đăng ký sản phẩm audio phù hợp với từng nhóm đối tượng khách hàng, việc khách hàng đăng ký gói hiện khá cảm tính. Thực tế, khi lựa chọn đăng ký một gói sản phẩm trên app Audiobook, người dùng có rất nhiều lựa chọn về mức giá cũng như thời lượng tối đa các audio khác nhau được nghe. Sự đa dạng này đôi khi khiến khách hàng rơi vào trạng thái rối bời, phân vân không biết nên lựa chọn mua gói sản phẩm nào. Điều này sẽ khiến thời gian quyết định mua của khách hàng kéo dài lâu hơn, thậm chí trong một số trường hợp khiến khách hàng từ bỏ ý định mua. Vì thế, chúng tôi đề xuất

9

Audiobook nên thiết kế các gói sản phẩm với mức giá và thời lượng cụ thể và đẩy mạnh trong 1-2 tháng tới nhằm định hướng sẵn giúp khách hàng dễ dàng so sánh được lợi ích của từng gói và có quyết định mua nhanh hơn.

Hình 2. Thống kê số lượt mua cái gói audio theo thời lượng một gói

Hình 3. Thống kê số lượt mua các gói audio theo giá một gói

Theo kết quả thống kê mô tả, xét theo các audio có số lượt mua cao nhất, có thể thấy gói sản phẩm với thời lượng 36h có lượt mua cao nhất (2269 lượt), thứ hai là gói 27h (2147 lượt), và mức giá 8 USD/1 tháng có 1533 lượt mua và mức giá 5,33 USD/1 tháng có 2324 lượt mua. Tuy nhiên do yếu tố thời lượng một gói audio không tác động đến hành vi mua lại của khách hàng nên khi tiến hành thực hiện phân tích Conjoint nhằm xây dựng và ra mắt các gói sản phẩm cụ thể để ra mắt và đẩy mạnh trong thời gian sắp tới, chúng tôi không xét đến thuộc tính này. Các thuộc tính được tìm hiểu và đưa vào gói sản phẩm bao gồm: Mức giá gói sản phẩm (1=5.33$, 2=8$), Chất lượng âm thanh (1=160Kbps, 2=96Kbps), Quyền truy cập sách Vip (1=Có, 0=Không). Kết quả phân tích (Phụ lục 8) cho thấy khi lựa chọn gói sản phẩm sách nói, khách hàng quan tâm nhất đến thuộc tính “quyền truy cập sách Vip” (37.87%), tiếp đó đến thuộc tính “chất lượng âm thanh” (36.23%) và cuối cùng mới đến “mức giá” của gói sản phẩm. Cũng từ đó, nhóm phân tích tính toán được điểm số trung bình mà khách hàng tham gia khảo sát đánh giá các phương án kết hợp của các gói sản phẩm như bảng dưới đây:

10

Có thể thấy gói sản phẩm có điểm số cao nhất là phương án 2 kết hợp của mức giá - 5.33$, chất lượng âm thanh - 96Kbps và không có quyền truy cập sách Vip. Tiếp đó phương án 7 có điểm số cao thứ hai. Cụ thể ở phương án 7 với mức giá 8$, người dùng sẽ được nghe các audio với chất lượng âm thanh 160Kbps và có quyền truy cập vào nghe các cuốn sách Vip. Từ đó, chúng tôi đề xuất ra mắt hai gói sản phẩm PRO 8 USD và Standard - 5,33 USD. Cả hai gói đều không bị giới hạn về thời lượng nghe các audio khác nhau do yếu tố về thời lượng ko tác động tới việc khách hàng mua lại, đồng thời chúng tôi cũng kỳ vọng đây là yếu tố nhằm giữ chân, thu hút người dùng quay trở lại sử dụng ứng dụng sách nói. Gói sản

Giá

Chất lượng âm

Quyền truy

Số thời gian

thanh

cập sách VIP

(tiếng/tháng)

8$

160Kbps



Unlimited

5.33$

96Kbps

Không

Unlimited

phẩm PRO Standard

Bảng 1. Hai gói sản phẩm đề xuất

Thiết kế app tự động nhắc nhở hàng ngày tới khách hàng về các sản phẩm audio đang nghe dở dang vào các khung giờ khách hàng thường truy cập, đồng thời thông báo khi có bản ghi mới phù hợp với sở thích/hành vi của khách hàng. Qua việc này giúp công ty tạo thói quen cho khách hàng vào nghe hàng ngày để tăng lượt khách hàng quay lại sử dụng dịch vụ. Khuyến khích khách hàng khách hàng mua tiếp các dịch vụ bằng các chương trình khuyến mãi tặng kèm file sách hay tặng thêm các audio ngắn khi mua các gói có thời lượng dài. 11

Đẩy mạnh dịch vụ tiếp thị, quảng cáo trên các nền tảng mạng xã hội để thu hút khách hàng và quảng cáo các sản phẩm và dịch vụ mà khách hàng chưa biết tới. 6.2. Kiến nghị Với sự phát triển như vũ bão của nền tảng công nghệ số, ngày càng có nhiều ứng dụng sách nói trên thị trường, điều này dẫn đến sự cạnh tranh khốc liệt giữa các công ty phát triển sách nói nói chung và Book Intelligence nói riêng. Khách hàng giờ đây không phải “thượng đế”, họ là trung tâm sự phát triển của doanh nghiệp. Bởi vì lẽ đó mà công ty chúng ta cần chú trọng hơn trong việc quan sát diễn biến tâm lý khách hàng. Để biết được thực sự những gói sản phẩm hiện tại đã phù hợp với khách mục tiêu hay chưa, chúng ta cần thu thập thêm các dữ liệu khác như dữ liệu về nhân khẩu học, một vài dữ liệu về hành vi,... Tỷ lệ khách hàng ngừng mua lại sản phẩm audio của công ty chúng ta đã phản ánh phần nào tình hình kinh doanh sụt giảm như hiện nay. Nhiệm vụ cấp bách lúc này là nghiên cứu và tìm ra các nguyên nhân dẫn đến việc khách hàng không quay trở lại sử dụng dịch vụ. Chúng ta cần thiết phải tổ chức các khảo sát nghiên cứu sâu về nguyên nhân rời bỏ sản phẩm của các khách hàng hoặc khảo sát thăm dò phản ứng của nhóm khách hàng hiện tại đối với hai gói sản phẩm đề xuất phía trên để có thể điều chỉnh và xây kế hoạch triển khai hiệu quả. Bên cạnh đó, Book Intelligence nên tận dụng các trang Social Media để tiếp cận họ, lắng nghe các tâm tư và tìm ra nhiều điều mà khách hàng đang quan tâm. Bên cạnh đó cần đề cao phát triển nền tảng ứng dụng audio, giúp khách hàng dễ dàng sử dụng ứng dụng, đồng thời hỗ trợ kịp thời thông qua box-chat hỗ trợ khi khách hàng gặp các khó khăn khi sử dụng ứng dụng và tri ân nhưng khách hàng quay lại sử dụng dịch vụ nhiều lần. Điều này làm tăng sự gắn kết của khách hàng với doanh nghiệp. Cuối cùng, chúng ta cần nghiên cứu và nhận thức được vị thế của mình trên thị trường, so sánh với các đối thủ cạnh tranh để đưa ra những kế hoạch phát triển về dài hạn.

12

PHỤ LỤC Dưới đây là quy trình tiến hành phân tích dữ liệu mà chúng tôi đã thực hiện, các bước đều rất quan trọng và mang tính sâu chuỗi với nhau: Bước 1: Xác định vấn đề Nhận thấy tình trạng doanh thu của app Audiobook có dấu hiệu sụt giảm, chúng tôi đã tiến hành thảo luận và nhận thấy tỷ lệ rời bỏ của khách hàng ở mức cao (68%). Chính vì điều đó chúng tôi đã tiến hành phân tích các yếu tố tác động đến tỷ lệ mua lại trên ứng dụng để đề xuất phương án khắc phục kịp thời. Bước 2: Lấy dữ liệu Dữ liệu được chúng tôi sử dụng phục vụ cho việc phân tích được trích xuất từ cơ sở dữ liệu người dùng đã mua các gói sản phẩm mất phí (Audiobook_data) trong vòng 6 tháng gần đây được lưu trữ trên hệ thống quản lý dữ liệu khách hàng chung của công ty Book Intelligence. Bước 3: Xử lý dữ liệu Bộ dữ liệu ban đầu có 7024 quan sát, giá trị ngoại lai xuất hiện ở biến price_one, chiếm 2,54% trên trổng quan sát. Nhóm phân tích đã tiến hành loại bỏ 179 hàng chứa giá trị bị outlier. Bộ dữ liệu còn lại 6845 quan sát được đưa vào phân tích và xây dựng mô hình “Hồi quy Logistic”. Bước 4: Kiểm định sự phân phối của Churn đối với 2 loại biến + Biến liên tục

13

14

+ Biến nhị phân

+ Kiểm tra mối tương quan giữa các biến liên tục và biến phụ thuộc repurchase

15

Bước 5: Xây dựng mô hình Nhóm phân tích lựa chọn mô hình Logistic để dự báo các biến tác động đến tỷ lệ ngừng mua lại các gói sản phẩm sách nói của khách hàng. Để xây dựng mô hình, chúng tôi tiến hành: -

Kiểm tra độ phân phối của dữ liệu

-

Chia tập dữ liệu thành 2 bộ mẫu là: Mẫu xây dựng (train) và Mẫu kiểm định (test) (70% và 30%)

-

Train Models: Thử nhiệm các model sao cho VIF dưới 5 và giá trị p nhỏ hơn 5% Kết quả kiểm định hệ số tương quan giữa các biến liên tục với nhau và với biến

phụ thuộc cho thấy mô hình hồi quy được xây dựng có khả năng xảy ra hiện tượng “đa cộng tuyến” do hệ số tương quan ® của các cặp biến ở mức cao: num_of_purchase với price_overall (r=0.84), completion với time_listened (r=0.92). Từ đó, sau khi xây dựng mô hình Logit với biến phụ thuộc repurchase và 11 biến độc lập (ngoại trừ biến id (mã khách hàng) trên bộ mẫu xây dựng (train), nhóm tiến hành kiểm tra hệ số VIF của các biến và tiến hành loại dần các biến có hệ số VIF > 5 ra khỏi mô hình để tránh xảy ra hiện tượng đa cộng tuyến. Thứ tự 3 biến độc lập bị loại lần lượt qua các lần xây dựng và kiểm định mô hình như sau: num_of_purchase, completion, price_overall. Kết quả phân tích hồi quy Logistic cuối cùng gồm 1 biến phụ thuộc và 8 biến độc lập có kết quả như sau:

Hình 4. Kết quả phân tích hồi quy logistic trên bộ mẫu xây dựng

Mô hình hồi quy Logistic có dạng: 16

Logit(p) = Log(

p ) = -0.06209 price_one + 0.8934 review(Yes) + 1−p

0.7403 last_visited Bước 6: Đánh giá tính hiệu quả của mô hình AUC chính là diện tích nằm dưới ROC, vùng này càng lớn thì khả năng dự đoán của mô hình càng tốt. Một mô hình hiệu quả khi có FPR thấp và TPR cao. Đối với mẫu xây dựng (train)

Đối với mẫu kiểm định (test)

Bước 7. Kết quả phân tích Mô hình hồi quy logistic cuối cùng (với ngưỡng = 0,43) có độ chính xác là 0,84 và AUC là 0,92. Dựa trên các giá trị Pz của các biến, kết luận các biến độc lập tác động tới biến phụ thuộc repurchase (Hành v...


Similar Free PDFs