TIỂU-LUẬN-copy - báo cáo cuối kì môn kiến trúc hệ thống dùng để tham khảo PDF

Title	TIỂU-LUẬN-copy - báo cáo cuối kì môn kiến trúc hệ thống dùng để tham khảo
Author	Châu Minh
Course	Hệ Thống Thông Tin Quản Lý - INF
Institution	Trường Đại học Kinh tế Thành phố Hồ Chí Minh
Pages	51
File Size	1.7 MB
File Type	PDF
Total Downloads	209
Total Views	311

Preview

CLICK TO PREVIEW PDF

Summary

Download TIỂU-LUẬN-copy - báo cáo cuối kì môn kiến trúc hệ thống dùng để tham khảo PDF

Description

ĐẠI HỌC UEH TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH

TIỂU LUẬN KẾT THÚC HỌC PHẦN Bộ môn: Kiến trúc hệ thống

Xây dựng thương hiệu cá nhân & hệ thống khuyến nghị việc làm thông minh Mã lớp học phần: 22D1INF50900401 Giáo viên hướng dẫn: TS. Võ Hà Quang Định Nhóm sinh viên thực hiện: Nhóm 10 – Lớp BI001 Trần Minh Châu

MSSV: 31201023799

Trần Ngọc Bảo Hân

MSSV: 31201020266

Bùi Thị Thanh Hương

MSSV: 31201023855

Đặng Thị Kim Ngân

MSSV: 31201020589

Lê Ngọc Như Quỳnh

MSSV: 31201020849

LỜI CẢM ƠN Hoàn thành bài thi kết thúc môn, nhóm chúng em xin chân thành cảm ơn thầy Võ Hà Quang Định – giảng viên bộ môn Kiến Trúc Hệ Thống, đã tận tình hướng dẫn và giảng dạy chúng em tận tình trong suốt học phần, ngoài chương trình học thì thầy đã tận tâm chia sẻ các kiến thức, kinh nghiệm, câu chuyện giúp chúng em định hướng rõ hơn cũng như có thêm động lực để học tập. Cuối cùng, một lần nữa chúng em xin gửi lời cảm ơn đến thầy, kính chúc thầy thật nhiều sức khoẻ.

Mục Lụ

1

CHƯƠNG 1: MỞ ĐẦU...........................................................................................4 1. Đặt vấn đề.............................................................................................................. 4 2. Mục tiêu nghiên cứu..............................................................................................5 CHƯƠNG 2: NỘI DUNG......................................................................................7 1. Các hệ thống khuyến nghị truyền thống................................................................7 1.1 Hệ thống khuyến nghị dựa vào lọc cộng tác.................................................7 1.2 Hê L thống khuyến nghị dựa trên nô iLdung....................................................13 1.3 Hệ thống khuyến nghị dựa trên tri thức......................................................22 2. Hệ thống khuyến nghị kết hợp giữa lọc dựa trên nội dung và lọc dựa trên tri thức ................................................................................................................................. 28 2.1 Đặt vấn đề...................................................................................................28 2.2 Các vấn đề được giải quyết trong hệ thống khuyến nghị kết hợp................28 2.3 Tổng quan quy trình đề xuất trong hệ thống khuyến nghị kết hợp..............29 3. Kiến trúc đề xuất của hệ thống khuyến nghị việc làm thông minh......................30 3.1 Competency Construction (Xây dựng năng lực).........................................32 3.2 Thương hiệu cá nhân...................................................................................38 3.3 Xây dựng profile......................................................................................... 44 3.4 Kiến trúc hệ thống khuyến nghị việc làm thông minh.................................45 CHƯƠNG 3: KẾT LUẬN.....................................................................................48 TÀI LIỆU THAM KHẢO.....................................................................................49

DANH MC HNH N

2

Hình 1.1 Minh họa phương pháp lọc cộng tác..........................................................8 Hình 1.2 Các giai đoạn xây dựng hH sơ sản phIm và hH sơ người dùng.................15 Hình 1.3 Minh họa phương pháp lọc dựa trên nôiKdung..........................................16 Hình 1.4 Quy trình xử lM cNa hêthống K khuyến nghị dựa trên nô iKdung...................18 Hình 1.5 Trang web đề xuQt nhà hàng entree..........................................................24 Hình 1.6 Trang web đề xuQt nhà hàng entree..........................................................25 Hình 1.7 Trang web đề xuQt nhà hàng entree..........................................................25 Hình 1.8 cổng thông tin thương mại điện tử recommender.com..............................26 Hình 1.9 Cổng thông tin thương mại điện tử recommender.com.............................27 Hình 1.10 Cổng thông tin thương mại điện tử recommender.com...........................27 Hình 1.11 Cổng thông tin thương mại điện tử recommender.com............................28 Hình 3.1 C ác yếu tố trong kiến trúc cNa hê Kthống đề xuQt ----------------------------------- 32 Hình 3.2 Minh họa về sự khác nhau cNa tY trong các ngữ cảnh ---------------------- 35 Hình 3.3 Minh họa bigram ---------------------------------------------------------------------------------------------------- 36 Hình 3.4 Minh họa trigram --------------------------------------------------------------------------------------------------- 36 Hình 3.5 Thang đo bloom ------------------------------------------------------------------------------------------------------- 37 Hình 3.6 Sự phù h[p giữa năng lực và quảng cáo viê cKlàm --------------------------------38 Hình 3.7 P hương pháp luận để xây dựng năng lực --------------------------------------------------- 39 Hình 3.8 Q uá trình tạo nên thương hiệu cá nhân -------------------------------------------------------42 Hình 3.9 Mã giả xây dựng thương hiệu cá nhân ---------------------------------------------------------43 Hình 3.10 K iến trúc cNa hê K thống khuyến nghị kết h[p -----------------------------------------47 Hình 3.11 Quá trình lựa chọn những lời mời công viê cK-----------------------------------------48

3

DANH M^C BẢNG BI`U Bảng 1.1 Ví dụ ma trận Người dùng – Sản phIm---------------------------------------------------------------- 9 Bảng 3.1 Bảng ma trận giữa các môn học, chứng chỉ với năng lực------------------------------ 43 Bảng 3.2 Bảng logic (truth table---------------------------------------------------------------------------------------------- 44

4

CHƯƠNG 1: MỞ ĐẦU 1. Đặt vấn đề Khi thị trường lao động ngày trở nên càng cạnh tranh, mỗi sinh viên, hay các trường đại học điều có chung một mối quan tâm đó chính là liệu chương trình đào tạo có đủ đáp ứng các tiêu chuẩn của ngành nghề tương ứng trong thực tế hay không, năng lực của các cử nhân có thực sự phù hợp với công việc đang hướng đến cũng như hiện có hay không. Nhìn chung thì có thể thấy rằng một trong những thử thách lớn nhất mà các trường đại học phải giải quyết là chú trọng hỗ trợ sinh viên trang bị đủ kỹ năng, kiến thức thông qua chương trình đào tạo, có được công việc phù hợp với bản thân và đáp ứng được các yêu cầu của công việc ngoài thực tế. Mặc dù các trường đại học đang cố gắng thu nhỏ khoảng cách giữa chương trình học thuật và thị trường lao động, thì có vấn đề khác mang tính cấp thiết hơn là xác định được đúng người, đúng công việc. Các nhà tuyển dụng thì luôn ra sức tìm kiếm các ứng viên, cử nhân tài năng, còn các trường đại học thì luôn hướng đến việc phát triển các sinh viên, đặc biệt là thương hiệu cá nhân. Tuy nhiên, hiện tại một số vấn đề cần giải quyết vẫn còn tồn tại. Theo một số ý kiến cho thấy giữa các yêu cầu của công việc, chương trình đào tạo, profile cá nhân của các cử nhân vẫn chưa thực sự hoà hợp, phù hợp với nhau, điều này dẫn đến tình trạng khả năng cá nhân chưa được tận dụng hiệu quả vì làm công việc không phù hợp hay khó khăn cho các nhà tuyển dụng trong quá trình tìm kiếm ứng viên phù hợp với vị trí cần tuyển. Nhận thấy được các vấn đề trên, một số nghiên cứu đã được tiến hành tại LATAM nhằm phân tích sâu hơn để tìm ra cách khắc phục sự không phù hợp giữa người lao động và công việc. Tại LATAM, dù tỉ lệ phần trăm sinh viên tốt nghiệp bậc đại học cho thấy sự cải thiện đáng kể với mức tăng trung bình là 40%, nhưng đâu đó các vấn đề không phù hợp với nghề nghiệp vẫn còn đang tiếp diyn, cụ thể hơn là sự không tương thích giữa kỹ năng và các yêu cầu của công việc đó. Và theo Tổ chức lao động quốc tế, vấn đề trên là đến từ nhiều nguyên nhân khác nhau, một trong số đó là việc quản lý 5

luồng thông tin, nơi được cho là bất cân xứng về thông tin giữa những người tìm việc, cung cấp việc làm và các tổ chức cung cấp giáo dục như trường đại học (ECLAC-ILO, 2019). Ngoài ra, sự không tương thích giữa chương trình đào tạo của các trường đại học và những yêu cầu của công việc từ các doanh nghiệp đã dẫn đến 25.4% vấn đề không phù hợp với công việc. Mặt khác, với quá trình tuyển dụng của cả khu vực công và tư thì việc tuyển dụng được hoạt động như cách truyền thống, tìm kiếm các cử nhân tiềm năng thông qua việc phân tích CV bằng cách xem xét các năng lực của cử nhân và yêu cầu của công việc. Và đối với phương pháp này, người tuyển dụng không thể nắm bắt được đầy đủ năng lực kỹ thuật, chuyên môn và năng lực công nghệ thông tin, cũng như tình trạng phát triển của sinh viên tốt nghiệp đại học, ngay cả khi họ thừa năng lực làm việc so với yêu cầu. Như chúng ta cũng đã biết, nếu kỹ năng, năng lực không phù hợp với công việc thì sẽ dẫn đến tình trạng làm giảm đi hiệu quả, sự thỏa mãn trong công việc ở cả người tuyển dụng, đồng thời nó cũng sẽ làm tăng tỷ lệ thay đổi nhân sự, tăng chi phí ẩn của doanh nghiệp, khó khăn trong việc triển khai phát triển công nghệ mới, sản phẩm và dịch vụ. (ILO). Do đó, để giải quyết vấn đề này thì cần dựa trên trí tuệ nhân tạo để xây dựng nên định hướng nghề nghiệp cũng như hệ thống thông tin thị trường lao động nhằm để giảm chi phí tìm kiếm công việc và cải thiện tình trạng có công việc không phù hợp của người lao động.

2. Mục tiêu nghiên cứu 

Đề xuất kiến trúc hệ thống khuyến nghị việc làm thông minh dựa

trên thương hiệu cá nhân giúp các sinh viên tìm được công việc phù hợp và hỗ trợ các phòng ban nhân sự trong quy trình tuyển dụng người lao động thích hợp. 

Xây dựng thương hiệu cá nhân dựa trên nội dung chương trình đào

tạo và sự hài lòng của các cử nhân. 6



Cung cấp khung lý thuyết để giúp các sinh viên, cử nhân tiến đến

sự thành công trong nghề nghiệp chuyên môn, giúp các trường đại học đạt được sự thành công trong tính cá nhân hoá cho sinh viên, đồng thời giúp tối ưu và cải thiện chất lượng trong chương trình đào tạo.

7

CHƯƠNG 2: NỘI DUNG

1.

Các hệ thống khuyến nghị truyền thống

1.1 Hệ thống khuyến nghị dựa vào lọc cộng tác 1.1.1 Định nghĩa “Lọc cộng tác là kỹ thuật sử dụng các sở thích cá nhân của người dùng để đưa ra những gợi ý.”Hệ thống khuyến nghị dựa vào lọc cộng tác sẽ phân tích dữ liệu người dùng để tìm ra mối tương quan (sự liên quan, điểm tương đồng) giữa các đối tượng người dùng. Sau đó, hệ thống sẽ dựa trên những sở thích của người dùng này để dự đoán những sản phẩm, dịch vụ, nội dung mà người dùng khác trong nhóm có thể thích. Lấy ví dụ, A thích xe đạp màu đỏ và B cũng thích xe đạp màu đỏ thì A và B có điểm tương đồng nên được xếp vào một nhóm. Trong phương pháp này, hệ thống sẽ so sánh, tính toán độ tương đồng giữa những người dùng (users) hay món hàng (items), từ đó người dùng sẽ được gợi ý những sản phẩm thích hợp và được ưa chuộng bởi những người dùng khác có cùng sở thích. Lấy ví dụ, để có thể gợi ý một loại trái cây cho chị H, hệ thống lọc cộng tác sẽ tìm những người dùng khác có cùng sở thích ăn trái cây với chị H, cụ thể ở đây là anh A có cùng sở thích ăn chuối với chị H. Từ đó hệ thống sẽ xác định được chị H và anh A có cùng sở thích, anh A cũng thích quả lê vậy nên hệ thống sẽ đề xuất quả lê cho chị H vì khả năng cao chị H cũng sẽ thích quả lê.(Nguyyn Thị Phượng, 2016)

Hình 1.1 Minh họa phương pháp lọc cộng tác 8

Lọc cộng tác hoạt động bằng cách xây dựng một cơ sở dữ liệu, lưu trữ dưới dạng ma trận Người dùng - Sản phẩm (Users – Items). Với phương pháp này, đầu vào chính là sở thích của người dùng và nó thể hiện những dữ kiện lịch sử, những hành vi trong quá khứ. Trong hệ thống khuyến nghị, hàng (rows) dùng để thể hiện cho người dùng và columns (cột) thể hiện những sản phẩm mà người dùng lựa chọn, giá trị mỗi ô là đánh giá của người dùng lên sản phẩm đó. “Đối với những hệ thống khác nhau thì đánh giá cNa người dùng cũng đư[c quy ước những giá trị khác nhau, tùy vào mỗi hệ thống. Trong ví dụ này, các đánh giá có giá trị tY 1 tới 5. Bảng 1.1 Ví dụ ma trận Người dùng – Sản phIm

Người dùng

Sản phẩm

Sản phẩm

Sản phẩm

1

2

3

4

2

0

1

5

4

0

0

3

1 Người dùng 2 Người dùng 3 Ở ví dụ ma trận trên, người dùng 1 đánh giá sản phẩm 1 là 4, sản phẩm 2 là 2, sản phẩm 3 chưa được đánh giá. Ma trận trên còn khá nhiều chỗ trống (ma trận thưa) tức được điền 0 và công việc của hệ thống lọc cộng tác là phải điền vào những chỗ trống đó. Nghĩa là hệ thống phải đưa ra dự đoán người dùng 1 đánh giá sản phẩm 3 là bao nhiêu và người dùng 3 đánh giá sản phẩm 1, 2 là bao nhiêu. Sau đó, hệ thống sẽ sắp xếp kết quả dự đoán (ví dụ từ cao xuống thấp) và chọn ra Top-N sản phẩm theo thứ tự, cuối cùng là gợi ý chúng cho người dùng.”

9

1.1.2 Phân loại Phương pháp lọc cộng tác có 2 dạng chính: lọc cộng tác dựa trên bộ nhớ (Memory-based) và lọc cộng tác dựa trên mô hình (Model-based). 1.1.2.1

Lọc cộng tác dựa trên bộ nhớ

Phương pháp lọc cộng tác dựa trên bộ nhớ hay còn được gọi là phương pháp lọc cộng tác dựa trên láng giềng (Neighborhood-based collaborative filtering) là phương pháp dự đoán các sản phẩm dựa trên sự tương quan giữa những người dùng láng giềng hoặc sản phẩm láng giềng, nghĩa là những người dùng có sở thích tương tự hay những sản phẩm có điểm tương đồng. Phương pháp này đưa ra dự đoán dựa vào 2 cách tiếp cận: 

Lọc cộng tác dựa trên người dùng (User-based collaborative

filtering). Bản chất của lọc cộng tác dựa trên người dùng là tìm những người dùng có sở thích tương tự với 1 người dùng A bất kì và gợi ý những thứ họ thích cho người dùng A. Hệ thống sẽ thu thập dữ liệu mẫu và xây dựng ma trận Người dùng – Sản phẩm (Users – Items). Đối với mỗi người dùng, cần quan tâm đến các sản phẩm đã được người dùng đó đánh giá. Đối với mỗi sản phẩm được người dùng đó đánh giá, công việc của hệ thống là phải tìm được N người dùng khác cũng đánh giá sản phẩm đó. Từ đó, hệ thống tính toán được độ tương tự giữa các người dùng với nhau và cho ra được kết quả đánh giá các sản phẩm chưa được người dùng hiện tại đánh giá. Cuối cùng, hệ thống sẽ gợi ý cho người dùng hiện tại những sản phẩm có đánh giá cao nhất.



Lọc cộng tác dựa trên sản phẩm (Item-based collaborative

filtering). Bản chất của lọc cộng tác dựa trên sản phẩm là xác định những sản phẩm tương đồng để dự đoán mức độ yêu thích của người dùng đối với 1 sản phẩm dựa trên mức độ yêu thích của người dùng đối với những sản phẩm tương đồng. Hệ thống vẫn sẽ thu thập dữ liệu mẫu và xây dựng ma 10

trận Người dùng – Sản phẩm (Users – Items). Hệ thống quan tâm đến tập hợp các sản phẩm đã được người dùng B đánh giá. Sau đó, nhiệm vụ của hệ thống là phải tìm được K sản phẩm tương tự nhất với mỗi sản phẩm I trong tập hợp. Từ đó, hệ thống tính toán được độ tương tự giữa các sản phẩm có điểm tương đồng nhau và cho ra được kết quả dự đoán đánh giá của người dùng đối với các sản phẩm chưa được đánh giá. Bước cuối cùng là hệ thống sẽ gợi ý cho người dùng những sản phẩm được dự đoán có đánh giá cao. 1.1.2.2

Lọc cộng tác dựa trên mô hình

Khác với phương pháp lọc cộng tác dựa vào bộ nhớ, phương pháp lọc cộng tác dựa trên mô hình (Model-based methods) sử dụng tập đánh giá để xây dựng mô hình huấn luyện. Kết quả của mô hình huấn luyện sẽ đưa ra dự đoán mức độ yêu thích của người dùng về những sản phẩm chưa được đánh giá. Mô hình huấn luyện có kích thước nhỏ hơn rất nhiều so với ma trận đánh giá và thực hiện dự đoán nhanh. Để đưa ra các khuyến nghị, lọc cộng tác có thể sử dụng các kỹ thuật học máy (machine learning) và khai phá dữ liệu (data mining) như mô hình Bayesian, mô hình Clustering, mạng nơ-ron nhân tạo, cây quyết định và còn nhiều mô hình khác nữa. 

Bô L phân loại Bayes được sử dụng để phân loại các sản phẩm dựa

trên những đánh giá “thích” hoă cL“không thích” của người dùng đối với các sản phẩm. 

Cây quyết định được áp dụng trong viê cLphân tích và phân loại cho

các sản phẩm mới. Kỹ thuâ tLnày cho ta môtLcách nhìn trực quan hơn để đưa ra các dự đoán đánh giá cho người dùng. 

Phân cụm là kỹ thuâ tLchia các đối tượng dữ liê uL đầu vào thành các

cụm dữ liê uL khác nhau nhằm mục đích loại bỏ các dữ liê uL không liên quan và tâpLtrung vào phân tích các dữ liê uL có mối quan hê LmâtLthiết với nhau. 

Mạng nơ tron nhân tạo là mô tLmô hình học máy vô cùng mạnh mẽ.

Nó giúp chúng ta hiểu được các mối quan hê Lphức tạp trong tâ pL dữ liê uL và hạn chế các thông tin gây nhiyu. Nhưng vấn đề của nó là khó khăn trong

11

viêcLđề ra cấu trúc mạng phù hợp và yêu cầu dữ liê uL phân tích cho nó khá lớn.

1.1.3 Ứng dụng phương pháp lọc cộng tác

Phương pháp lọc cộng tác dựa trên người dùng (áp dụng tương tự với phương pháp lọc cộng tác dựa trên sản phẩm) được thực hiện qua các bước sau: Bước 1: Giảm số chiều của dữ liệu Đây là giai đoạn chuyển đổi ma trận ban đầu thành một không gian biểu diyn thấp hơn, giảm kích thước số chiều của ma trận nhằm mục đích giải quyết vấn đề thưa thớt và khả năng mở rộng thường xuất hiện trong phương pháp lọc cộng tác. Ban đầu, biểu diyn của dữ liệu đầu vào là một ma trận Người dùng – Sản phẩm m × n, trong đó m là số lượng các sản phẩm và n là số lượng người dùng. Trên thực tế, số lượng người dùng là rất lớn, số lượng sản phẩm cũng rất lớn như vậy ma trận đánh giá sẽ rất lớn nên cần xử lý nhiều phép tính hơn và thời gian tính toán cũng sẽ lâu hơn. Bên cạnh đó, thông thường một người dùng chỉ tiếp cận với một số ít sản phẩm. Lấy ví dụ, một danh sách bài hát có sẵn nhưng người dùng chỉ đánh giá hay chọn một số ít bài hát dẫn đến kết quả là một ma trận thưa thớt. Để khắc phục được các hạn chế nói trên, ma trận thưa thớt có thể chuyển đổi thành một không gian biểu diyn thấp hơn thông qua phương pháp Latent Semantic Indexing. Bước 2: Tìm kiếm người dùng liên quan Nhiều phương pháp được sử dụng để tính toán độ tương đồng giữa các người dùng như độ tương tự Cosine, độ đo tương quan Pearson, độ đo khoảng cách Euclid,… Tuy nhiên, bài nghiên cứu này chỉ tâ pL trung khai thác phương pháp hệ số tương quan Pearson bởi tính phổ biến và độ chính xác cao mà nó mang lại. Độ tương đồng giữa 2 người dùng và được tính như sau: 12

Trong đó: : đánh giá của người dùng a trên sản phẩm i : đánh giá của người dùng b trên sản phẩm i : trung bình đánh giá của người a : trung bình đánh giá của người b m : tổng số sản phẩm Thực hiện tính toán độ tương đồng giữa các người dùng khác so với người dùng a, sau đó thu được danh sách những người dùng khác có điểm tương đồng cao nhất với người dùng a. Các giá trị được sắp xếp giảm dần và có thể lấy Top 10, Top 20, Top 30,… tùy thuộc vào việc tùy chọn cho hệ thống sử dụng. Bước 3: Tạo ra các giá trị dự báo Sau khi tìm được danh sách các người dùng tương đồng nhất, hệ thống sẽ tính toán đưa ra các dự báo đánh giá để đưa ra các khuyến nghị phù hợp cho người dùng. Những phương pháp dự đoán như điểm số Z trung bình (Z-score average), trung bình có trọng số (Weighted average), deviation-from-mean được sử dụng để ước lượng điểm số đánh giá của người dùng a trên sản phẩm. Đối với bài nghiên cứu này, nhóm sẽ tập trung vào phương pháp điểm số Z trung bình với công thức được đề xuất như sau: 1.1.4 Ưu và nhược điểm cia phương pháp lọc cô j ng tác Ưu điểm 

Không phụ thuộc vào tính chất đối tượng/ sản phẩm cần gợi ý:“Hệ

thống lọc cộng tác dựa trên những đánh giá của người dùng để đưa ra dự đoán về sở thích của họ, thế nên các tính chất của đối tượng gợi ý không 13

ảnh hưởng đến quá trình gợi ý. Phương pháp này còn gợi ý các sản phẩm phù hợp với từng đối tượng khách hàng mà không cần hiểu tính chất sản phẩm.”



Gợi ý đa dạng: hệ thống lọc cộng tác gợi ý dựa trên trải nghiệm của

người dùng khác có điểm tương đồng nên có thể gợi ý được đa dạng các sản p...