Các hệ thống gợi ý hay recommendation system dựa trên deep learning đang thúc đẩy sự phát triển của những gã khổng lồ trực tuyến. Hiện nay, nhờ tính sẵn sàng của các hệ thống xử lý dữ liệu hiệu năng cao qua GPU, doanh nghiệp nào cũng có thể tiếp cận được đến với các hệ thống kiểu như vậy. Trong bài viết này hãy cùng Shop máy chủ tìm hiểu về recommendation System – Hệ thống gợi ý nhé.
Tổng quan về hệ thống gợi ý
Hệ thống gợi ý (Recommender systems hoặc Recommendation systems) thực chất là một dạng của hệ hỗ trợ ra quyết định, nhằm cung cấp giải pháp mang tính cá nhân hóa mà không phải trải qua quá trình tìm kiếm phức tạp. Hệ thống gợi ý học từ người dùng và gợi ý các sản phẩm tốt nhất trong số các sản phẩm phù hợp.
Bên cạnh đó, hệ thống gợi ý sử dụng các tri thức về sản phẩm, các tri thức của chuyên gia hay tri thức được khai phá học từ hành vi con người dùng. Sau đó, sẽ đưa ra các gợi ý về sản phẩm mà họ thích trong hàng ngàn hàng vạn sản phẩm có trong hệ thống. Ngoài ra, các website thương mại điện tử, như sách, phim, nhạc hay báo đều sử dụng hệ thống gợi ý để nhằm cung cấp các thông tin để giúp cho người sử dụng quyết định sẽ lựa chọn sản phẩm nào.
Không những thế, các sản phẩm được gợi ý dựa trên số lượng sản phẩm đó đã được bán, hoặc dựa trên các thông tin cá nhân của người sử dụng và thậm chí còn dựa trên sự phân tích hành vi mua hàng trước đó của người sử dụng. Qua đó sẽ đưa ra các dự đoán về hành vi mua hàng trong tương lai của chính khách hàng đó. Một số hệ thống gợi ý bao gồm gợi ý các sản phẩm tới người tiêu dùng, các thông tin sản phẩm mang tính cá nhân hóa. Đồng thời, tổng kết các ý kiến cộng đồng và cung cấp các chia sẻ, các phê bình hay đánh giá mang tính cộng đồng liên quan tới yêu cầu và mục đích của người sử dụng đó.
Các hệ thống gợi ý phổ biến
1 Hệ thống gợi ý dựa trên lọc cộng tác
Hệ thống gợi ý dựa theo lọc cộng tác (Collaborative recommendation systems) chính là phương pháp gợi ý được triển khai rộng rãi và thành công nhất trong thực tế.
Hệ thống dựa theo lọc công tác phân tích và tổng hợp các điểm số đánh giá của các đối tượng. Từ đó, nhận ra sự tương đồng giữa những người sử dụng trên cơ sở các điểm số đánh giá và tạo ra các gợi ý dựa trên sự so sánh này. Bên cạnh đó, hồ sơ (profile) của người sử dụng điển hình trong hệ thống lọc cộng tác thường bao gồm một vector các đối tượng (item) và các điểm số đánh giá của chúng, cùng với số chiều tăng lên liên tục khi người sử dụng tương tác với hệ thống theo thời gian.
Một số hệ thống gợi ý còn sử dụng phương pháp chiết khấu dựa trên thời gian (time-based discounting) để giúp tính toán cho yếu tố “trượt” đối với sự quan tâm của người sử dụng. Đối với một số trường hợp điểm số đánh giá (rating) có thể là nhị phân (thích/không thích) hoặc các giá trị số thực cho thấy mức độ ưu tiên.
Điểm mạnh lớn nhất của kỹ thuật gợi ý theo lọc cộng tác là hoàn toàn độc lập với sự biểu diễn của các đối tượng đang được gợi ý. Vì thế, có thể làm việc tốt với các đối tượng phức tạp như âm thanh và phim.
2 Hệ thống gợi ý được dựa theo nội dung
Tiếp theo, hệ thống gợi ý dựa theo nội dung (Content-based recommendation systems) chính là sự kế thừa và mở rộng của lĩnh vực nghiên cứu lọc thông tin.
Trong hệ thống thì các đối tượng sẽ được biểu diễn bởi các đặc điểm liên quan tới chúng. Chẳng hạn như hệ thống gợi ý văn bản như hệ thống lọc tin NewsWeeder sử dụng những từ của các văn bản như các đặc điểm.
Ngoài ra, một số hệ thống gợi ý dựa trên nội dung học một hồ sơ cá nhân về sở thích của người sử dụng dựa trên các đặc điểm xuất hiện trong chính các đối tượng này đã đánh giá (rated). Vì thế, Schafer, Konstan & Riedl gọi gợi ý theo nội dung là “tương quan đối tượng với đối tượng” (item-to-item correlation). Hồ sơ người sử dụng của một hệ thống gợi ý dựa theo nội dung sẽ phụ thuộc vào phương pháp học máy được dùng.
Không những thế, cây quyết định (Decision trees), mạng nơron (neural nets) và biểu diễn dựa theo vector (vector-based representations) đều được sử dụng để học hồ sơ người dùng. Tương tự như trong hệ thống gợi ý dựa trên lọc cộng tác, hồ sơ người dùng trong hệ thống gợi ý dựa theo nội dung là những dữ liệu lâu dài và sẽ được cập nhật theo thời gian.
3 Hệ thống gợi ý dựa theo cơ sở tri thức
Hệ thống gợi ý dựa trên cơ sở tri thức (Knowledge-based recommender systems) chính là gợi ý các đối tượng dựa trên các suy luận về nhu cầu và cả sở thích của người dùng. Điều này có nghĩa là tất cả các kỹ thuật gợi ý có thể mô tả như là làm một số suy luận. Phương pháp tiếp cận được dựa trên cơ sở tri thức được phân biệt ở chỗ: chúng có kiến thức làm thế nào mà một đối tượng cụ thể đáp ứng nhu cầu một người dùng cụ thể. Vì thế, có thể lập luận về mối quan hệ giữa nhu cầu và các gợi ý cụ thể.
Hơn nữa còn sử dụng miền tri thức rõ ràng, có liên quan tới mối quan hệ giữa yêu cầu của người dùng và sản phẩm cụ thể. Trước hết, người ta đưa ra 3 dạng tri thức gồm tri thức về danh mục (tri thức về sản phẩm được gợi ý), tri thức người sử dụng (tức là tri thức về các yêu cầu của người sử dụng) và tri thức về các chức năng (tri thức để phản xạ các yêu cầu của người sử dụng tới các sản phẩm thoả mãn các yêu cầu đó).
Phương pháp này sẽ không dựa trên tiểu sử người sử dụng nên không gặp phải khó khăn về sản phẩm mới và người dùng mới. Hơn nữa, hệ thống gợi ý dựa trên cơ sở tri thức có khả năng suy diễn và nó phụ thuộc vào độ phù hợp của yêu cầu người sử dụng với các thuộc tính của sản phẩm.
Mọi hệ thống gợi ý dựa trên cơ sở tri thức đều là mối quan hệ thu nhận tri thức. Đặc biệt, chất lượng của các phương án gợi ý tùy thuộc vào độ chính xác của cơ sở tri thức. Đây cũng chính là hạn chế lớn nhất của phương pháp này.
So sánh các hệ thống gợi ý
1 Hệ thống gợi ý dựa trên lọc cộng tác
Ưu điểm của hệ thống gợi ý dựa theo lọc cộng tác:
- Khả năng đa hạng mục
- Không cần tri thức miền
- Chất lượng tăng theo thời gian
- Bao gồm đủ thông tin phản hồi không tường minh
Nhược điểm:
- Vấn đề người dùng mới
- Vấn đề sản phẩm/đối tượng mới
- Vấn đề “Gray sheep”
- Ngoài ra, chất lượng phụ thuộc vào độ lớn dữ liệu lịch sử thao tác của người sử dụng
- Vấn đề về tính bền vững và mềm dẻo
2 Hệ thống gợi ý được dựa trên nội dung
Ưu điểm:
- Không cần tri thức miền
- Chất lượng tăng theo thời gian
- Có đủ thông tin phản hồi không tường minh
Nhược điểm:
- Vấn đề người dùng mới
- Chất lượng sẽ phụ thuộc vào độ lớn dữ liệu lịch sử thao tác của người sử dụng
- Vấn đề về tính bền vững và mềm dẻo
3 Hệ thống gợi ý dựa vào cơ sở tri thức
Ưu điểm: Có thể ánh xạ giữa nhu cầu người dùng và sản phẩm/đối tượng
Nhược điểm: Cần phải thu thập tri thức.
Trên đây một số thông tin liên quan đến hệ thống gợi ý mà bạn đọc có thể tham khảo Mong rằng bài viết có thể giúp các bạn có được cách nhìn tổng quan về hệ thống gợi ý nhé.