本月熱賣
  • 電子書
機器學習算法實踐:推薦系統的協同過濾理論及其應用 (電子書)
主題活動 試閱
收藏試閱本 44
人收藏
適合手機 適合平板

機器學習算法實踐:推薦系統的協同過濾理論及其應用 (電子書)

  • 定價:345
  • 優惠價:99
  • 優惠期限:2024年12月08日止
  • 不可銷售區域:中國
載入中...

電子書閱讀軟體

支援瀏覽器說明

APP下載:

  • 分享
 

內容簡介

推薦系統──
採集使用者歷史行為資訊並結合具體推薦,
幫助使用者選擇商品以及提供建議的過程。

◎什麼是協同過濾推薦算法?
協同過濾推薦算法是利用使用者與項目評分矩陣中的已知元素來預測未知元素的評分值並將預測評分高的項目推薦給使用者。
◎什麼是使用者興趣漂移?
由於傳統的協同過濾算法忽略了隨著時間變化而使用者的興趣也在不斷發生變化這一問題,即存在使用者興趣漂移現象。
◎什麼是巴氏係數?
是對兩個統計樣本的重疊的近似計算,可用來對兩組樣本的相關性進行測量,已廣泛應用於訊號處理、模式識別研究領域。

▎第一篇(第1章)
討論了推薦算法的分類、各類算法的基本思想和改進策略,闡述推薦算法存在的問題、實驗方法和評測指標。

▎第二篇(第2章和第3章)
本篇針對基於時序的協同過濾推薦算法展開研究。

▎第三篇(第4章至第11章)
針對SVD、機率矩陣分解、非負矩陣分解及其與相關算法的整合提出理論。

▎第四篇(第12章和第13章)
圍繞協同過濾推薦算法與社群網路的信任展開研究,將使用者的評分資訊和使用者的社群網路資訊融入傳統的矩陣分解中以提高推薦品質。

▎第五篇(第14章)
從實際應用的角度用Spark實現一個基於矩陣分解的推薦原型系統。

★本書特色:本書內容豐富,較全面地介紹了基於協同過濾的推薦系統存在的問題、解決方法和評估策略,可供從事推薦系統、人工智慧、機器學習、模式識別和資訊檢索等領域的科學研究人員及研究生參考。

 

作者介紹

王建芳,研究方向包括推薦系統、深度學習、人工智慧及智慧計算算法。申請國家發明專利3項、新型實用專利3項。在海內外重要期刊及國際會議上發表學術論文30餘篇。出版教材及專著3部。

 

目錄

前言 PREFACE
第一篇 基礎理論
 第1章 理論入門
  1.1 引言
  1.2 推薦系統的形式化定義
  1.3 基於近鄰的協同過濾推薦算法
   1.3.1 餘弦相似度
   1.3.2 修正餘弦相似度
   1.3.3 Pearson相似度
   1.3.4 Jaccard相似度
  1.4 基於使用者興趣的推薦算法
  1.5 基於模型的協同過濾推薦算法
   1.5.1 矩陣分解模型
   1.5.2 交替最小二乘
   1.5.3 機率矩陣分解
   1.5.4 非負矩陣分解
  1.6 基於信任的協同過濾推薦算法
  1.7 推薦系統現存問題
   1.7.1 冷啟動
   1.7.2 數據稀疏性
   1.7.3 可擴展性
   1.7.4 使用者興趣漂移
  1.8 評測指標
 本章小結
第二篇 基於時序的協同過濾推薦算法
 第2章 基於巴式係數改進相似度的協同過濾推薦算法
  2.1 引言
  2.2 相關工作
   2.2.1 餘弦相似度
   2.2.2 調整餘弦相似度
   2.2.3 Pearson相關係數
   2.2.4 Jaccard相似度
  2.3 一種巴氏係數改進相似度的協同過濾推薦算法
   2.3.1 巴氏係數
   2.3.2 巴氏係數相似度
   2.3.3 BCCF算法描述
  2.4 實驗與分析
   2.4.1 數據集
   2.4.2 評價標準
   2.4.3 實驗結果與分析
    1. 在Movielens_100K數據集上傳統相似度比較
    2. 在Movielens_100K數據集上不同算法之間對比
    3. 在Movielens_1M數據集上不同算法之間對比
  本章小結
 第3章 基於使用者興趣和項目屬性的協同過濾推薦算法
  3.1 引言
  3.2 相關工作
  3.3 基於使用者興趣和項目屬性的協同過濾推薦算法
   3.3.1 基於時間的使用者興趣度權重
   3.3.2 改進相似度計算
   3.3.3 加權預測評分
   3.3.4 算法步驟
  3.4 實驗結果與分析
   3.4.1 數據集
   3.4.2 評價標準
   3.4.3 結果分析
    1. 相似度比較
    2. 平衡因子γ對MAE的影響
    3. 不同算法之間對比
  本章小結
第三篇 基於矩陣分解的協同過濾推薦算法
 第4章 SVD和信任因子相結合的協同過濾推薦算法
  4.1 引言
  4.2 標注和相關工作
   4.2.1 標注
   4.2.2 奇異值分解
   4.2.3 計算相似度
  4.3 SVD和信任因子相結合的協同過濾推薦算法
   4.3.1 項目特徵空間
   4.3.2 兩階段k近鄰選擇
   4.3.3 信任因子
   4.3.4 預測評分
   4.3.5 算法
  4.4 實驗結果與分析
   4.4.1 數據集和實驗環境
   4.4.2 評價標準
   4.4.3 實驗結果分析
    1. 相似度的分布與選取
    2. 全局信任因子的分布與分析
    3. 信任的分布與分析
    4. 實驗結果及分析
  本章小結
 第5章 相似度填充的機率矩陣分解的協同過濾推薦算法
  5.1 引言
  5.2 相關工作
   5.2.1 協同過濾推薦算法
    1. 計算使用者似度
    2. 確定鄰居集合
    3. 預測評分
   5.2.2 機率矩陣分解技術
  5.3 CF-PFCF算法
   5.3.1 算法設計思想
    1. 部分填充及相似度計算
    2. 使用者信任因子
   5.3.2 CF-PFCF算法的描述
  5.4 實驗分析
   5.4.1 數據集與誤差標準
   5.4.2 實驗結果與性能比較
  本章小結
 第6章 基於偏置資訊的改進機率矩陣分解算法研究
  6.1 引言
  6.2 相關工作
   6.2.1 矩陣分解模型
    1. 奇異值分解
    2. 機率矩陣分解模型
   6.2.2 Baseline預測
  6.3 算法流程
  6.4 實驗分析
   6.4.1 實驗所用數據集
   6.4.2 實驗環境配置
   6.4.3 實驗評價標準
   6.4.4 實驗結果及分析
  本章小結
 第7章 基於項目屬性改進機率矩陣分解算法
  7.1 引言
  7.2 IAR-BP算法
   7.2.1 相似度度量
   7.2.2 算法描述
   7.2.3 算法複雜度分析
  7.3 實驗結果對比分析
   7.3.1 實驗數據集
   7.3.2 實驗評價標準
   7.3.3 對比實驗配置及說明
    1. Baseline預測
    2. SVD
    3. PMF
    4. ALS算法
   7.3.4 實驗參數分析
    1. λ對RMSE的影響
    2. β的影響
   7.3.5 實驗對比
  本章小結
 第8章 基於交替最小二乘的改進機率矩陣分解算法
  8.1 引言
  8.2 交替最小二乘
  8.3 Baseline預測
  8.4 IPMF算法
   8.4.1 算法改進思想
   8.4.2 算法流程
   8.4.3 複雜度分析
  8.5 實驗結果分析
   8.5.1 對比實驗設定
    1. Baseline預測
    2. ALS算法、PMF算法和Truncated-SVD算法
   8.5.2 實驗分析
    1. BaseLine預測
    2. ALS算法
    3. ALS-PMF對比
    4. 正則化參數
    5. 實驗對比
  本章小結
 第9章 基於社群網路的改進機率矩陣分解算法研究
  9.1 引言
  9.2 相關工作
   9.2.1 推薦系統的形式化
   9.2.2 矩陣分解與推薦系統
  9.3 機率矩陣分解
  9.4 主要研究內容
   9.4.1 基於社群網路的改進機率矩陣分解
    1. 使用者項目偏置資訊
    2. 社群網路正則化
    3. RBPT算法
   9.4.2 算法流程
   9.4.3 算法複雜度分析
  9.5 實驗分析
   9.5.1 實驗數據集
   9.5.2 實驗評價標準
   9.5.3 對比算法
   9.5.4 潛在因子維度的影響
   9.5.5 偏置的影響
   9.5.6 信任因子的影響
    1. PMF與SocialReg算法對比
    2. BiasPMF算法與RBPT算法對比
   9.5.7 對比實驗分析
  本章小結
 第10章 帶偏置的非負矩陣分解推薦算法
  10.1 引言
  10.2 相關工作
   10.2.1 矩陣分解
   10.2.2 奇異值矩陣
   10.2.3 Baseline預測
   10.2.4 NMF算法
  10.3 RBNMF算法
   10.3.1 理論分析
   10.3.2 RBNMF算法流程
  10.4 實驗分析
   10.4.1 數據集
   10.4.2 評價標準
   10.4.3 實驗結果及分析
  本章小結
 第11章 基於項目熱度的協同過濾推薦算法
  11.1 引言
  11.2 非負矩陣分解
  11.3 兩階段近鄰選擇
   11.3.1 兩階段k近鄰選擇
   11.3.2 項目「熱度」和局部信任
   11.3.3 預測評分
  11.4 算法描述
  11.5 實驗結果分析
   11.5.1 不同策略下相似度的分布
   11.5.2 兩種因素的分布與分析
   11.5.3 實驗結果及分析
  本章小結
第四篇 基於信任的協同過濾推薦算法
 第12章 帶偏置的專家信任推薦算法
  12.1 引言
  12.2 相關工作
   12.2.1 專家算法
   12.2.2 生成推薦值
   12.2.3 Baseline預測
  12.3 改進專家算法
   12.3.1 改進專家信任
   12.3.2 評分形成
   12.3.3 算法描述
  12.4 實驗結果與分析
   12.4.1 數據集
   12.4.2 評估標準
   12.4.3 實驗結果及分析
    1. Baseline預測
    2. 使用者可信度指標分布與分析
    3. 稀疏使用者分布
    4. 專家可信度分布與分析
    5. 在不同數據集上稀疏使用者預測對比
  本章小結
 第13章 一種改進專家信任的協同過濾推薦算法
  13.1 引言
  13.2 標注與相關工作
   13.2.1 標注
   13.2.2 近鄰模型
    1. 餘弦相似度
    2. 改進餘弦相似度
   13.2.3 專家算法
    1. 尋找專家
    2. 生成推薦值
  13.3 改進專家算法
   13.3.1 重要概念
   13.3.2 評分形成
   13.3.3 算法描述
  13.4 實驗結果與分析
   13.4.1 數據集
   13.4.2 評估標準
   13.4.3 實驗結果與分析
    1. 相似度實驗對比
    2. 使用者可信度指標分布與分析
    3. 專家可信度分布與分析
    4. 專家近鄰融合
    5. 專家信任算法對比
  本章小結
第五篇 原型系統開發
 第14章 電影推薦原型系統
  14.1 引言
  14.2 主要功能
  14.3 關鍵技術
   14.3.1 機率矩陣分解模型
   14.3.2 社群網路正則化
  14.4 集群搭建
   14.4.1 集群軟硬體環境
   14.4.2 Spark集群
   14.4.3 HBase集群
  14.5 系統特點
  14.6 使用者使用說明
   14.6.1 系統簡介界面
   14.6.2 建模一和建模二界面
   14.6.3 集群界面
   14.6.4 看過的電影界面
   14.6.5 推薦電影界面
   14.6.6 統計分析界面

 

  個性化推薦與資訊檢索技術的目標一致,也是一種幫助使用者更快速地發現有用資訊的工具,但與資訊檢索技術不同的是,個性化推薦能夠根據使用者的歷史行為顯式或者隱式地挖掘使用者潛在的興趣和需求,為其推送感興趣並且個性化的資訊,已越來越受到研究者的追捧及工業界的青睞,其研究具有重大的學術價值及商業應用價值。如今基於個性化推薦算法的推薦系統已廣泛應用於大型電子商務平臺(如天貓、京東和亞馬遜等)、社群平臺(如Facebook和Twitter等)、新聞客戶端(今日頭條、天天快報等)以及其他各類旅遊和娛樂類網站(如電影音樂社區等)中,在提高使用者滿意度和忠誠度的同時也為自身帶來了可觀的經濟效益。
  協同過濾推薦算法是個性化推薦中運用最早和最成功的一種推薦技術,它的任務是利用使用者與項目評分矩陣中的已知元素來預測未知元素的評分值並將預測評分高的項目推薦給使用者。協同過濾的最大優點是對推薦對象沒有特殊的要求,能處理非結構化的複雜對象(如音樂、圖書、電影和資訊類新聞內容等,這類產品是難以進行機器自動內容分析的資訊),避免了內容分析的不完全和不精確,而且能夠根據使用者的歷史行為推薦個性化的資訊。傳統的基於鄰域模型的推薦算法分為數據收集(輸入)、獲得最近鄰集合(主要是計算相似度)和預測並推薦(輸出)等步驟。目前協同過濾推薦算法還存在數據的高維稀疏性、冷啟動和大數據環境下擴展性等制約其進一步發展的瓶頸問題,如何解決以上問題進而提高推薦系統的推薦品質成為個性化推薦的關鍵,近年來基於協同過濾的推薦算法及其相關改進模型得到了學者們的廣泛關注和研究。
  本書作者一直從事推薦系統理論及其應用的研究工作,提出了一系列改進推薦品質的方法,並成功應用於多種複雜的實際問題。作者的這些工作大大豐富了推薦系統理論,尤其是所關注的協同過濾推薦算法對其在其他領域的進一步研究與應用奠定了技術基礎,具有重要的理論意義和實際應用價值。
  本書由王建芳獨立完成,是作者在本領域所發表學術論文的基礎上進一步加工、深化而成的,是對已有研究成果的全面總結。全書共分5篇14章。第一篇包括第1章,討論了推薦算法的分類、各類算法的基本思想和改進策略,闡述推薦算法存在的問題、實驗方法和評測指標。第二篇包括第2章和第3章,主題是圍繞基於時序的協同過濾推薦算法展開研究。在推薦系統中隨著時間的推移,使用者的關注點在不斷變化,如何捕獲這一動態的時間效應是個難題。本篇針對基於時序的協同過濾推薦算法展開研究。第三篇包括第4~11章,主題是圍繞基於矩陣分解的協同過濾推薦算法展開研究。矩陣分解模型能夠基於使用者的行為對使用者和項目進行自動分析,也就是把使用者和項目劃分到不同主題,這些主題可以理解為使用者的興趣和項目屬性。本篇針對SVD、機率矩陣分解、非負矩陣分解及其與相關算法的整合分別提出相關的理論。第四篇包括第12章和第13章,主題是圍繞協同過濾推薦算法與社群網路的信任展開研究,將使用者的評分資訊和使用者的社群網路資訊融入傳統的矩陣分解中以提高推薦品質。第五篇包括第14章,從實際應用的角度用Spark實現一個基於矩陣分解的推薦原型系統。
  在本書的撰寫過程中,已畢業的碩士研究生張朋飛、李驍、武文琪以及在讀研究生谷振鵬、劉冉東、苗豔玲等對書稿內容和相關實驗提供了大量的幫助,在此向他們表示衷心的感謝。
  推薦系統所涉及的算法,尤其是協同過濾推薦算法是一個快速發展、多學科交叉的新穎研究方法,其理論及應用均有大量的問題尚待進一步深入研究。由於作者知識水準和資料獲取方面的限制,書中不妥之處在所難免,敬請同行專家和讀者批評指正。

 

詳細資料

  • EISBN:9789865486785
  • 規格:普通級
  • 出版地:台灣
  • 檔案格式:EPUB流動版型
  • 建議閱讀裝置:手機、平板
  • TTS語音朗讀功能:無
  • 檔案大小:16.4MB

最近瀏覽

 

相關活動

  • 【自然科普、電腦資訊】童話裡的心理學【博客來電子書獨家-作者電子贈言簽名扉頁版】
 

購物說明

使用電子書服務即為同意『博客來數位內容服務條款』請詳見客服中心說明。

自備暢通的網際網路連線及符合博客來支援的行動裝置、電腦作為閱讀工具,支援版本如下:

瀏覽器閱讀:無需安裝,即可閱讀。支援Safari (14以上版本)、Chrome (103以上版本) 、Edge瀏覽器 (106以上版本)。

APP閱讀:支援IOS13及Android 7以上系統。

電子書、 電子雜誌因版本屬性因素,恕無法比照紙本書籍提供MP3、DVD實體光碟,亦無提供相關影音檔案下載,請先確認無此需求再行下單購買。

請注意:

博客來電子書服務所使用之軟體程式及其支援行動裝置之可用版本隨時會更新調整,請隨時留意且主動查詢調整之內容。並請定時更新您的行動裝置作業系統版本,以確保本服務運作正常。若因個人裝置因素(如:其他應用程式衝突、裝置記憶體不足、行動裝置支援版本無法升級),無法使用博客來電子書閱讀服務或影響服務效能,需自行進行排除待符合博客來支援項目再行閱讀。

退換貨說明:

電子書購買前請務必先行試閱,不提供10天的猶豫期。

下列商品購買後博客來不提供10天的猶豫期,請務必詳閱商品說明並再次確認確有購買該項商品之需求及意願時始下單購買,有任何疑問並請先聯繫博客來客服詢問:

1.易於腐敗、保存期限較短或解約時即將逾期。
2.客製化之商品。
3.報紙、期刊或雜誌。
4.經消費者拆封之影音商品或電腦軟體。
5.下載版軟體、資訊及電子書、有聲書及影音.課程
6.涉及個人衛生,並經消費者拆封之商品,如:內衣褲、刮鬍刀…等。
7.藝文展覽票券、藝文表演票券。

  • 小說任意門
  • 我、腦子和粉紅色的諮商師
  • 公孫策說歷史故事套書