新到貨2本75折
阿爾法零對最優模型預測自適應控制的啟示

阿爾法零對最優模型預測自適應控制的啟示

  • 定價:414
  • 優惠價:87360
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

德梅萃·P.博塞克斯(Dimitri P.Bertsekas)教授是國際運籌優化與控制領域的著名學者,其系列經典教材被清華大學、麻省理工學院等國內外高校廣泛使用。本書構建了近似動態規劃和強化學習的新的理論框架,簡潔但雄心勃勃。這一框架以離線訓練和在線學習這兩類算法為中心,彼此獨立又通過牛頓法有機融合。當今新一代人工智能技術發展絢麗多彩,在看似紛繁複雜的數據與算法表象之下,其實蘊藏着簡潔而美妙的規律。通過本書的學習,讀者將能體會經典優化控制理論在分析和理解當代強化學習算法性能中的強大威力,更能領悟到以阿爾法零為代表的新一代算法浪潮為經典理論提供的新的發展機遇。

本書適合作為普通高等學校信息科學技術領域研究生、本科生高年級教材,也可供本領域科研人員自學參考。



賈慶山,男,博士,清華大學自動化系副教授。分別于2002年、2006年獲得清華大學自動化系學士、博士學位,並留校任教。分別于2006年赴哈佛大學、2010年赴香港科技大學、2013年赴麻省理工學院任訪問學者。主要研究方向為離散事件動態系統的仿真與性能優化,及在智能建築與智能電網中的應用。

 

詳細資料

  • ISBN:9787302660361
  • 規格:平裝 / 161頁 / 普通級 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【自然科普、電腦資訊】投資新手也ok!躺贏人生,打造月月PAY財富,電子書6折起
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 科學75折起
  • 799現折79
  • 紅樓夢