前言
ChatGPT和GPT-4這兩個知名大型語言模型的發佈,讓大型語言模型迅速成為爆點,重新點燃了人們對通用人工智慧的熱情。很多國家和地區都開始致力於大型語言模型的研發、應用和推廣。我們認為,以巨量資料和人工智慧為核心技術驅動的新的科技革命即將到來,數位賦能一切的新的數字經濟範式也即將到來。面對數位經濟的時代大背景,無論從業者來自哪個行業(網際網路行業、通訊行業、金融行業、傳統製造行業或服務行業等)、從事哪種職業(研發人員、工程師、設計師、編輯等),都會受到數位經濟的影響。
大型語言模型研發更像一場遍佈全球的科技「軍備競賽」,模型的效果如果「差之毫釐」,面臨的結局可能就是「失之千里」。從技術發展的角度來看,我們認為,單模態大型語言模型只是過渡型技術,多模態大型語言模型將成為通用人工智慧賦能各行各業的重要技術底座。當前詳細介紹多模態大型語言模型的發展歷史、技術要點和應用方面的書籍少之又少,很多從業者即使想深入學習,也難以找到系統化的教材。所以,我們撰寫了本書。
大型語言模型的核心特徵是「大量資料、大算力和大參數量」,這幾個「大」字無疑極大地提高了人工智慧大型語言模型的研發、訓練、部署和應用門檻。中小公司有點玩不起人工智慧大型語言模型了,這是中小公司面臨的難題。基於此,本書詳細介紹了中小公司的大型語言模型建構之路,闡述了如何透過微調、量化壓縮等技術建構垂直領域的輕量級大型語言模型。
另外,為了更進一步地讓來自不同領域的讀者熟悉多模態大型語言模型的價值,我們還詳細闡述了多模態大型語言模型在六大領域(分別是金融領域、出行與物流領域、電子商務領域、工業設計與生產領域、醫療健康領域和教育培訓領域)的應用,幫助讀者更進一步地理解多模態大型語言模型的應用場景和可能產生的商業價值。
我們希望讀者能夠透過對本書的學習,更好、更快地拿起多模態大型語言模型這個「強大武器」,高效率地促進所在產業的數智化轉型和變革。同時,我們也希望透過本書的創作可以與研究和應用多模態大型語言模型的專業人士深入、廣泛地交流和合作。
4位堅信「人工智慧改變世界」的夥伴(彭勇、彭旋、鄭志軍和茹炳晟)共同完成了本書的撰寫。彭勇是巨量資料應用和大型語言模型專家,彭旋和鄭志軍是大型語言模型演算法專家,茹炳晟是騰訊的技術專家。我們還要感謝在本書創作過程中給予我們支持的領導、家人、同事和朋友,同時感謝電子工業出版社博文視點公司的石悅老師。他們的信任、鼓勵和支持,是我們持續創作和不斷前進的動力。
彭 勇