自然語言在語法、語義和語用三個平面上的結構統稱為語言結構,通過計算得到語言結構是自然語言理解的核心任務。語言結構計算可以泛化為識別語言單元和建立語言單元之間的關係、為語言單元和關係賦予屬性的過程。本書利用網格結構分析語言單元和關係,通過鍵值方式對其屬性進行描述和計算,採用資料表解析不同類型的知識,借助有限狀態自動機剖析語言的具體應用場景。這種基於網格的自然語言結構分析框架(Grid based Parsing Framework,GPF)具有良好的包容性,通過可程式設計的腳本和資料交換標準介面,融合了深度學習的參數計算和基於符號的知識計算。GPF為自然語言處理研究和應用提供了新的研究思路和計算框架。
本書適合專業為自然語言處理、計算語言學以及與語言學本體研究有關的學生當作教材,也可以作為高等院校人工智慧、資訊科學研究、大資料分析等相關專業的參考書。同時,本書也適合對語料庫建設與應用感興趣的人員閱讀。