✴︎ 感知機架構,包括前饋網路與反向傳播演算法
✴︎ Sigmoid、ReLU啟動函數與Adam、RMSProp最佳化方法
✴︎ Transformer模型組成與自注意力機制運作原理
✴︎ BERT、GPT等預訓練模型與大型語言模型訓練方法
✴︎ 詞嵌入技術講解,結合Word2Vec、標記嵌入及位置編碼方法
✴︎ LoRA與PEFT微調技術,並涵蓋LLM.int8()量化技術
✴︎ Gradio工具應用介紹,支援互動式推理與多輪對話開發
✴︎ 量化技術分析,包括NF4、BitsAndBytes與QLoRA模型應用
✴︎ 模型評估方法,涵蓋困惑度、BLEU、ROUGE與HellaSwag指標
✴︎ 中文語料處理,涵蓋預訓練語料準備與AutoTokenizer應用
✴︎ 推理加速技術分析,包含DeepSpeed、FSDP與GPTQ高效實現
✴︎ 向量資料庫應用,講解PGVector安裝及詞向量檢索範例