AI 詞典?進階篇|讀懂這30個概念,你也是AI圈內人
上篇文章(AI詞典|30條AI術語,全網最易懂版!)梳理了 AI 基礎術語,本文將聚焦30個易混概念,涵蓋多智能體系統、具身智能等前沿應用,以及模型幻覺、過擬合等開發實踐問題,幫助大家理解概念本質,解決 “聽得懂但說不清” 的痛點。
1. 通用人工智能(AGI)
Artificial General Intelligence
定義:具備人類水平的綜合認知能力,能在各類任務中自主學習和推理的人工智能,與僅擅長單一領域的 “弱人工智能”(Narrow AI)相對。
舉例:科幻作品中的鋼鐵俠,可理解復雜指令、自主決策并處理多領域任務(目前仍屬理論階段)。
2. 具身智能
Embodied Intelligence
定義:擁有物理實體并通過 “感知 - 決策 - 行動” 與真實環境互動的智能體。
舉例:波士頓動力機器人 Spot 通過攝像頭感知環境、機械腿執行動作(如爬樓梯、開門),而 ChatGPT 僅為純軟件(無實體)。
3. 世界模型
World Model
定義:AI 通過模擬現實構建的虛擬環境,用于 “無真實數據時生成訓練數據”。
舉例:自動駕駛公司利用世界模型模擬暴雨、擁堵等極端場景,讓汽車 AI 在虛擬環境中練習,避免真實道路測試風險。
4. 多智能體系統
Multi-agent System
定義:多個獨立智能體協作完成復雜任務的系統,類似 “AI 團隊分工合作”。
舉例:智能交通系統中,路口傳感器(感知智能體)收集車流量→控制中心(決策智能體)計算信號燈時長→信號桿(執行智能體)自動調整,全程無需人工干預。
5.人工智能偏見
Al Bias
定義:人工智能系統在決策過程中因數據、算法設計或訓練方式等因素導致的系統性錯誤或歧視現象。
舉例:招聘算法若基于歷史性別歧視數據訓練,可能優先推薦男性候選人;在AI生成的圖片中,白人常被描繪為高位、財富滿溢的模樣,而其他有色人種則常被描繪為低薪勞工或被貼上“罪犯”的標簽。
6. 模型泛化
Generalization
定義:模型對未見過的新數據的適應能力,即 “從訓練數據中學習規律并推廣到真實場景” 的能力。
舉例:用 1-9 的手寫體訓練模型,若能準確識別從未見過的不同人書寫的 “3”(新數據風格),說明泛化能力強;若僅能識別訓練集中特定筆跡的 “3”,則泛化能力弱。
7. 大模型幻覺
Hallucination of LLM
定義:模型生成 “看似合理但事實錯誤” 的內容,類似 “AI 版不懂裝懂”。
舉例:詢問“企鵝會飛嗎”,可能得到“是的,它們進化出短距離飛行能力以躲避北極熊的捕食。”不懂的人,看回答覺得十分合理,實際與現實不符。
8. 過擬合
Overfitting
定義:過擬合是指模型過于復雜,不僅學習了數據中的基本規律,還學習了訓練數據中的噪聲和隨機波動。與之對應的欠擬合則是指模型過于簡單,無法捕捉數據中的基本規律。
舉例:在訓練模型識別 “貓” 的圖片時,若訓練數據中所有貓的圖片均帶有 “藍色地毯” 背景(巧合),過擬合是指模型錯誤地將 “藍色地毯” 也視為貓的核心特征,生成 “有藍色地毯才是貓” 的規則,導致遇到 “木地板上的貓” 時無法正確識別。
9. 思維樹(ToT)
Tree of Thoughts
定義:將復雜問題拆解為樹狀分支,通過 “拓展子問題→評估分支→選擇路徑” 的決策框架。
舉例:AI 規劃旅行路線時,先拆分為 “目的地選擇→交通方式→住宿預訂” 主分支,再細分 “景點偏好→預算限制” 等子分支,最終生成最優方案。
10. 模型上下文協議(MCP)
Model Context Protocol
定義:開放協議,通過提供一個統一的接口,使得AI模型能夠與各種工具和服務進行有效的交互,從而簡化AI應用的開發和維護過程。
舉例:沒有MCP時,智能體等應用的開發就像“手工作坊”:每個工具需單獨寫接口(如天氣 API、數據庫函數);有了MCP后,智能應用的開發就像“工業流水線”,工具即插即用,開發者只需調用標準化模塊。
11. 推理與行動框架
ReAct,Reasoning and Action
定義:結合 “推理→行動→反饋→再推理” 的閉環架構,使 AI 動態調整策略。
舉例:智能客服處理退款時,先推理用戶是否符合條件(查訂單時間、商品狀態),符合則調用退款接口(行動),不符合則詢問補充信息(根據反饋調整)。
12. 生成對抗網絡
Generative Adversarial Network
定義:是一種由生成器和判別器兩個相互對抗的神經網絡組成的模型。判別器評價是否通過,不通過時生成器重新生成直至判別通過。旨在通過對抗訓練生成逼真的數據。
舉例:美顏相機智能生成合照功能:生成器將用戶的臉P到明星合影中,判別器檢查膚色過渡是否自然、發絲細節等,最終生成毫無違和感的 “合照”。
13. 視覺識別
Visual Recognition
定義:通過計算機視覺和機器學習算法,使計算機能夠識別和分類圖像或視頻中的對象、場景和動作。
舉例:北京地鐵通過視覺統計系統,通過人頭密度分析動態調整扶梯方向,降低早高峰擁堵。
14. 目標檢測
Object Detection
定義:計算機視覺任務之一,旨在識別圖像或視頻中的特定物體,并定位其在畫面中的位置(通常用邊界框標注)。
舉例:安防系統通過目標檢測識別監控畫面中的可疑人物;自動駕駛汽車實時檢測道路上的行人、車輛和交通標志。
15.高性能計算(HPC)
High Performance Computing
定義:通過超級計算機或計算集群,高效處理大規模、高復雜度計算任務的技術,顯著提升數據處理速度。
舉例:預測全球變暖趨勢需處理海量氣象數據,HPC 可縮短模擬時間;《流浪地球》使用 HPC 集群渲染行星發動機特效,較普通電腦節省 90% 以上時間。
16. 縮放定律
Scaling Law
定義:模型性能隨參數規模和數據量增長呈規律性提升的現象。
舉例:GPT-3 憑借 1750 億參數生成流暢文本,GPT-4 參數更多,支持圖文理解、代碼生成等多模態任務。
17. 注意力機制
Attention Mechanism
定義:讓模型在處理信息時 “選擇性聚焦關鍵內容”,而非平均分配資源。
舉例:翻譯 “我喜歡蘋果和香蕉,但討厭榴蓮” 時,模型重點關注 “蘋果”“香蕉”“榴蓮”(實體詞),弱化 “和”“但”(虛詞)。
18. 卷積神經網絡(CNN)
Convolutional Neural Network
定義:包含卷積計算的神經網絡,通過卷積層提取圖像中的邊緣、紋理等特征。
舉例:人臉識別系統中,CNN先檢測圖像中的邊緣→組合成眼睛、鼻子等局部特征→最終識別出完整人臉身份。
19. 循環神經網絡(RNN)
Recurrent Neural Network
定義:處理序列數據(如文本、語音)的神經網絡,能捕捉時序依賴關系。
舉例:預測用戶輸入的下一個詞:在 “我今天要去___” 中,RNN 根據 “今天”“去” 推斷可能為 “上班”“逛街”。
20. 超參數
Hyperparameter
定義:超參數是在機器學習中設置的關鍵參數,這些參數不是通過訓練數據學習得到的,而是在模型訓練之前設定的。它們直接影響模型的學習過程和性能。
舉例:想象你要烤一塊蛋糕,蛋糕的配方就像機器學習模型的算法,而配方里的各種原料和它們的比例(不同的面粉、糖的量、烤箱的溫度等)就像模型的超參數。
21. 語料庫
Corpus
定義:用于人工智能模型訓練的大規模文本或語音數據集,作為知識、示例或模式的存儲庫,包含結構化或非結構化數據。
舉例:谷歌的 Common Crawl 包含數十億網頁文本,用于訓練自然語言處理模型;語音識別系統的訓練語料庫包含不同口音的語音片段。
22. 知識蒸餾
Knowledge Distillation
定義:將大模型的 “知識” 遷移至小模型,壓縮體積同時保留能力。
舉例:將 GPT-3 的知識蒸餾到手機端小模型,使其能回答簡單問題,且耗電少、響應快。
23. 低秩適應
LoRA
定義:LoRA是一種通過低秩分解來微調大模型的技術。它的核心思想是在不改變原始模型權重的情況下,僅通過引入少量可訓練參數,就能讓模型適配新的任務。
舉例:通過 LoRA 技術,使用消費級顯卡(例如 RTX 4090)就能對中文對話模型進行微調,而傳統微調方法則需要依賴專業服務器。
24. 零樣本學習
Zero-shot Learning
定義:模型未訓練某類數據卻能完成任務,依賴通用特征學習。
舉例:模型在訓練時只見過貓、狗、馬的圖片,但能通過文字描述(如有長鼻子的大型動物)正確識別測試集中的大象。
25. 小樣本學習
Few-shot Learning
定義:模型僅通過極少量標注樣本就能快速學習新任務或新類別的機器學習方法。
舉例:給模型看3張熊貓照片,即可識別其他熊貓圖片,傳統模型需數萬張訓練圖。
26. 深度學習
Deep Learning
定義:一類受生物神經網絡啟發的機器學習技術,通過多層人工神經網絡自動提取數據特征,適用于處理復雜非線性問題。
舉例:AlphaGo 通過深度學習擊敗人類圍棋冠軍;圖像識別模型 ResNet 用于醫學影像分析,檢測腫瘤特征。
27. 梯度下降
Gradient Descent
定義:一種通過迭代優化模型參數以最小化損失函數的優化算法,廣泛應用于機器學習和深度學習領域。
舉例:在機器人控制中,機械臂需在復雜環境中規劃從起點到終點的路徑,同時避開障礙物。梯度下降可用于優化機械臂關節角度,使末端執行器沿 “能量最小化” 或 “距離最短” 路徑移動。
28. 函數調用
Function Calling
定義:大模型通過 API 調用外部工具的能力,解決 “需實時數據或操作” 的問題。
舉例:用戶詢問 “北京到上海明天的高鐵余票”,模型調用 12306 接口獲取數據后再回復。
29. 深度偽造
Deepfake
定義:用 AI 技術替換視頻中的人臉或聲音,達到以假亂真的效果。
舉例:將電影片段中的演員面部替換為其他人,或模擬明星聲音制作語音內容。
30. 降維
Dimensionality Reduction
定義:通過算法減少數據特征數量,保留關鍵信息的同時降低復雜度,解決 “維度災難”(特征過多導致模型性能下降)。
舉例:人臉數據集中,每張人臉圖片(如100×100像素=10000維)通過PCA降維到50維,仍能保留90%以上的關鍵特征,使后續識別任務更高效。