生成式人工智慧課導論學習筆記 - 1

2024-09-05

筆記關於生成式人工智慧課導論的學習筆記,整理自李宏毅老師的課程,系列文章第一篇。

logo

課程說明

本課程的目標是讓學生理解生成式AI的全貌,而不是僅僅學會使用某一個工具如ChatGPT。課程會深入探討生成式AI的技術原理,讓學生了解這些技術是如何誕生、發展及應用。同時,課程不需要任何人工智慧的預備知識,適合初學者作為入門學習。

生成式AI的技術日新月異,因此單靠某一時期的技術學習可能很快過時。李宏毅老師強調,課程會教授的內容是希望能讓學生在未來數年甚至一生中受用。李老師提到「了解AI技術的背後原理,能讓人對技術有更清晰的理解,避免過度依賴或誤解其能力。」

生成式AI是什麼

什麼是人工智慧 (AI) & 什麼是生成式人工智慧

  • 人工智慧代表機器所展現的智慧,但「智慧」的定義因人而異。它是一個模糊的目標,並無單一技術可稱為人工智慧。
  • 生成式人工智慧要求機器創造出複雜且有結構的物件,從無數可能性中找出合適的結果,像是寫文章、生成影像等。

分類與生成式AI的區別

分類問題屬於從有限選項中做選擇,而生成式人工智慧解決的問題則是從無數選項中生成新物件。

機器學習 (Machine Learning)

「機器學習的學習指的是找出大量參數的過程」: 機器學習讓機器從資料中找出函式,透過學習過程自動計算大量參數,達成自動化的推論與解答。

深度學習 (Deep Learning) 與類神經網路

深度學習是機器學習的一種,使用類神經網路來解決複雜問題,並幫助生成式人工智慧達成目標。

今日的生成式人工智慧厲害在哪裡?從「工具」變為「工具人」

生成式人工智慧並非全新技術,Google 翻譯是其早期應用之一,然而,近年來技術進步使其能力顯著提升。

「今日的生成式人工智慧不像過去僅具備單一功能。」而是一種可以依據指令進行多種操作的系統,功能比過去的 Google 翻譯更靈活。

「除了 ChatGPT,還有許多生成式人工智慧在發展。」雖然 ChatGPT 是最知名且具代表性的生成式人工智慧,但像 Google Gemini、Microsoft Copilot 等也具備多元功能,展示出生成式人工智慧的廣泛應用。

ChatGPT 具備強大的應用潛力,從技術解答到生活建議,提供多種服務,展示了生成式人工智慧的廣泛實用性。

訓練不了人工智慧?你可以訓練你自己

(上) 神奇咒語與提供更多資訊

本節課強調如何藉由提升使用者自身的能力來強化AI應用,而這個能力就是如何提出更好的問題,以引導AI模型給出更準確的答案。

  • 增強語言模型的方法「讓模型解釋自己的答案能提升其批改文章的正確性。」,模型解釋其判斷過程後,與人類的評估結果更為接近。
  • 「透過情緒勒索模型,表現會顯著提升。」,研究顯示對模型施加情緒壓力(如強調任務重要性),可增加其任務正確率。
  • 「某些咒語能激發模型超越一般的能力,如 'Take a deep breath'。」,科學驗證各種都市傳說,並透過增強式學習發現更強大的咒語來操控模型。

(中) 拆解問題與使用工具

拆解任務,將複雜任務拆解為簡單步驟可以提升模型解決問題的能力,例如將生成長篇報告拆解成列大綱和逐步撰寫。

Chain of Thought 是將複雜問題分步處理,增加解答的精確性,對模型來說,先列出解題過程再得出答案,提升解決數學問題的正確率。

藉由「'Let's think step by step' 可大幅提升模型的解題正確率。」

語言模型的自我檢查

具體來說,自我檢查是語言模型生成答案後,對已輸出的結果進行反思和分析,尋找可能的錯誤並進行修正。例如,模型可能最初給出了一個錯誤的答案,但在自我檢查過程中,可以發現這個錯誤並加以改正。

自我反省與 Constitutional AI

模型可通過自我反省來改善回應,如不直接提供不道德的建議。

(下) 讓語言彼此合作,把一個人活成一個團隊

透過不同模型的合作可以達到「1+1大於2」的效果。

語言模型如 GPT-4 可以透過彼此合作提升效能,例如簡單任務可由較便宜的模型處理,進而減少成本。

多個語言模型討論次數越多,得到正確答案的機率越高。

語言模型之間可進行反覆討論,通過不斷挑戰對方的答案來提升整體正確率,進而達成共識。

語言模型的討論方式尚未有最佳方案,不同任務適合不同的方式。

模型討論的方式有很多種,從簡單的答案交換到更複雜的層次交流,效果取決於任務的性質。

裁判模型能精確判斷模型輸出是否一致,並宣佈達成共識或繼續討論。

裁判模型負責判斷不同模型的討論是否達成共識,並在必要時推動進一步的討論。