生成式人工智慧課導論學習筆記 - 1

2024-09-05

筆記關於生成式人工智慧課導論的學習筆記，整理自李宏毅老師的課程，系列文章第一篇。

課程說明

本課程的目標是讓學生理解生成式AI的全貌，而不是僅僅學會使用某一個工具如ChatGPT。課程會深入探討生成式AI的技術原理，讓學生了解這些技術是如何誕生、發展及應用。同時，課程不需要任何人工智慧的預備知識，適合初學者作為入門學習。

生成式AI的技術日新月異，因此單靠某一時期的技術學習可能很快過時。李宏毅老師強調，課程會教授的內容是希望能讓學生在未來數年甚至一生中受用。李老師提到「了解AI技術的背後原理，能讓人對技術有更清晰的理解，避免過度依賴或誤解其能力。」

生成式AI是什麼

什麼是人工智慧 (AI) & 什麼是生成式人工智慧

人工智慧代表機器所展現的智慧，但「智慧」的定義因人而異。它是一個模糊的目標，並無單一技術可稱為人工智慧。
生成式人工智慧要求機器創造出複雜且有結構的物件，從無數可能性中找出合適的結果，像是寫文章、生成影像等。

分類與生成式AI的區別

分類問題屬於從有限選項中做選擇，而生成式人工智慧解決的問題則是從無數選項中生成新物件。

機器學習 (Machine Learning)

「機器學習的學習指的是找出大量參數的過程」: 機器學習讓機器從資料中找出函式，透過學習過程自動計算大量參數，達成自動化的推論與解答。

深度學習 (Deep Learning) 與類神經網路

深度學習是機器學習的一種，使用類神經網路來解決複雜問題，並幫助生成式人工智慧達成目標。

今日的生成式人工智慧厲害在哪裡？從「工具」變為「工具人」

生成式人工智慧並非全新技術，Google 翻譯是其早期應用之一，然而，近年來技術進步使其能力顯著提升。

「今日的生成式人工智慧不像過去僅具備單一功能。」而是一種可以依據指令進行多種操作的系統，功能比過去的 Google 翻譯更靈活。

「除了 ChatGPT，還有許多生成式人工智慧在發展。」雖然 ChatGPT 是最知名且具代表性的生成式人工智慧，但像 Google Gemini、Microsoft Copilot 等也具備多元功能，展示出生成式人工智慧的廣泛應用。

ChatGPT 具備強大的應用潛力，從技術解答到生活建議，提供多種服務，展示了生成式人工智慧的廣泛實用性。

訓練不了人工智慧？你可以訓練你自己

(上) 神奇咒語與提供更多資訊

本節課強調如何藉由提升使用者自身的能力來強化AI應用，而這個能力就是如何提出更好的問題，以引導AI模型給出更準確的答案。

增強語言模型的方法「讓模型解釋自己的答案能提升其批改文章的正確性。」，模型解釋其判斷過程後，與人類的評估結果更為接近。
「透過情緒勒索模型，表現會顯著提升。」，研究顯示對模型施加情緒壓力（如強調任務重要性），可增加其任務正確率。
「某些咒語能激發模型超越一般的能力，如 'Take a deep breath'。」，科學驗證各種都市傳說，並透過增強式學習發現更強大的咒語來操控模型。

(中) 拆解問題與使用工具

拆解任務，將複雜任務拆解為簡單步驟可以提升模型解決問題的能力，例如將生成長篇報告拆解成列大綱和逐步撰寫。

Chain of Thought 是將複雜問題分步處理，增加解答的精確性，對模型來說，先列出解題過程再得出答案，提升解決數學問題的正確率。

藉由「'Let's think step by step' 可大幅提升模型的解題正確率。」

語言模型的自我檢查

具體來說，自我檢查是語言模型生成答案後，對已輸出的結果進行反思和分析，尋找可能的錯誤並進行修正。例如，模型可能最初給出了一個錯誤的答案，但在自我檢查過程中，可以發現這個錯誤並加以改正。

自我反省與 Constitutional AI

模型可通過自我反省來改善回應，如不直接提供不道德的建議。

(下) 讓語言彼此合作，把一個人活成一個團隊

透過不同模型的合作可以達到「1+1大於2」的效果。

語言模型如 GPT-4 可以透過彼此合作提升效能，例如簡單任務可由較便宜的模型處理，進而減少成本。

多個語言模型討論次數越多，得到正確答案的機率越高。

語言模型之間可進行反覆討論，通過不斷挑戰對方的答案來提升整體正確率，進而達成共識。

語言模型的討論方式尚未有最佳方案，不同任務適合不同的方式。

模型討論的方式有很多種，從簡單的答案交換到更複雜的層次交流，效果取決於任務的性質。

裁判模型能精確判斷模型輸出是否一致，並宣佈達成共識或繼續討論。

裁判模型負責判斷不同模型的討論是否達成共識，並在必要時推動進一步的討論。