2024年史丹福大學AI指標報告透漏哪些訊息

2024年的這份報告在一開始的時候，就綜合整理出人工智慧發展的十大要點[1]。

1. 人工智慧在某些工作上擊敗了人類，但並非在所有工作上都擊敗了人類。人工智慧在多個基準上已經超越了人類的表現，包括圖像分類、視覺推理和英語理解方面。然而，它在競賽級數學、視覺常識推理和規劃等更複雜的任務上還是無法趕上人類。

2. 工業界繼續主導人工智慧尖端研究。 2023年，工業界產生了51個值得注意的機器學習模型，而學術界僅貢獻了15個。

3. 尖端模型變得更加昂貴。根據AI Index估計，最先進的AI模型的訓練成本已達到前所未有的水準。例如，OpenAI 的 GPT-4 估計使用了價值 7,800 萬美元的成本來進行訓練，而 Google 的 Gemini Ultra 的計算成本為 1.91 億美元。

4. 美國領先中國、歐盟和英國，成為頂級人工智慧的主要來源國楷模。 2023 年，61 個著名的人工智慧模型源自美國機構，遠超過歐盟的 21 個和中國的 15 個。

5. 人工智慧領域嚴重缺乏對LLM（Large Language Model, 大型語言模型）責任的穩健和標準化的評估。人工智慧指數的新研究發現，負責任的人工智慧報告嚴重缺乏標準化。包括 OpenAI、Google 和 Anthropic 在內的領先開發人員主要根據不同的 AI 標準測試他們的模型。這種做法使系統性地比較人工智慧的風險的努力變得複雜。

6. 生成式人工智慧投資激增。儘管去年人工智慧私人投資總額有所下降，但生成式人工智慧的資金卻大幅成長，比 2022 年成長了近八倍，達到 252 億美元。生成式人工智慧領域的主要參與者，包括OpenAI、Anthropic、Hugging Face 和 Inflection，均表示已進行了數次大量募資。

7. 數據顯示：人工智慧提高了工人的生產力並帶來更高品質的工作。 2023 年，多項研究評估了人工智慧對勞動力的影響，顯示人工智慧使工人能夠更快地完成任務並提高產出品質。這些研究也證明了人工智慧有潛力彌合低技能工人和高技能工人之間的技能差距。儘管如此，其他研究警告說，在沒有適當監督的情況下使用人工智慧可能會導致績效下降。

8. 得益於人工智慧，科學進步獲得進一步加速。 2022年，人工智慧開始推動科學發現。然而，2023 年，更重要的與科學相關的人工智慧應用出現了：從讓演算法排序更有效率的 AlphaDev[2]，到促進排序過程的 GNoME[3]。

9. 美國人工智慧法規數量急劇增加。美國人工智慧相關法規的數量在過去一年和過去五年中顯著增加。 2023年，人工智慧相關法規數量達到25個，而2016年僅有1個。

10. 全球各地的人們更加認識到人工智慧的潛在影響，也更加緊張。益普索（Ipsos）的一項調查顯示，去年，認為人工智慧將在未來三到五年內極大影響他們生活的人比例從 60% 上升到 66%。此外，52% 的人表示對人工智慧的產品和服務感到緊張，比2022 年上升 13 個百分點。在美國，皮尤研究中心的數據顯示，52% 的美國人表示對人工智慧的擔憂多於興奮，這一比例高於 2022 年的 37%。

該報告更以13個圖表[4]清楚呈現AI的各種發展趨勢[5]，包括：

開源模型數量超越閉源模型。開源模型的數量正在上升中，去年各組織釋出的 149 個基礎模型中，有 65.7% 為開源模型；回顧 2022 年所發布的模型中（比今年約少一倍多），僅 44.4% 為開源模型，2021 年則只佔 33.3%。

模型發布數最高的公司和國家：是Google和美國

企業端目前仍主導 AI 模型的建構和發布，去年新推出的基礎模型有 72% 來自業界，其中 Google 發布了最多款 AI 模型，包括 Gemini 等。事實上 Google 自 2019 年來一直高踞冠軍位置，共發布 40 個模型，其次則是 OpenAI，在四年多期間共推出20 個模型。

AI 訓練成本呈指數級升高

訓練 AI 模型的成本呈指數級增長，這也是學術界和政府會在 AI 競賽中輸給業界的一大原因。訓練 Google Gemini Ultra 的運算成本如前所述約為 1.91 億美元，而 OpenAI 的 GPT-4 的訓練成本則估計是 7,800 萬美元，反觀 2017 年最初 Transformer 模型[6]的成本約為 900 美元。

AI 在測試中的表現接近人類水準

截至 2023 年，AI 在許多基準測試中（包括閱讀理解、視覺推理等）皆達到人類的表現，不過 AI 還是在部分測試（例如競賽等級數學）上還無法達到人類能力。也因為 AI 正在突破現有的標準基準，AI 學者要因應製作出新測試和更困難的挑戰，包括程式碼編寫、高階推理和代理行為任務等基準。

AI 相關規範數量上升

越來越多的美國監管機構正透過規範來管理 AI 工具和資料的使用，涵蓋了 AI 生成之作品的版權註冊指南、網路安全風險管理策略等，去年度美國共有 25 份 AI 相關規範。

過半年輕族群認為 AI 會影響工作、日本焦慮感最低

在受訪的 31 個國家中，對 AI 感到最焦慮的國家是澳洲，受訪的澳洲人當中有 69% 對 AI 感到緊張，其次則是英國（有 65%），日本是擔憂程度最低的國家（23%）。

史丹福大學自2017年以來每年發表的這個人工智慧指標報告，追蹤 AI 在研發、技術、經濟、科學醫療、教育、政策規管和輿論等方面的趨勢，對於想要掌握AI趨勢的企業、政府機構、高教機構和媒體，提供重要參考。

[1] https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

[2] https://www.ithome.com.tw/news/157261

「DeepMind AI模型不下圍棋了，新AlphaDev模型可加速資料中心運算效率」

[3] https://zh.wikipedia.org/zh-tw/GNOME

GNOME是一個完全由自由軟體組成的桌面環境。它的目標作業系統是Linux，但是大部分的BSD系統亦支援GNOME。 GNOME是由志願貢獻者和受僱貢獻者組成的GNOME計劃開發，其最大的公司貢獻者為紅帽公司。它是一個為開發軟體框架、基於這些框架來開發使用者端軟體及協調軟體翻譯和開發無障礙軟體的專案。

[4] https://hai.stanford.edu/news/ai-index-state-ai-13-charts 中文介紹亦可參考

https://www.inside.com.tw/article/34760-stanford-2024-ai-index?fbclid=IwZXh0bgNhZW0CMTEAAR2-fQ-SdTvbqsfqrzKZV8HyuviPr5jBjTUvi4mrtznHw9cNRBO0bXucG-M_aem_AS2YM4QtsWD_Sg9LMnCieisJ8RAUSLX4GCvnutg8vacFW9IssT-5XeVM2j94N4y74qAmR88LgLkVO14UokGB93jU

[5] 建議有興趣的讀者點進去看，這些圖表真的做得非常簡要清楚。https://hai.stanford.edu/news/ai-index-state-ai-13-charts

[6] https://zh.wikipedia.org/zh-tw/Transformer%E6%A8%A1%E5%9E%8B

Transformer模型（直譯為「變換器」）是一種採用注意力機制的深度學習模型，這一機制可以按輸入資料各部分重要性的不同而分配不同的權重。該模型主要用於自然語言處理（NLP）與電腦視覺（CV）領域。

2024年史丹福大學AI指標報告透漏哪些訊息

追蹤我們

更多新聞

追蹤
我們