企業家貢獻者表達的意見是他們自己的。
人工智慧領域正在快速發展。 大公司不斷推出新的基礎模型。 然而,完全開放的人工智慧模型還沒有明確的定義。 許多模型聲稱是“開放的”,但只有一部分組件是開放發布的,其餘組件則使用限制性許可。 這創造了一系列部分開放性。 例如,
- 人們可能會發布模型的架構和權重,但不會發布訓練資料和程式碼。
- 人們可以根據禁止商業用途或限制衍生作品的許可證發布經過訓練的權重,
- 或者,人們可以在非限制性許可證中發布經過訓練的權重,但在限制性許可證中發布程式碼。
這種圍繞著什麼是真正「開放」的模糊性阻礙了人工智慧的採用、為最終用戶創造產品和服務的進展。 它給企業家帶來了法律風險,他們可能會無意中違反部分開放模式的條款。 我們需要一個清晰的框架來評估模型開放性的性質。 這樣的框架應該可以幫助人工智慧企業家、研究人員和工程師就使用哪些模型、建立衍生作品並做出貢獻做出明智的決定。
一個例子
讓我們考慮一個假設的人工智慧新創公司,名為「yet-another-chat-bot」。 他們正在開發人工智慧聊天機器人來改善客戶支援回應。 他們利用名為「llam-stral」的假設預訓練語言模型來加速發展。 「llam-stral」的作者在 arXiv 上發表了一篇描述其架構和性能的論文。 他們已提供訓練後的權重可供下載。
“yet-another-chat-bot”的工程師在他們的聊天機器人原型中使用“llam-stral”,但後來發現該許可證明確禁止商業使用和創作衍生作品。 此外,訓練資料和用於訓練的程式碼尚未發布。 他們現在面臨法律風險和潛在的智慧財產權侵權問題。
正確的做法是讓「llam-stral」遵守模型開放性框架,並使用標準開放許可證,例如 Apache 2.0 的程式碼和 CC-BY-4.0 的權重和資料集。 對於新創公司「又一個聊天機器人」來說,將其用於商業用途並在此基礎上進行構建是非常清楚的。
需要一個框架來定義模型的完整性和開放性,以實現人工智慧的有效再現性、透明度和可用性。 利用 GenAICommons 發布的模型開放性框架之類的東西,對於模型創建者和消費者了解關鍵工件(其中哪些是開放的、哪些不是)非常有用。 一個完全開放的模型將發布所有元件,包括訓練資料、程式碼、權重、架構、技術報告和評估程式碼,所有這些都在許可許可中。
相關:斯嘉麗約翰遜問為什麼 ChatGPT 聽起來像她
AI 模型的組成部分
透過在許可下發布與大型語言模型相關的所有工件和組件,創建者可以聲稱他們的模型是真正且完全開放的。 這促進了大型語言模型開發和應用的透明度、可重複性和協作
一些基本組件如下:
- 訓練資料: 用於訓練大型語言模型的資料集。
- 資料預處理代碼: 用於清理、轉換和準備訓練資料的程式碼。
- 模型架構: AI 模型的設計和結構,包括其層、連接和超參數。
- 型號參數: 經過訓練的人工智慧模型的學習權重和偏差。
- 培訓代碼: 用於訓練AI模型的程式碼,包括訓練循環、最佳化演算法和損失函數。
- 評價代碼: 用於評估經過訓練的 AI 模型在驗證和測試資料集上的性能的程式碼。
- 評價數據: 用於評估經過訓練的 AI 模型性能的資料集。
- 模型文件和技術報告: AI 模型的詳細文檔,包括其目的、架構、訓練過程和效能指標。 描述人工智慧模型、其方法、結果以及對該領域的貢獻的學術論文或技術報告。
開放和授權的工件越多,模型就越開放。
相關:OpenAI 和元模型很快將具有“推理”功能
真正的開放模式加速創新
獲得真正開放的人工智慧模式為人工智慧企業家提供了公平的競爭環境,並有助於釋放創新。 他們將利用最先進的模型和數據集,而不是從頭開始建立每個組件。 這將有助於他們更快地設計原型並驗證性能,從而加快上市時間。
人工智慧企業家現在可以專注於特定領域的挑戰並確定增加價值的方法,而不是花費時間和資源重新發明輪子並重新創建基線能力。 符合模式開放框架(MOF)的模式所使用的開放授權也為企業家可以在商業產品和服務中合法使用模式提供信心。
無需擔心知識產權侵權索賠或授權條款突然變更的風險。 在非限制性許可下存取整個培訓資料和代碼有助於企業家審核模型的出處,確保遵守法規。
此外,工程師可以檢查資料集是否有潛在偏差。 開發人員將能夠找到效能瓶頸並提高效能,因為他們可以存取整個程式碼庫。 這可以幫助將模型移植到不同的環境並隨著時間的推移改進維護。 因此,完全開放的模型減少了建構人工智慧產品和服務的障礙,並推動創新。