Azure OpenAI 介紹

8 min readFeb 18, 2023

如大家所知微軟投資OpenAI這家公司，而這家公司也是近期火紅的聊天機器人ChatGPT所推出的。OpenAI 同時也發布一款名為 DALL-E 的圖像產生應用程序。這些技術是用 AI 模型構建的，這些模型可以從使用者那裡獲取幾乎任何自然語言輸入，並返回機器創建的類似人類的回應。

OpenAI AI 模型中有三個主要的功能類別：

以下是OpenAI在AI領域中可以做的事情：

人工智慧會藉由依賴機器來學習和執行工作來模擬人類行為，而不需要人類的指示。
機器學習模型會採用天氣狀況等資料，並將資料符合演算法，以做出預測，例如商店在某些假日內可能會有多少營收。
深度學習模型會以人工神經網路的形式使用多層演算法，以傳回更複雜的使用案例結果。 Azure AI 服務是以深度學習模型為基礎所建置。更多的訊息可參考微軟的機器學習與深度學習之間的差異。
生成式AI 模型是深度學習模型的其中一種，可根據輸入中所述的內容來產生新內容。 OpenAI 模型是一組可產生語言、程式碼和影像的 AI 模型集合。

微軟整合OpenAI服務以達成以下三個目的：

利用 Azure 的基礎設施，包括安全性、合規性和區域可用性。
跨 Microsoft 產品（包括 Azure AI 產品）部署 OpenAI AI 模型功能。
使用 Azure 為 OpenAI 的所有工作負載提供支援。

Azure OpenAI 由四個組件組成：

預先訓練好的生成式 AI 模型
客制化能力；使用我們自己的資料微調 AI 模型的能力
用於偵測和減少有害用例的內置工具，防止使用者亂用AI
具有基於RBAC和專用網路的企業級安全性

下圖為Azure OpenAI與Azure AI 服務之間的關係圖

如何使用Azure OpenAI

基本上要使用Azure OpenAI與使用Azure的方式是一樣的，透過REST APIs, Python SDK或web介面進入到Azure OpenAI Studio。

在 Azure OpenAI Studio 中，我們可以建立 AI 模型並將它們部署到應用程式中。 Azure OpenAI 的功能是通過一些特定的生成式 AI 模型實現的。不同的模型是針對不同的任務；一些模型擅長簡單的摘要任務，一些模型擅長一般的非結構化回應，還有一些模型用於從文本輸入生成獨特的圖片。

OpenAI模型分為三種主要類型：

Generative Pre-trained Transformer (GPT) — 也就是我們都知道的ChatGPT，現在是第三代。
Codex
DALL-E

上述這些模型都已內建在Azure OpenAI中。Azure OpenAI 的 AI 模型都可以通過自行微調進行訓練和客製。更多客製模型的方法可參考此篇文件。

生成式 AI 模型永遠都會反映true value的概率。效能更高的模型，例如針對特定任務進行了微調的模型，可以更好地收到反映true value的回應。檢查生成式 AI 模型的輸出很重要。此外，Azure OpenAI 提供的模型是根據 2019 年 10 月之前的資料進行訓練的，而且沒有去爬Internet的資料，所以它不是CheatGPT。

作業介面

在Azure OpenAI Studio中，我們可以點選Playground的GPT-3界面中進行 OpenAI 建模(如下圖)。我們可以在＂Start typing here＂輸入指令。

OpenAI的自然語言處理(NLP)

Azure OpenAI 的自然語言模型能夠接受自然語言(就是人類說的白話文)並產生回應。

自然語言學習模型是根據稱為token的單詞或一個字串進行訓練的。例如，英文中的單詞“hamburger(漢堡)”會被分解為三個token: ham、bur 和 ger，而像“pig”這樣的短而常見的單詞是一個token。這些token被對映到向量(vectors)中，以供機器學習模型用於訓練。當經過訓練的自然語言模型收到使用者說的話時時，它還會將收到的話分解為token。

GPT(Generative pre-trained transformer)模型在理解和建立自然語言方面表現出色。如果你有使用過CheatGPT，哪你應該非常了解CheatGPT的自然與眼處理能力。 GPT 模型通常在末尾附加版本，例如 GPT-2 或 GPT-3。 Azure OpenAI 提供對 GPT-3 ，並將很快提供對 GPT-3.5 的版本。目前CheatGPT則是3.5版本。