有手機專屬版本!Google 發表 AI 模型 Gemini 超越 GPT-4V

虎仔 / 馬日山 2023-12-07 13:33 | 科技新知
1207-1a.jpg
雖然早前有傳聞指 Google 要將大語言模型 Gemini 的推出押後到明年,但昨日卻毫無先兆下突然發表。Gemini 是一款原生多模態,可以同時支援文字、圖像和聲音輸入的大型語言模型;Google 表示在 32 項人工智能測試中,Gemini 有 30 項的評分超過了 OpenAI 的 GPT-4V。

Google 史上最強

這個被稱爲 Google 史上最強大和最通用的模型,將會有 3 個版本,包括最大的 Ultra 版、通用性最廣的 Pro 版,以及可以在手機上運作的 Nano 版。Gemini 可以同時辨識和理解文字、圖像和聲音,亦能夠分辨和解釋 C++、Go、Java 和 Python 程式語言。Google 以 Gemini 製作了 AlphaCode 2 新版程式碼生成系統,較兩年前的第一版有很多改進,包括可以解決兩倍的問題。

以自家晶片 TPU 訓練

Google 透露 Gemini 是以自家開發的晶片 TPU 訓練,使用了 v4 和 v5e 版 TPU,而全新的 v5p 新版本 TPU 則有望加速 Gemini 的開發,讓企業去客製化訓練自己的大型語言模型。v5p 單一叢集可支援 8,960 枚 TPU,比起 v4 能夠提供兩倍 FLOPS 運算力,記憶體頻寬則提高了三倍。

即日起整合到 Bard

Google 宣佈會分階段將 Gemini 整合到 Bard 人工智能,率先加入的是一個經微調的 Gemini Pro 版本,擁有推理和計劃的回答能力,明年就會推出更先進的版本。Gemini 會先推出英語版本,可以在全球 170 個國家或地區使用,之後會加入更多語言的支援。即日起 Bard 已經用上 Gemini Pro 去提供回應,預計到 12 月 13 日,在 GCP Vertex AI 或 Google AI Studio 上,就能容許企業通過 API 存取 Gemini Pro 模型。

毋須連線 Nano 手機版

發佈活動其中一項重點,就是在手機執行的 Nano 版 Gemini 模型,Google 表示它甚至毋須連線上網,單靠手機內置 TPU 晶片就能運作,現時會率先對應 Pixel 系列手機,而 Pixel 8 Pro 將會是第一款。Nano 版 Gemini 能夠在手機上整理會議錄音並準備內容摘要,亦會用來強化 Gboard 的自動語音回覆輸入能力,包括率先支援 WhatsApp 輸入,而明年支援的 Apps 將會越來越多。現時 Gemini Nano 只支援 TPU 晶片,未來會陸續支援其他手機的人工智能晶片,但 Google 未有提供時間表。

以下為 Google Gemini 的 Hands-on 示範:


Google 的官方介紹:


1207-1b.jpg

資料來源:ithome
 

最新新聞