AI 全面進場!一文睇 Google I/O 2024

alex 2024-05-15 09:51 | 科技新知
今(15日)凌晨首日舉行的 Google I/O 開發者大會「主題演講」結束,2 小時的會議主要集中在 AI,Google 的 Gemini(前身 Brad) AI 模型及如何整合到各種 Google 服務當中。

螢幕截圖 2024-05-15 上午9.34.36.png



Gemini 模型更新:更快更強大

Google 推出了新的 AI 模型 —— Gemini 1.5 Flash。這款多模態模型與 Gemini 1.5 Pro 一樣強大,但對於「大規模、高頻率」的任務更加優化,能夠更快速地生成回應。此外,Google 對 Gemini 1.5 進行了一些改進,提升了其翻譯、推理和編程的能力。

另外,Gemini 1.5 Pro 亦作出優化,其脈絡長度擴展至 200 萬個詞元脈絡長度(token),可處理達 1500 頁文件、為 100 封電子郵件摘要,或處理長達 1 小時的影片內容。此外,Gemini 1.5 Pro 關於增強了編寫程式碼、推理、理解音訊和圖像的能力。

GNjlmiQWkAEHeJV.png
▲新增 Gemini 1.5 Flash 模型。


Google Lens 支援影片搜尋

以往 I/O 都主要講 Android 新功能或 Google 的新服務,但今次就全程講 AI。首先圖片搜尋功能 Google Lens 再提升,新增了通過影片來搜尋。即是你可以拍攝一段影片,對著想要搜尋的物品提問,Google 的 AI 將嘗試從網絡上找到相關答案。
 

「Ask Photos」功能:智能管理你的照片庫

Google 將在今年夏天推出一項新功能,這對於那些擁有多年甚至十多年照片的用戶來說是一大福音。「Ask Photos」功能讓 Gemini AI 能夠根據你的提問,深入你的 Google 照片庫中尋找答案。CEO Sundar Pichai 示範了如何查詢他的車牌號碼,結果不僅顯示了號碼,還展示了相應的照片,以便確認。
GNjhd_GXgAAzAiF.jpeg



Gemini 整合到 Workspace 可生成會議摘要

Google 將其最新的主流語言模型 Gemini 1.5 Pro 整合到了 Docs、Sheets、Slides、Drive 和 Gmail 的側邊欄中。當這項功能下個月向付費訂閱者推出時,它將成為 Workspace 中的助理,可以在 gmail、meet 中為信件與會議作出摘要,簡單生成懶人包。

螢幕截圖 2024-05-15 上午1.16.40.png
▲Meet 會議可生成摘要。

螢幕截圖 2024-05-15 上午1.16.28.png
▲gmail 側邊亦會製作出摘要。


Gemini 變得更擅長對話

新推出的 Gemini Live 功能旨在使與 Gemini 的語音聊天感覺更自然。聊天機器人的語音將更新,增添更多個性。另外,「Project Astra」功能具視覺分析能力,用戶可透過手機鏡頭與 Gemini 對話,AI 會根據拍攝影像作 描述和對答,示範影片中更幫用戶找到放在桌上的眼鏡。Gemini 也新增了與 Google 日曆、任務和 Keep 的整合功能。

io副本.jpg


 

最新新聞