最新消息

2025 Google I/O 盛會回顧:AI 創造力與感知力巔峰,Veo 3 領航視訊新紀元!
每年五月登場的 Google I/O 開發者大會,總是全球科技界關注的焦點。在 2025 年,AI 的發展腳步顯然沒有停歇,而 Google 作為這波浪潮的核心引領者,在這次大會上再次展示了其在人工智慧領域的顛覆性進展。從更具感知能力的 AI 助手,到無縫的跨裝置協作體驗,以及對未來運算介面的探索,AI 將不再僅限於生成內容,而是更深入地融入我們生活的每一個角落,成為真正的智慧夥伴。尤其值得一提的是,像 Veo 3 和 Imagen 3 這類生成式 AI 工具的巨大飛躍,正以前所未有的方式賦能內容創作者,開啟視覺化表達的新紀元。
以下是對 2025 年 Google I/O 大會核心亮點的深入分析:

AI 模型躍進:更強大的感知與推理能力

Google 在底層 AI 模型上的投入從未停歇。2025 年的 I/O 大會,我們很可能看到 Gemini 模型的再次重大升級,超越目前的想像。
    • Gemini Pro Max 或下一代模型: 在 Gemini 1.5 Pro 和 Flash 的基礎上,Google 可能會發布更強大、更高效的下一代 Gemini 模型,我們姑且稱之為「Gemini Pro Max」。這個模型將在多模態理解 (Multimodal Comprehension)複雜問題推理 (Complex Reasoning) 和超長上下文處理 (Ultra-long Context Window) 方面達到新高度,能更精準地理解人類意圖,甚至進行更深層次的學習與適應,進一步模糊現實與數位世界的界限。
    • Project Astra 的實用化進展: 去年亮相的 Project Astra 驚艷了所有人,展示了具備「視覺」和「記憶」的通用型 AI 助手雛形。在 2025 年,我們預期 Google 會展示 Project Astra 在現實世界中更具體的應用案例,例如:
        • 環境感知型AI: 透過智慧眼鏡或手機鏡頭,AI 能即時識別周遭環境中的物件、文字、聲音,並提供基於情境的建議或資訊。例如,在博物館,AI 能即時解說展品並回答提問;在廚房,它能識別食材並提供動態食譜建議。
        • 主動式學習與適應: AI 助手將不再被動地回應指令,而是能主動學習用戶的使用習慣、偏好和情境,提前預判需求並提供幫助,成為更貼心的個人化助理,甚至能跨越時間記住先前的對話與偏好。
    • AI Agents (智慧代理) 的落地與協作: Google 可能會展示 AI 代理技術的進展,讓 AI 能自主執行更複雜的任務,例如:自動處理郵件、管理行事曆、跨應用協調、甚至在無需用戶頻繁干預的情況下完成專案中的特定環節,實現更高效的自動化協作。

搜尋與知識獲取:從「搜尋」到「理解」

Google 的核心業務——搜尋,將繼續由 AI 進行深度變革,從被動的資訊查找轉變為主動的知識理解與應用。
    • AI Overviews 的普及與深化: AI 概覽將在全球範圍內得到更廣泛的應用。其內容將更為精準、多樣化,並能根據用戶的語氣和意圖,提供不同風格的回答 (例如:簡潔的答案、詳細的解釋、或是步驟教學),同時能更智能地篩選和呈現可靠的資訊來源。
    • 多模態搜尋的互動升級: 「Ask with Video」或類似功能將更加普及和流暢。用戶可以透過更多元的輸入方式 (如語音、圖像、影片、甚至穿戴裝置的實時感測),與搜尋介面進行更自然的互動,獲取更豐富、更具情境感的答案。
    • 知識圖譜的AI活化與個人化: AI 將使 Google 的知識圖譜更加動態和互動,當用戶提問時,AI 不僅提供事實,還能呈現相關概念、人物關係、時間軸等,並根據用戶的個人化知識背景和學習路徑,推薦下一步的學習內容。

AI 內容創作:揮灑無限創造力的新紀元

在生成式 AI 領域,Google 在 2024 年 I/O 大會上已展現出 Veo 和 Imagen 的驚人潛力。在 2025 年,我們預期這些工具將有更重大的飛躍,甚至可能開放給更廣泛的用戶群體。
    • Veo 3:影片生成全面進化,開啟敘事新篇章:
      Google 在本次 I/O 大會上隆重推出 Veo 3。相較於前一代,Veo 3 在影片生成方面實現了多項突破:
        • 更長時長與更強一致性: 能夠生成更長、更連貫的影片片段,有效解決了角色、場景和物體在多個鏡頭間的一致性問題,讓生成的影片更具敘事性。
        • 精準控制與風格化: 用戶將擁有對影片生成過程更精細的控制權,例如調整攝影機運鏡、燈光、景深、藝術風格等,甚至能透過參考圖片或影片來設定特定風格。
        • 文本轉影片的深度理解: Veo 3 能更深層次地理解複雜的文字提示,包括情感、氛圍和抽象概念,將其轉化為視覺元素,使得生成的影片不僅流暢,更富有表現力。
        • 音訊與動畫整合: 除了視覺,Veo 3 可能進一步整合音訊生成功能,或是提供更便捷的工具,讓用戶能為生成的影片快速配上音效和背景音樂,甚至將靜態圖像自動動畫化。
        • 開放預覽與生態合作: Google 可能會宣布 Veo 3 將開放給更廣泛的創作者進行預覽,並與更多影片編輯工具和平台進行深度整合,賦能全球內容生態。
    • Imagen 3:圖像生成與編輯的藝術革命:
      繼 Imagen 2 之後,全新的 Imagen 3 模型在圖像生成方面將會更上一層樓,能創造出更高解析度、更逼真、細節更豐富的圖像,並展現出驚人的多樣性。此外,我們期待它能提供更強大的圖像編輯和修復能力
        • 精準的文字驅動編輯: 透過文字指令精準修改圖像元素,例如「將照片中的襯衫顏色改為藍色,並在背景中添加一棵樹」。
        • 無縫修復與擴展: 自動修復照片缺陷,或將圖像無縫擴展到其原始邊界之外,創造出更廣闊的畫面。
        • 個性化與風格遷移: 學習用戶的繪畫風格或特定物件的特徵,生成具有用戶個人風格的圖像,或將一種圖像風格應用到另一張圖像上。
    • 多模態內容的交叉生成: 未來,AI 不僅能從文字生成圖像或影片,還可能實現跨模態的內容交叉生成,例如:根據一段影片自動生成多種風格的配樂和多語言字幕;或者根據文字描述和多張參考圖片,自動生成一個三維模型或互動式體驗,為沉浸式內容創作提供無限可能。

作業系統與應用:跨裝置的無縫智慧體驗

Android、ChromeOS 和 Wear OS 將在 AI 的賦能下,實現更深度的整合與個人化。
    • Android 16 的 AI 核心: 下一代 Android 系統 (可能命名為 Android 16) 將從底層開始融入 AI,提供更強大的設備端 AI 能力,提升效能、隱私和用戶體驗。這意味著更多 AI 任務將能在設備本地完成,降低對雲端的依賴,並帶來更快的反應速度。
    • 跨裝置協作的 AI 智慧流動: AI 將成為連接手機、平板、電腦、穿戴裝置乃至智慧家庭設備的橋樑。例如,AI 能智能地判斷用戶當前使用的裝置,並將任務無縫切換,或者協調多個裝置共同完成一個複雜任務 (如:手機錄音並實時語音轉文字,穿戴裝置顯示重點提示,電腦自動整理會議紀要)。
    • 應用程式中的生成式 AI 助手再升級: 各大 Google 應用程式 (如 Google Photos, Google Workspace, Google Maps) 將擁有更強大的生成式 AI 助手。例如,在 Google Photos 中,AI 可能實現更複雜的影片剪輯、動態物體移除;在 Maps 中,AI 能夠根據用戶的偏好和實時路況,自動生成更個人化、更具環保考量的行程規劃。

未來介面與硬體:空間運算與沉浸式體驗

Google 也可能在未來介面,特別是空間運算領域,展示其進展,預示著下一代運算平台的可能性。
    • AR 眼鏡與空間運算: 雖然大會主題可能仍是軟體,但 Google 有望透露更多關於其 AR 硬體或空間運算平台的進展。AI 將是這些沉浸式體驗的核心,提供實時的資訊疊加、互動導航、虛擬協作,甚至能根據用戶注視點提供智慧建議。
    • 更智能的穿戴裝置與健康管理: Wear OS 可能會獲得更深層次的健康洞察和更精準的生物識別能力,透過AI分析數據,提供個人化的健康預警和管理方案,並能與 AI 助手更自然地互動。

對開發者的意義

2025 年的 Google I/O 對開發者而言,將是學習和適應新 AI 範式的關鍵時刻。Google 可能會發布:
    • 新的 Gemini API 和生成式 AI 工具包: 讓開發者能更便捷、更高效地將最新、最強大的 Gemini 模型能力以及 Veo 3、Imagen 3 等生成式 AI 功能整合到自己的應用中。
    • AI 開發工具與框架的優化: 協助開發者更高效地構建、測試和部署基於 AI 的應用程式,尤其是在邊緣設備和多模態應用方面。
    • 負責任 AI 開發指南的深化: 強調在開發過程中納入倫理、安全和公平性的考量,確保 AI 技術的健康發展。
 
2025 年的 Google I/O 大會,再次證明了 Google 在 AI 領域的野心與實力。從底層模型的突破,到應用層的深度整合,再到未來人機互動介面的探索,特別是透過 Veo 3、Imagen 3 等工具賦予每個人強大的創造力,以及 Project Astra 描繪的更具感知力的 AI 助手,Google 正全面推進 AI,讓科技不僅更智能,更具感知能力、協作能力,並能更貼近用戶的真實需求。我們期待這些前瞻性的技術和功能,將如何逐步改變我們的數位生活,開啟一個更加智慧、便捷且富有創造力的未來。
回上頁

傑羅資訊有限公司

地址:205 基隆市暖暖區源遠路390號13樓

電話:02-2458-4602

傳真:02-2458-4602