5月15日消息,谷歌在山景城总部附近的海岸线圆形剧场举行了一年一度的I/O开发者大会Keynote演讲,会议持续了两个小时。如预期,谷歌在这次发布会中强调了人工智能(AI)的重要性,演讲稿中提到了整整120次AI,而这还只是官方统计数,实际上AI的提及次数更多。
![](http://image.uc.cn/s/wemedia/s/upload/2024/740e535edb6dd8e3a5efcc38745cd745.jpg)
在这场发布会中,谷歌发布了众多引人注目的更新和新功能。其中包括谷歌搜索引擎在美国推出的新功能“AI概览”(AI Overviews)。这项功能能够直接总结搜索结果,并具备多步骤推理能力,能够一次性处理带有多个限制条件的长问题。此外,谷歌搜索还推出了支持视频搜索解决方案的新功能。
![](http://image.uc.cn/s/wemedia/s/upload/2024/e5c0c77561b724b2ed2267dd13a3b0e9.jpg)
谷歌还发布了以Gemini 1.5 Pro为代表的一系列产品,Gemini 1.5 Pro是一种以上下文窗口为特点的大型模型。今年晚些时候,Gemini 1.5 Pro将进一步扩大窗口,达到200万Tokens,以扩展多模态信息的处理能力。此外,为了应对需要快速响应的场景,谷歌还推出了Gemini 1.5 Flash模型。同时,还有参数更大的Gemma 2开源模型将于下个月发布。
![](http://image.uc.cn/s/wemedia/s/upload/2024/0d62bf0d6ef86a34792c6b354f34f8b7.jpg)
![](http://image.uc.cn/s/wemedia/s/upload/2024/0e2150b06114dc47b24ccc43d0e829f2.jpg)
在多模态领域方面,谷歌推出了文生图工具Imagen 3、与YouTube和音乐家合作的“AI音乐沙盒”,以及最新的视频生成模型Veo。此外,多模态Gemini Nano模型也将在今年晚些时候登陆Pixel手机,这是一种本地运行的机载模型。
![](http://image.uc.cn/s/wemedia/s/upload/2024/4b46ea148830beb8d4a4b200225daab6.jpg)
![](http://image.uc.cn/s/wemedia/s/upload/2024/b07dab8bef7d6e756d7c99a3b00cbd8e.jpg)
与OpenAI发布会类似,谷歌的演讲中也提及了实时AI助手。从今年夏天开始,Gemini将支持语音实时交互,并计划在今年晚些时候推出实时视频交互功能。此外,谷歌还计划在未来几个月内推出名为Gems的自定义AI助手功能,类似于GPTs,能够与谷歌生态系统的其他产品进行联动。
![](http://image.uc.cn/s/wemedia/s/upload/2024/019346e5fa6f1b9ee4d0617e51c850ee.jpg)
在硬件方面,谷歌宣布了第六代TPU芯片Trillium,并透露明年初将采用英伟达最新的Blackwell架构GPU。此外,在发布会上还涉及液冷和光缆等一些股民可能感兴趣的话题。
![](http://image.uc.cn/s/wemedia/s/upload/2024/c54bc82dd33e186debe04b00bcf150de.jpg)
![](http://image.uc.cn/s/wemedia/s/upload/2024/fd5780efafe0ade7b215da13c47d45ad.jpg)
编辑点评:这场谷歌I/O开发者大会Keynote演讲为开发者和用户带来了众多令人期待的创新和功能。谷歌声称未来将继续以人工智能为核心,致力于推动科技进步,期待谷歌能为用户提供更智能、更便捷的服务和产品。