跳动百科

一周五连发,AI大模型卷出新高度:阿里豆包谷歌哪家强?

赵堂滢   来源:网易

近日,阿里云推出超大规模语言模型“通义千问”的多模态版本“通义万相”,进一步丰富了其在AIGC(人工智能生成内容)领域的布局。与此同时,谷歌也推出了Gemini系列的最新版本Gemini 1.5 Pro,该版本在视觉和文本理解方面表现优异。这两家科技巨头在AIGC领域的竞争愈发激烈,引发了广泛关注。

阿里云的“通义万相”不仅继承了“通义千问”的强大文本处理能力,还新增了图像生成与编辑功能,支持文生图、图像风格迁移等任务,展现了其在多模态领域的技术实力。而谷歌的Gemini 1.5 Pro则通过引入新的视觉模块,提升了对复杂场景的理解能力和多模态任务的表现,特别是在艺术创作、设计等领域具有显著优势。

两家公司在AIGC领域的探索,不仅推动了技术的进步,也为用户带来了更多可能性。然而,具体哪家更强还需结合应用场景和个人需求进行评估。未来,随着更多企业加入这一赛道,AIGC领域或将迎来更加多元化的创新和发展。