多模态AI

18 个工具带有此标签

2026 最佳 18 个多模态AI工具

Wan AI、智谱AI、vMira、GLM、Swipeer、Gemini Omni、XChat AI、Seedance AI、Kinovi、C Dance ai、Gemini、WorkBuddy、ShotAI、MetaMirror、VoxDeck、Tianpu Le、Seedance、Seedance 2 Pro 等是最佳免费/付费的「多模态AI」工具。

Gemini

谷歌推出的多模态大模型，支持文本、图像、代码等任务

WorkBuddy

腾讯版小龙虾，能自主规划并交付多模态复杂任务结果，支持多 Agents 并行工作，内置MCP、Skills

ShotAI

融合 Sora 2、VEO3、Gemini Nano Banana 与 Seedream 4.0 的AI视频与图像生成平台。

MetaMirror

AI视频生成工具，支持多模态创意分镜创作服务

VoxDeck

AI演示文稿制作工具，通过多模态AI技术重新定义创意演示方式。

Tianpu Le

唱鸭团队推出的首个多模态音乐生成大模型

Kinovi

Kinovi利用多模态参考、顶级模型和公共REST API生成视频和图像。它提供免费访问，让您开始创作。

Seedance

Seedance 2.0 是一款多模态AI视频生成器，可将文本、图像和音频转化为专业创作者所需的电影级视频内容。

Seedance 2 Pro

Seedance 2 Pro 由 Seedance 开发，让创作者能够从文本、图像和音频生成高质量 AI 视频，具备多镜头场景控制和多模态参考功能，实现电影级效果。

C Dance ai

C Dance ai由Seedance开发，是一款支持文本、图像、音频和视频输入的多功能视频生成工具，提供多模态参考、编辑和导演级控制。

Seedance AI

字节跳动官方平台，利用强大的多模态AI视频引擎，根据文本提示生成电影级视频。

XChat AI

XChat AI推出的AI角色平台，用于创建和与虚拟角色聊天。使用GPT、Claude、Gemini、FLUX、Kling和字节跳动等先进模型生成图像、视频等。

vMira

vMira是一款由vMira提供的免费全能AI工作空间，支持聊天、编程、设计、音乐、文档创建和API。功能包括实时网络搜索、扩展思维模式、语音支持等。

智谱AI

智谱AI，国内领先的大模型与多模态视觉平台，帮开发者和企业快速打造高精度AI方案，落地工业应用，效率拉满。

Wan AI

万AI免费多模态平台，输入文字或图片就能生成专业级视频和配音，效果堪比大片。

Gemini Omni

谷歌统一多模态视频模型，用于创建、混剪和编辑视频，具备逼真运动、场景控制和高级文本渲染功能。

Swipeer

Swipeer AI的Swipeer是一款生产力平台，用于任务管理，提供滑动导航、高级聊天、多模态功能和无缝集成，帮助用户释放潜力。

GLM

智谱AI的GLM-5V Turbo是一款多模态视觉语言模型，专为复杂图像分析、视觉推理及基于视觉输入的文本生成而设计。