由 Gemini Omni 驱动

Gemini Omni 视频生成器

Gemini Omni 是谷歌即将发布的 AI 视频模型,通过对话生成、混剪和编辑视频。支持一句话编辑、物体替换、抹除水印,视频内的文字渲染也很稳。适合短视频、广告、商品演示、数字主播和分镜测试。

Gemini Omni 哪里不一样

让 Gemini Omni 区别于其他 AI 视频模型的核心特性。对话编辑、稳定的文字渲染、一句话改图,下面逐个看。

对话式编辑

大多数视频工具一点小改动也要整段重生成。Gemini Omni 不一样,片子留着,你告诉它哪里要改。让镜头推得慢一点。把光改成黄昏。把红车换成黑色出租车。泄露界面里那个对话框就贴在视频旁边。这才是真正关键的点。

视频里的文字稳了

第一段在网上传开的 Gemini Omni 样片里出现了数学公式,写得是真公式,渲得干干净净。视频生成里文字一直是老大难,字母会抖,数字会糊。Omni 看起来把这事解决了。推特上有人直接叫它视频版的 Nano Banana 时刻。

一句话改图

说一句把红车换成黑色出租车,车就换了。说一句去掉右下角水印,水印就没了。只有你点名的那块被重建,其他保持原样。这已经不是文生视频的玩法,更像后期制作。

指令理解更准

早期测试者说 Gemini Omni 比 Veo 3.1 更听话。镜头切换稳,场景在剪辑点之间衔接得上。一个人说的不算评测,半信半疑就好。不过那些样片确实把这点撑起来了。

已有视频混剪

泄露界面里有一个 Remix your videos 的按钮。把已有的片子丢进去,让 Gemini Omni 改天空、换背景、换结尾。这已经不是文生视频玩具的范畴。更像剪辑软件,只是入口改成了对话。

模板模式

泄露界面里还有个 Try a template 选项。挑一个起点,省掉写长提示词。适合不想学怎么写两百字视频提示词的人。代价是用同一个模板的视频长得都差不多。

用 Gemini Omni 能做什么

根据目前泄露和报道的内容,预计会有四种主要工作流。

文字生视频

写一段你想看到的画面,Gemini Omni 把它做出来。泄露的元数据里写着大约 10 秒上限。短归短,大多数社交平台够用了。更长的片段可能要等 Pro 版本。这部分没有官方说法。

图片生视频

传一张照片。脸会眨眼,头发会动,镜头会平移。颜色和原图基本对得上。一个人物在镜头里前后是同一个人。这条路线大部分创作者都会先试一遍。

视频混剪

已有的素材丢进去,用对话改。换天空、换背景、调节奏。只有你点名的那部分被重新生成,其他保持原样。这种工作流可以悄悄取代过去一堆各管一段的单功能编辑工具。

物体和水印清理

让 Gemini Omni 把 T 恤上的 logo 拿掉,或者抹掉右下角的水印。补出来的画面会跟周围的运动和景深对得上。不用一帧一帧画蒙版,也不用手动遮罩。

三步走

目前泄露的样片基本都是这个流程。开头,生成,再用对话修。最后那步重复到满意为止。

1

选起点

写一段提示,或者丢一张图,或者粘一段视频。Gemini Omni 三种都收。提示词不用写太长。后面可以慢慢用对话调,不需要一开始就写完整简报。

2

运行 Gemini Omni

按下按钮。模型画每一帧,挑节奏,把音轨一起做了。Veo 3.1 已经支持原生音频,Omni 大概率会继承。谷歌还没正式确认这点,不过没有的话反而比较奇怪。

3

用对话精修

在片子旁边打开对话框。让 Gemini Omni 改镜头、换颜色、翻译台词、抹 logo。每次改动都接着上一次。小改动不用再把整段重新跑一遍。

Gemini Omni 适合用在哪

下面六种是真实工作场景,不是 demo 视频里那种摆拍。

短视频日更

给抖音、视频号、Reels、Shorts 持续供片。大约 10 秒的长度刚好够这些平台用。写一句话,挑竖屏,发布。结尾不喜欢?在对话里回一句,Gemini Omni 只重建那一拍。

广告测试

一份简报丢进去,回来几个不同切入点。换台词靠对话,换颜色靠对话。一周能测的版本数比以前一个月还多。每个版本不用从零渲染,预算因此压得很低。

商品演示

一张商品图变成短片。转一圈,演示用法,拉近卖点。同款想看另一种配色?让 Gemini Omni 把瓶子从绿色改成琥珀色。整个店铺页面拿到一致的光线和风格,不用拍摄。

数字主播

Veo 3.1 已经支持多语言对口型,Omni 大概率会有。做一个数字主持人,让 Gemini Omni 换种语言说同一句话,嘴型会跟着新音频走。同一个人物在多个镜头里保持一致。

旧素材清理

手里有带水印的视频、闯入镜头的路人、写错字的招牌?丢给 Gemini Omni 说要改成什么样子。模型只重建坏掉的部分,其他不动。过去一个资深剪辑师一下午的活,现在一条消息搞定。

分镜测试

在订场地之前先把镜头试一遍。把分镜变成粗剪视频,看节奏,看角度。用 Gemini Omni 换走位、换镜头、换场地。和团队对完方案再开机。

常见问题

关于 Gemini Omni 目前的常见疑问。这些信息大都来自泄露和早期用户分享。谷歌正式发布之后可能会有变化。其他问题写信到 support@gemini-omni.me。













上手试试 Gemini Omni

一个干净的网页。写提示词,拿成片,再用对话改不满意的地方。不用配环境,不用折腾模型。