文章来源:AI鲸选社

众多周知,字节跳动在All in AI。毕竟2023年净利润3000亿(字节否认了),要为自己准备下一阶段的发展动力。
此前鲸选盘点过字节推出的很多AI 产品,大多是AI对话类。在文生图和文生视频领域,字节目前似乎在倾力打造Dreamina,这款AI产品对标国外的Midjourney和Sora,难度不小。
最近Dreamina在放内测资格,到底哥为你带来一手测评。

文生图片能力,还有努力的空间
文生图片很多时候不仅考验生成视频的精细度,也考验对文字的理解能力,我们就做一个“耳朵是蝴蝶翅膀的大象”。
从生成结果看,完全没有体现出来文字想要表达的创意。

我们看到有上传参考图的功能,所以上传了这张比较有名的创意图。

我们选择了主要参考点是主体,Dreamina识别出了这张图的主体是大象。

我们在选择写实风格,有了参照图后,生成的图片终于理解了文字的意思, 不过这图片,怎么感觉像抠图后加上背景生成的呢?

文生视频能力,不是Sora路线
我们先看看Dreamina社区中,一些文生视频的案例。

是不是还挺酷炫,要知道Sora生成水杯破裂的视频,是不能够了解破裂过程应该如何呈现,而Dreamina这个视频,则是理解了物理规律,还加上了想象力的翅膀。
到底哥以为文生视频能力会很酷炫,直到我看到了它的参考图。

我瞬间意识到,Dreamina应该和Pika等AI视频的路线相似,就是图片关键帧动起来,所以并不是对文字的真正理解,以及视频画面的原生,而是几秒钟的关键帧运动。
所以我们接着拿蝴蝶大象做生成测试,没有意外,视频也没有体现文字的意思,还是一只大象动了几秒钟。

一位同样从事Sora产品跨国开发的负责人,告诉AI鲸选社,这是Dreamina跨域和泛化问题还没处理好。
虽然Dreamina还存在一些问题,但其从头研发,并且比Sora更早开放测试,证明其还是有决心和潜力做更好,期待其迭代版本。
(责任编辑:小陈)