萨楼网 > 百态 > 正文

​免费AI“神器”系列第14弹:Sora竞品可生成2分钟视频;谷歌Vlogger能让图像

时间:2024-04-17 19:53

来源:萨楼网

点击:

免费AI“神器”系列第14弹:Sora竞品可生成2分钟视频;谷歌Vlogger能让图像说话

近期,生成式人工智能(AIGC)领域又涌现出多款创意十足的新应用。

今天,钛媒体 AGI 梳理了免费 AI " 神器 " 系列第十四弹,共五款,其中不少产品再一次拓宽了我们对 AI 的想象力。

120 秒超长 AI 视频模型—— StreamingT2

即插即用的视频转视频框架—— AnyV2V

谷歌图生视频模型—— Vlogger

文本转视频模型—— Hotshot ACT-1

AI 视频生成模型—— Motion-I2V

1、120 秒超长 AI 视频模型—— StreamingT2

产品信息:StreamingT2 是由 Picsart AI Research、UT Austin 和 Shi Labs 的研究团队共同开发的一款文生视频模型,该模型突破了以往 AI 视频长度限制,可生成长达 2 分钟的长视频。StreamingT2 的发布将视频生成技术推向了新高度,也被称为 Sora 的强劲对手。

产品功能: StreamingT2V 可以根据用户的文字提示生成长达 120 秒的长视频,同时,StreamingT2V 将条件注意力模块(CAM)和外观保持模块 ( APM ) 核心构架结合,使得生成的视频与文本描述紧密相关且动态连续,展现高动态效果和时间一致性。

此外,StreamingT2V 的实现方法分为初始化、Streaming T2V 生成和 Streaming Refinement 三个阶段,保证了视频生成的高质量和高分辨率,并且 StreamingT2V 的高效能并不局限于特定的模型,这意味着随着技术的进步,视频质量还有进一步提升的空间。

项目及演示:https://streamingt2v.github.io

论文地址:https://arxiv.org/abs/2403.14773

2、即插即用的视频转视频框架—— AnyV2V

产品信息:AnyV2V 是一款无需训练,即插即用的 AI 视频编辑框架,该框架由滑铁卢大学、Vector Institute 和 Harmony.AI 团队共同开发,旨在帮助用户简化视频创作流程,提高视频制作效率。

产品功能:AnyV2V 不仅支持对源视频进行深度编辑与修改,还能按照输入文本提示,主题或风格等,生成对应新视频。

具体来看,AnyV2V 将视频编辑简化为了两个主要步骤:首先,AnyV2V 可以插入任何现有的图像编辑工具,从而支持多个视频编辑任务。其次,AnyV2V 可以插入任何现有的图像视频模型,执行 DDIM 反转和中间特征注入,从而保持与源视频的外观和运动一致性。

此外, AnyV2V 还可以支持视频编辑任务,包括基于参考的风格转换、主题驱动编辑和身份处理。

项目地址:https://tiger-ai-lab.github.io/AnyV2V/

论文地址:https://huggingface.co/papers/2403.14468

3、谷歌图生视频模型—— Vlogger

产品信息:Vlogger 是谷歌推出的一款图生视频技术框架,该框架是基于 MENTOR 数据库训练而来,数据库中包含超过 80 万名人物肖像,以及累计超过 2200 小时的影片,使得 VLOGGER 可以生成不同种族、不同年龄、不同穿着、不同姿势的人物视频。

产品功能:用户只需上传一张人物图片+音频文件,就能实现让人物开口说话,生成一段人像与音频完美贴合且流畅的视频,并能做到视频中人物面部表情及肢体动作都相当自然且生动。

团队成员表示,和业内此前的同类方法相比,VLOGGER 最大的优势体现在不需要对每个人进行训练、也不依赖于面部检测和裁剪,并且生成的视频很完整(既包括面部和唇部,也包括肢体动作)等等。此外,Vlogger 还具有视频编辑和翻译等应用,能够让人物闭嘴、闭眼,甚至进行视频翻译。

项目地址:https://enriccorona.github.io/vlogger

4、文本转视频模型—— Hotshot ACT-1

产品信息:Hotshot - ACT 1 是一款由 Hotshot Research 开发的文本生成视频模型,该模型基于大规模高分辨率文本视频语料库训练,注重空间对齐、时间对齐和审美质量,旨在为视频创作者提供高质量的视频创作体验。

产品功能:用户只需输入文本描述,即可生成动画风格的视频。同时可以根据自身需求选择不同的宽高比和分辨率输出,定制化自己的视频内容。

体验地址:https://hotshot.co/act-one

5、AI 视频生成模型—— Motion-I2V

产品信息: Motion-I2V 是一款 AI 视频生成模型,能够根据一张静态图片生成连贯且可控制的视频。

产品功能:能实现图像到视频的自动转换,能够将静态图像自动转换成连贯的动态视频,通过模拟图像中对象的自然运动,使静态图像动起来。同时支持用户精确控制视频中的运动轨迹和运动区域,使得生成的视频不仅流畅连贯,而且用户可以通过简单的操作控制视频内容。

此外,基于其先进的运动增强和时间注意力技术,无需额外的训练样本,Motion-I2V 就能实现视频风格转换,比如从现实风格转换成漫画风格。

项目主页:https://xiaoyushi97.github.io/Motion-I2V/

论文地址:https://huggingface.co/papers/2401.15977

(本文首发于钛媒体 APP,作者 | 章橙,编辑 | 林志佳)

相关标签:

相关推荐

​真格秦天一:全球化会以一种新的方式谨慎展开

真格秦天一:全球化会以一种新的方式谨慎展开 3 月 29 日,「暗涌 Waves」发布了《给中国创始人的全球化指南》,将中国企业全球化的过去、现在及未来以北美、拉美、中东、日本、东...

2024-04-17 19:51:25

​ASC24落幕,超算人才培养才刚刚开始

​ASC24落幕,超算人才培养才刚刚开始

ASC24落幕,超算人才培养才刚刚开始 4 月 13 日,2024 ASC 世界大学生超级计算机竞赛(简称 ASC24)在上海大学落下帷幕,北京大学以总成绩第一一举夺魁,成为 ASC24 总冠军,中山大学斩获...

2024-04-17 19:49:09

​航线开通,“空中深中通道”来了

​航线开通,“空中深中通道”来了

航线开通,“空中深中通道”来了 4 月 12 日下午,粤港澳大湾区首条跨海低空物流商业化航线启动仪式在中山市小榄镇宏昌物流园举行。当天,经过大约 45 分钟的飞行,从深圳蛇口赤...

2024-04-17 19:46:53

​老旧电梯更新迎来“破局”!广东率先推出地方标准

​老旧电梯更新迎来“破局”!广东率先推出地方标准

老旧电梯更新迎来“破局”!广东率先推出地方标准 老旧电梯更新迎来标准助力!为贯彻落实《广东省推动大规模设备更新和消费品以旧换新的实施方案》(以下简称《方案》),广东...

2024-04-17 19:44:37

​小米汽车:SU7 车机端视频软件会员与手机端对应 App 互通

​小米汽车:SU7 车机端视频软件会员与手机端对应 App 互通

小米汽车:SU7 车机端视频软件会员与手机端对应 App 互通 IT 之家 4 月 16 日消息,小米 SU7 答网友问已连续推出第 19 集,今日的问题包括交付时间、导航流转方式、视频会员等等。 小米...

2024-04-17 19:42:21

​羊晚体验官带你行进广东百县千镇万村①:番禺大岭古村

​羊晚体验官带你行进广东百县千镇万村①:番禺大岭古村

羊晚体验官带你行进广东百县千镇万村①:番禺大岭古村 【开栏语】 2022 年 12 月 8 日,广东省委十三届二次全会上首次提出 百千万工程 ,审议通过了《中共广东省委关于实施 百县千...

2024-04-17 19:40:05

​聚焦“AI+制造”,诺谛智能完成近亿元Pre-A轮融资

​聚焦“AI+制造”,诺谛智能完成近亿元Pre-A轮融资

聚焦“AI+制造”,诺谛智能完成近亿元Pre-A轮融资 今日,专注于 AI+ 制造 的行业大模型及应用企业——诺谛智能正式完成 Pre-A 轮融资,本轮融资由武岳峰科创领投,三叶虫创投、清智资...

2024-04-17 19:37:49

​鲁班到家获数亿元B轮融资,家居售后服务平台近年来最大单笔投资

​鲁班到家获数亿元B轮融资,家居售后服务平台近年来最大单笔投资

鲁班到家获数亿元B轮融资,家居售后服务平台近年来最大单笔投资 投资界(ID:pedaily2012)4 月 16 日消息,近日,专注布局大家居后市场服务平台的鲁班到家宣布完成 数亿元 B 轮 融资...

2024-04-17 19:35:33

​突发!特斯拉裁员 1.4 万人,马斯克跌落凡间

突发!特斯拉裁员 1.4 万人,马斯克跌落凡间 特斯拉再次站上舆论的风口,这次是因为裁员。 4 月 15 日,据凤凰网科技报道,马斯克刚刚发布全员邮件,特斯拉即将在全球范围内裁员...

2024-04-17 19:33:17

​Meta曾考虑收购美国出版巨头,为训练旗下人工智能压缩成本

​Meta曾考虑收购美国出版巨头,为训练旗下人工智能压缩成本

Meta曾考虑收购美国出版巨头,为训练旗下人工智能压缩成本 科技公司通过收集大量数据训练人工智能程序日益引发全球关注。近日,美国科技公司 Meta 的一份内部会议纪录流出。该纪...

2024-04-14 06:12:21

​中国记协:“秦朗丢作业”怎么刷屏的?谁要反思?

​中国记协:“秦朗丢作业”怎么刷屏的?谁要反思?

中国记协:“秦朗丢作业”怎么刷屏的?谁要反思? 钟记平 / 中国记协 微信公号 网红 Thurman 猫一杯 认错了,从全网认识 丢作业的秦朗 到全网认识 造新闻的网红 , 当时的流量有多大...

2024-04-14 06:10:05

​长沙警方:邓紫棋演唱会前,2人被抓

​长沙警方:邓紫棋演唱会前,2人被抓

长沙警方:邓紫棋演唱会前,2人被抓 随着全国各类演出市场火爆 一些知名偶像明星的演出门票 可谓是一票难求 但是有些不法分子 就打起了 歪心思 …… 邓紫棋演唱会长沙站举办前期...

2024-04-14 06:07:49

​伊朗或在数小时内袭击以境内目标!以防长会见美中央司令部司令,中使馆紧急提

​伊朗或在数小时内袭击以境内目标!以防长会见美中央司令部司令,中使馆紧急提

伊朗或在数小时内袭击以境内目标!以防长会见美中央司令部司令,中使馆紧急提 醒 伊朗驻叙利亚外交机构建筑遭空袭后,伊朗下一步动作成为各方关注焦点。 据《以色列时报》网站...

2024-04-14 06:05:33

​“拒催女儿脱单”,愿这样的父亲不只是“别人家的”

​“拒催女儿脱单”,愿这样的父亲不只是“别人家的”

“拒催女儿脱单”,愿这样的父亲不只是“别人家的” ▲ 拒催女儿脱单 的父亲登上热搜,被网友称为 别人家的爸爸 。图 / 网络视频截图 我女儿差过吗?这么努力的孩子……就她一个...

2024-04-14 06:03:17

​张文宏科普百日咳!两个原因导致病例激增

​张文宏科普百日咳!两个原因导致病例激增

张文宏科普百日咳!两个原因导致病例激增 本文字数:1295,阅读时长大约 2 分钟 导读 :张文宏表示,百日咳是疫苗可预防的疾病,之所以最近多见,主要有两方面的原因:一是随着时...

2024-04-14 06:01:02

​健身房突然闭店学员需去几公里外上课?新店:一个品牌不同老板,可免费上

​健身房突然闭店学员需去几公里外上课?新店:一个品牌不同老板,可免费上

健身房突然闭店学员需去几公里外上课?新店:一个品牌不同老板,可免费上 来源 | 潇湘晨报 记者 | 满延坤 4 月 11 日,李女士来到之前门店的位置发现已经变成了一个药房,新店的名...

2024-04-14 05:58:46

​突传“巨额赎回”!巨头紧急回应

​突传“巨额赎回”!巨头紧急回应

突传“巨额赎回”!巨头紧急回应 作 者丨庞华玮 编 辑丨姜诗蔷 近日,北京一家量化私募大厂出现 巨额赎回 的消息引发市场关注,涉事私募为北京涵德投资。 不过,4 月 10 日,北京...

2024-04-14 05:56:30

​让境外来华的朋友们,在广州支付更轻松!

​让境外来华的朋友们,在广州支付更轻松!

让境外来华的朋友们,在广州支付更轻松! 你发现了吗?越来越多的外国人出现在广州的街头,广州越来越 洋气 啦。 作为中国的南大门,开放包容的广州是外国人来中国旅游、工作或...

2024-04-14 05:54:14

​福建立法明确妻子可查询配偶财产,此前广州等地市也有类似规定

福建立法明确妻子可查询配偶财产,此前广州等地市也有类似规定 在婚姻家庭纠纷中,离婚时往往存在一方对另一方财产情况不明晰的情况,常见的有其中一方隐藏、转移、变卖、毁损...

2024-04-14 05:51:59

​曲阜是属于哪个省哪个市的城市(曲阜是山东的哪个市)

​曲阜是属于哪个省哪个市的城市(曲阜是山东的哪个市)

曲阜是属于哪个省哪个市的城市(曲阜是山东的哪个市) 曲阜,隶属于中国山东省济宁市,是中国古代文化名城、国家历史文化名城。作为孔子故里,曲阜几乎无人不知无人不晓。 这...

2024-04-12 11:16:59