快手可灵大模型发布图生视频及视频续写功能


快手视频生成大模型“可灵”自面世以来引发国内外广泛关注。6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。同时,可灵还发布了视频续写功能,可为已生成的视频(含文生视频及图生视频)提供便捷的一键续写和连续多次续写,将视频最长延伸至约3分钟,极大拓展了视频大模型的创作边界。
按需定制视觉叙事
此前,可灵在文生视频方面已经展现出了创造逼真运动场景、精确模拟物理特性以及将复杂概念巧妙融合的能力,输出画质高,并允许用户自由调节视频的纵横比。这些特性如今都被融入到图生视频模型。用户只需上传一张图片,可灵即能基于对图像的深度解析,变静为动。
比如用户如上传经典的蒙娜丽莎照片,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流。
得益于其基础模型架构中的3D时空联合注意力机制,可灵在转换静态图像为动态视频时,能够细腻准确地实现大幅度运动场景。例如,只需上传一张牧羊犬追球的静止照片,模型就能生成一段牧羊犬奔跑追逐网球的视频,牧羊犬耳朵晃动、毛发飘扬,而网球则在空中弹跳,视频整体自然而流畅。
可灵图生视频模型还融入了提示词融合技术,深化对图像语义与用户指令的理解整合。这意味着,模型能够根据用户提供的不同文本指令变换视频中的动态表现,实现“按需定制”。
再比如用巨龙图片生成视频,输入“正在捕食的巨龙,飞扬的沙子,奇幻风格的电影”,视频便呈现巨龙掀起漫天黄沙,嘴部仿佛在咆哮的效果。此外,可灵图生视频模型支持不同风格的图像输入,同时兼容各种长宽比的图像输入。
视频续写可生成最长约3分钟视频
可灵大模型推出视频续写功能,用户只需一键操作,即可在已生成视频的基础上延续生成约5秒内容,该功能同时适用于文生视频和图生视频。同时,通过连续多次续写,能够最长生产约3分钟的连贯视频。基于对物理运动的深入理解,视频续写不仅确保新生成部分与原视频间的运动连贯性及物理合理性,还能融入大幅度的动作变化。
此次升级的一大亮点是集成文本控制机制于视频续写中,这意味着用户能够通过自定义提示词,为每段视频续写注入个性化创意。比如一个关于古堡的视频片段,用户既可以选择让它先“太阳落下去,天空变暗”,继而“太阳升起来,天空变亮”,也可以探索另一路径:“太阳落下去,天空变暗,灯光渐亮”,随后“灯光亮起,雾气氤氲”,以此创造出各具特色的连续视觉叙事。
6月6日,可灵文生视频大模型正式亮相,并即时在快影App上启动邀测体验,截至目前,已有累计超过14万人排队申请。此次进化,可灵文生视频基础大模型的能力被整合到图生视频和视频续写功能中,将为用户带来更丰富、灵活的视频创作体验。
据悉,快手还将在下月召开的2024世界人工智能大会(WAIC)上举办以“新AI·新应用·新生态”为主题的大模型技术生态论坛,届时将发布最新的大模型技术与应用战略,包括大模型技术矩阵全景、基座模型技术创新、应用和落地情况等。
(受访者供图)
本文链接:http://knowith.com/news-1-812.html快手可灵大模型发布图生视频及视频续写功能
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
跨考历史学考研难吗 有没有朋友是在上海奉贤星火考的大路啊
考研英语70分有多难(考研英语70分有多难考)
资阳考研在哪儿考,张韬几岁
法律硕士(非法学)(法律硕士非法学能考司法考试吗)
郑州可以读研的学校 河南考生考研是不是占优势
2014经济学考研辅导:宏观经济学案例分析(12)
2015经济学考研:西方经济学模拟试题二答案
重庆市合格性考试报名,重庆往届生考研报名条件
陕西省考研时间 考研政治名师都有谁
材料考研难吗(材料考研难吗?)
必看攻略!阿昔替尼多少钱一盒?2025阿昔替尼纳入yb了吗?国内印度阿昔替尼代购渠道公布5mg60片(印度)阿昔替尼价格(费用约2010元)代购价格yb价格购买渠道现在揭晓
带你了解:印度阿昔替尼价格约1900元一盒!2025靶向药印度阿昔替尼多少钱一盒价格折合人民币约1900元一盒(5mg60粒)代购在哪里买孟加拉印度阿昔替尼价格(Axitinib)代购费用yb价格购买
头条:印度格列卫代购消息爆料在哪里买购买渠道一览表,2025国内代购印度格列卫价格多少钱一盒?
急用钱必看-DY月付额度怎么套出秒到!