卡饭网 > 科技 > 人工智能 > 正文

微软推出最新AI框架,可生成逼真对口型人像视频

来源:卡饭网 作者:夜夜 时间:2024-04-22 09:28:33

卡饭网 4 月 22 日消息,微软公司近日发布新闻稿,正式揭晓了其创新的图生视频技术—— VASA-1 框架。这一 AI 框架仅需凭借一张真实的肖像照片和一段个人语音音频,便能打造出精确且逼真的对口型视频(即生成朗诵文本的视频)。

微软推出最新AI框架,可生成逼真对口型人像视频

当前业界对传统的技术往往会导致生成的面部显得生硬、缺乏可信度,陷入“恐怖谷”现象。而微软的 VASA-1 框架则成功突破了这些限制,研究人员借助了扩散Transformer模型,对面部整体动态和头部运动进行了深入训练。

微软推出最新AI框架,可生成逼真对口型人像视频

该框架在表情和头部动作方面的表现尤为自然流畅。能够注意到各类面部动态,诸如嘴唇动作、面部表情、眼神交流和眨眼等细微行为,一次性生成具有高度细节的人脸。据称,VASA-1框架能够即时生成分辨率为512×512、帧率高达40 FPS的视频。

相关推荐

  • 铭瑄瑷珈主题主板 MS-iCraft B760M CROSS 发布

    卡饭网 5 月 11 日消息,铭瑄科技官方发文宣布,铭瑄首款瑷珈主题主板 MS-iCraft B760M CROSS 正式登场。首款瑷珈主题主板为 245245mm MATX 版型。主板整体和彩盒一样粉蓝配色,贴合偶像瑷珈这一主题。

    主板 2024-05-11
  • 理想汽车宣布 OTA 5.2 即将开启推送

    卡饭网 5 月 11 日消息,理想汽车官方发文宣布,OTA 5.2 即将开启推送,19项新增功能,23项体验优化。AD Pro 3.0是基于地平线征程5芯片首个量产BEV模型架构的智驾方案。

    理想汽车 2024-05-11
  • LG StanbyMEGO 便携电视开售,售价 7999 元

    卡饭网 5 月 11 日消息,LG 推出“旅行箱电视” StanbyMEGO 便携电视,以“闺蜜机”的名义发售,首发到手价 7999 元。 便携手提箱设计,屏幕内置于手提箱中,呈现独特的便携形态使用场景灵活多样,打破空间束缚,无论何时何地相伴随行。

    LG 电视 2024-05-11
  • 华为 Pocket 2 升级到 HarmonyOS 4.2

    卡饭网 5 月 11 日消息,华为手机官方宣布,华为 Pocket 2 已正式升级到 HarmonyOS 4.2,带来全新的楼层级设备查找、小艺美肤顾问、艺术主角、骚扰拦截等能力。

    华为 2024-05-11
  • vivo X100系列预热:vivo蓝海电池+蓝图影像芯片V3+

    卡饭网 5 月 11 日消息,vivo 官方发文预热,全新 vivo X100 系列搭载 vivo 蓝海电池+蓝图影像芯片V3+,5 月 13 日 19:00 影像新蓝图 暨X系列新品发布会,震撼发布。

    vivo 2024-05-11