阿里 HappyHorse 1.1 今日发布!五大维度全面升级

更新日期:2026-06-22

来源:系统之家

  Win10d 小编 6 月 22 日最新消息,阿里巴巴正式发布视频生成模型 HappyHorse 1.1,这是继 4 月份 1.0 版本上线以来规模最大的一次全面迭代。新版本围绕动态表现力、主体一致性、指令遵循、视觉质感和音频能力五大核心维度完成系统性升级。

阿里 HappyHorse 1.1 今日发布!五大维度全面升级

  在技术规格上,HappyHorse 1.1 与 1.0 版本一致,单次生成时长 3 到 15 秒,支持 720p 和 1080p 分辨率和自由宽高比。

  即日起,HappyHorse 联合虎鲸文娱集团举办“Horsepower”AI 影像大赛,优胜者将获百万商单合作,由著名导演、制片人张纪中等担任评委,诚邀海内外 AIGC 创作者加入,用户可在 HappyHorse 官网报名。

  HappyHorse 1.1 能力升级官方介绍如下:

  1. 动态表现力显著提升,动作更流畅,运动更有张力

  通过优化运动建模与时序一致性能力,HappyHorse 1.1 进一步提升复杂动作场景下的动态质量,解决部分画面动作迟缓、节奏不足的问题,让人物、物体运动更加自然连贵,呈现更强的视觉张力与力量感。

  2. 主体一致性更强,多源参考融合更精准

  通过强化模型对多源参考国信意的理解与融合能力,HappyHorse 1.1 的多图参考生视频 (R2V) 能力显著提升了生成视频与参考素材之间的一致性,在商品、角色、场景等复杂创作需求下,实现更精准的视觉还原。包括商品细节与品牌元素精准保持、角色与场景灵活组合并保持主体稳定、多分镜与 N 宫格参考理解增强等。

  3. 指令遵循升级,智能叙事编排,更懂用户输入

  通过强化长上下文语义理解、场景规划能力与角色关系建模,HappyHorse 1.1 显著提升了复杂 Prompt 下的指令遵循能力与镜头编排稳定性,能够更准输地理解用户创作意图,并完成多场景、多角色的连贯演绎。无论是简短描述还是复杂叙事输入,模型都能生成更加丰富、自然且符合预期的视觉表达。

  4. 视觉呈现质量升级,更细腻、真实的视觉质感

  通过优化人物细节生成、真实肤质还原与鏡头语言理解能力,HappyHorse 1.1 全面提升了画面质感、人物表现力与多镜头叙事连贯性。在人物表现上,模型进一步优化面部细节生成,降低过度锐化、油光感和涂抹感,让皮肤呈现更自然真实的质感;同时增强细节刻画的分寸感,在保留痘印、法令纹、毛孔等真实特征的基础上,避免细节过度放大。针对短剧、广告等高质量内容生产场景,HappyHorse 1.1 显著提升了人物特写镜头的表现力,并增强对正反打、跟拍等专业镜头语言的理解,让多镜头衔接、节奏编排与叙事表达更加自然流畅。

  5. 音频表达能力升级,音画同步更精准,声音细节更丰富

  通过优化音频理解与生成能力,以及提升音画同步精度,HappyHorse 1.1 进一步增强了整体视听表达效果,让声音成为内容叙事的重要组成部分。生成过程中,台词表达更加自然,语速、停顿语气能够根据场景与情绪变化进行动态调整;同时提升对 Prompt 中声音描述的理解能力,让背景音乐、环境音效等声音元素更符合创作意图,减少无关音效干扰。此外,音画同步能力进一步增强,有效降低声音与画面动作、剧情节奏之间的错位,让最终作品呈现更真实、更连贯、更具沉浸感的视听体验。

  系统推荐

  1. 如果你是日常工作学习使用,需要家庭版的功能,推荐你下载:Windows11 24H2 X64 官方家庭版(前往下载

  2. 如果你是专业的工作人员,对于数据处理要求较高,建议你下载:Windows11 24H2 X64 专业工作站版(前往下载

  3. 如果你是企业工作人员,对于数据的安全问题和系统的稳定性要求较高,推荐你下载:Windows11 24H2 X64 企业版(前往下载

  4. 如果你是日常使用,想要比较纯净的版本,推荐你下载:Windows11 24H2 X64 最新纯净版(前往下载

  以上是 Win10d 提供的最新资讯,感谢您的阅读,更多精彩内容请关注 Win10d 官网。