券商观点|传媒行业周报:阿里开源全能视频模型,腾讯发布混元图像2.0模型
2025年5月18日,国盛证券发布了一篇传媒行业的研究报告,报告指出,阿里开源全能视频模型,腾讯发布混元图像2.0模型。
报告具体内容如下:
行情概览:本周(5.12-5.16)中信一级传媒板块下跌0.67%。本周传媒板块受市场影响下跌。2025年传媒弹性方向看好AI应用、IP变现及并购重组,AI应用聚焦新应用的映射投资及部分较成熟应用的数据跟踪,重点关注多模态产业方向。IP变现聚焦有IP优势及全产业链潜力的公司,潮流玩具、影视内容等方向有机会。并购重组重点关注国企方向,在国资委明确国企市值考核的背景下,传媒国企诉求明显提升,部分国企资金优势明显。 板块观点与关注标的:1)资源整合预期:中视传媒(600088)、国新文化、广西广电(600936)、唐德影视、吉视传媒(601929)、游族网络(002174)等;2)AI:荣信文化(301231)、奥飞娱乐(002292)、汤姆猫(300459)、盛天网络(300494)、中文在线(300364)、易点天下(301171)、视觉中国(000681)、盛通股份(002599)、焦点科技(002315)、豆神教育(300010)、世纪天鸿(300654)、佳发教育(300559)等;3)游戏:建议关注确定性强的神州泰岳(300002)、恺英网络(002517)、巨人网络(002558)、吉比特(603444),关注完美世界(002624)、ST华通(002602)、冰川网络(300533)、华立科技(301011);4)国企:慈文传媒(002343)、皖新传媒(601801)、中文传媒(600373)、南方传媒(601900)、凯文教育(002659)、大晟文化等;5)教育:学大教育(000526)等;6)港股:关注【阿里巴巴】【腾讯控股】【泡泡玛特】,产业爆发在即的【阜博集团】,K12教培龙头【新东方】及业绩弹性较大的区域龙头【思考乐教育】【卓越教育】。 【阿里最新开源(300109)通义万相Wan2.1-VACE,精通生成编辑等功能】5月15日,阿里在北京发布了最新开源的通义万相Wan2.1-VACE模型。该模型在视频生成与编辑领域表现卓越,号称业界功能最全,并且消费级显卡即可运行(1.3B版本支持480p分辨率,14B版本支持480p和720p分辨率)。Wan2.1-VACE提供基础的文生视频、图生视频、视频生视频等能力,并集成了编辑功能,如局部抹除或替换、视频重绘、时长或背景延展等。此外,该模型已在GitHub、HuggingFace和魔搭社区上线,支持用户进行本地部署。
【腾讯发布混元图像2.0模型,首次实现毫秒级响应】5月16日,腾讯在北京发布了混元图像2.0模型。该模型首次实现了毫秒级响应的实时文生图功能,用户描述场景时,模型可同步生成图像,极大提升了生成效率。此外,该模型还具备实时绘画板功能,用户通过手绘草图结合文字说明即可创建图像。模型支持语音输入、参考图上传,并能优化生成的图像。技术上,混元图像2.0通过增大模型尺寸、采用高效图像编解码器、适配多模态大语言模型及强化学习后训练等手段,显著提高了图像生成的真实感和语义遵从能力。
【字节发布Seed1.5-VL多模态推理模型,在60个主流基准测试中拿下38项第一】5月14日,字节跳动在北京发布了轻量级多模态推理模型Seed1.5-VL。该模型在60个主流基准测试中拿下38项第一,展现了强大的多模态推理能力。Seed1.5-VL采用532M视觉编码器和200亿活跃参数的语言模型架构,在复杂谜题推理、图表理解、3D空间理解等方面表现出色。该模型还擅长处理Agent任务,在GUI界面操作和游戏场景中优于其他顶尖模型。模型训练通过多样化数据和多阶段训练优化,支持多种图像分辨率输入,并引入时间戳标记增强时间信息感知。此外,字节还开发了优化技术以支持大规模预训练和后训练,显著提高训练吞吐量并降低硬件成本。模型目前可在HuggingFace在线体验。
风险提示:政策监管风险,竞争加剧风险,宏观环境不确定性风险。
更多机构研报请查看研报功能>>
声明:本文引用第三方机构发布报告信息源,并不保证数据的实时性、准确性和完整性,数据仅供参考,据此交易,风险自担。
0人