券商观点|传媒行业周报:阿里开源全能视频模型,腾讯发布混元图像2.0模型

2025-05-19 07:08:43 来源: 同花顺iNews

      2025年5月18日,国盛证券发布了一篇传媒行业的研究报告,报告指出,阿里开源全能视频模型,腾讯发布混元图像2.0模型。

  报告具体内容如下:

  行情概览:本周(5.12-5.16)中信一级传媒板块下跌0.67%。本周传媒板块受市场影响下跌。2025年传媒弹性方向看好AI应用、IP变现及并购重组,AI应用聚焦新应用的映射投资及部分较成熟应用的数据跟踪,重点关注多模态产业方向。IP变现聚焦有IP优势及全产业链潜力的公司,潮流玩具、影视内容等方向有机会。并购重组重点关注国企方向,在国资委明确国企市值考核的背景下,传媒国企诉求明显提升,部分国企资金优势明显。 板块观点与关注标的:1)资源整合预期:中视传媒600088)、国新文化、广西广电600936)、唐德影视、吉视传媒601929)、游族网络002174)等;2)AI:荣信文化301231)、奥飞娱乐002292)、汤姆猫300459)、盛天网络300494)、中文在线300364)、易点天下301171)、视觉中国000681)、盛通股份002599)、焦点科技002315)、豆神教育300010)、世纪天鸿300654)、佳发教育300559)等;3)游戏:建议关注确定性强的神州泰岳300002)、恺英网络002517)、巨人网络002558)、吉比特603444),关注完美世界002624)、ST华通002602)、冰川网络300533)、华立科技301011);4)国企:慈文传媒002343)、皖新传媒601801)、中文传媒600373)、南方传媒601900)、凯文教育002659)、大晟文化等;5)教育:学大教育000526)等;6)港股:关注【阿里巴巴】【腾讯控股】【泡泡玛特】,产业爆发在即的【阜博集团】,K12教培龙头【新东方】及业绩弹性较大的区域龙头【思考乐教育】【卓越教育】。 【阿里最新开源300109)通义万相Wan2.1-VACE,精通生成编辑等功能】5月15日,阿里在北京发布了最新开源的通义万相Wan2.1-VACE模型。该模型在视频生成与编辑领域表现卓越,号称业界功能最全,并且消费级显卡即可运行(1.3B版本支持480p分辨率,14B版本支持480p和720p分辨率)。Wan2.1-VACE提供基础的文生视频、图生视频、视频生视频等能力,并集成了编辑功能,如局部抹除或替换、视频重绘、时长或背景延展等。此外,该模型已在GitHub、HuggingFace和魔搭社区上线,支持用户进行本地部署。

【腾讯发布混元图像2.0模型,首次实现毫秒级响应】5月16日,腾讯在北京发布了混元图像2.0模型。该模型首次实现了毫秒级响应的实时文生图功能,用户描述场景时,模型可同步生成图像,极大提升了生成效率。此外,该模型还具备实时绘画板功能,用户通过手绘草图结合文字说明即可创建图像。模型支持语音输入、参考图上传,并能优化生成的图像。技术上,混元图像2.0通过增大模型尺寸、采用高效图像编解码器、适配多模态大语言模型及强化学习后训练等手段,显著提高了图像生成的真实感和语义遵从能力。

【字节发布Seed1.5-VL多模态推理模型,在60个主流基准测试中拿下38项第一】5月14日,字节跳动在北京发布了轻量级多模态推理模型Seed1.5-VL。该模型在60个主流基准测试中拿下38项第一,展现了强大的多模态推理能力。Seed1.5-VL采用532M视觉编码器和200亿活跃参数的语言模型架构,在复杂谜题推理、图表理解、3D空间理解等方面表现出色。该模型还擅长处理Agent任务,在GUI界面操作和游戏场景中优于其他顶尖模型。模型训练通过多样化数据和多阶段训练优化,支持多种图像分辨率输入,并引入时间戳标记增强时间信息感知。此外,字节还开发了优化技术以支持大规模预训练和后训练,显著提高训练吞吐量并降低硬件成本。模型目前可在HuggingFace在线体验。

风险提示:政策监管风险,竞争加剧风险,宏观环境不确定性风险。

  更多机构研报请查看研报功能>>

  声明:本文引用第三方机构发布报告信息源,并不保证数据的实时性、准确性和完整性,数据仅供参考,据此交易,风险自担。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 三德科技
  • 沃尔核材
  • 电光科技
  • 钧崴电子
  • 金安国纪
  • 长盛轴承
  • 广和通
  • 科泰电源
  • 代码|股票名称 最新 涨跌幅