分享
第14期 AI行业周报(2024-9.16-22)
输入“/”快速插入内容
第14期 AI行业周报(2024-9.16-22)
飞书用户2749
飞书用户9849
2024年10月21日修改
阿里云正式发布Qwen2.5系列开源模型
本周,阿里云在云栖大会上发布了新一代开源模型Qwen2.5系列。
其中包括一款名为Qwen2.5-72B的开源大模型。这一新模型以其72亿参数的规模,实现了对业界顶尖的Llama3.1-405B模型的跨量级超越,展现了卓越的性能。
Qwen2.5-72B在多个权威测评基准中均取得了优异的成绩,其指令跟随版本在通用知识、代码能力和数学能力方面展现了全面领先。
此外,Qwen2.5系列模型的开源,为全球开发者提供了一个庞大的模型生态,涵盖了语言模型、视觉语言模型、编程模型、数学模型等多个领域。累计上架超过100个模型,形成了一个强大的模型族群。这些模型的开源,不仅满足了开发者对多样化场景的需求,也推动了整个AI行业的创新和发展。
随着开源大模型的持续投入和创新,阿里云正推动技术与产业的全连接,开辟改变物理世界的新道路,为一个更加智能、开放的AI时代的到来做出贡献。
可灵AI推出全新1.5版本,持续坐稳第一梯队!
可灵AI——快手旗下的视频生成大模型,它在短时间内迅速迭代升级。在本周,推出了最新的1.5版本!1.5版本在图像质量、美学表现、运动合理性以及语义理解方面都有显著提升。新版本支持更高的视频分辨率,达到1080p。同时引入了“运动笔刷”功能,这极大的增强了视频编辑能力。
自今年6月发布以来,可灵AI已经进行了9次迭代和升级,反映其在视频生成领域的激烈竞争中不断进步。它能够根据用户提供的简单文字描述,就能轻松生成高质量的视频内容,甚至可以从静态图像中生成动态视频。可灵AI的1.5版本在处理复杂场景和人物细节方面表现极为出色,例如在视频中生成同方向行走的人群,以及在人物特写中更精细地刻画面部轮廓和表情。
此外,新版本还提升了对物理世界理解的深度,能够生成更加真实的动态效果。快手对可灵AI的持续投资和快速迭代表明其对AIGC工具的重视。随着新功能的推出和性能的提升,可灵AI有望成为内容创作者和普通用户手中的强大工具!而这正使它持续处于国内文生视频的第一梯队。
知名文生音乐模型Suno再整花活,推出重磅功能——Covers
全球知名的文生音乐模型Suno再整花活,它推出了一项名为“Covers”的重磅功能。
它能够让用户一键翻唱任意风格的歌曲。无论是上传现成的音乐作品,还是仅提供一段声音样本,Suno的Covers功能都能识别歌曲的关键元素,如乐谱、乐器、节奏和旋律,并按照用户选择的新风格进行翻唱。
这项技术不仅保留了原歌曲的核心部分,还能呈现出全新的风格,类似于让ChatGPT模仿特定作者的写作风格来创作内容。Suno的Covers功能支持多种风格的音乐创作,从流行到摇滚,从古典到R&B,都能通过AI技术轻松实现风格转换。
用户对这项新功能反响热烈,认为它将彻底改变音乐行业。Suno的Covers功能被视为音乐创作的强大工具,无论是对专业音乐制作人还是普通音乐爱好者,都能提供极大的便利和灵感。
目前,Covers功能已向Suno的Pro和Premier订阅用户开放,尽管仍处于早期测试阶段,但其潜力已经得到了广泛认可。
Suno的Covers功能不仅能够提升音乐制作的效率,还能够帮助用户探索和尝试不同的音乐风格,这将为音乐创作带来全新的体验。随着该功能的不断迭代和完善,预计未来将在音乐产业中发挥更大的作用。
阿里巴巴推出通义万相AI视频,开启多风格AI视频生成新时代
本周,阿里巴巴集团推出了一款名为“通义万相AI视频”的免费AI视频生成工具。该工具支持文生视频和图生视频两种创作方式。
用户可以提供文字提示词或图片,AI将据此自动创作出具有影视级画面质感的高清视频,视频时长最长可达6秒。该工具支持多种艺术风格,包括古风、科幻、动画等,并特别优化了对中式元素的理解和表现。
通义万相AI视频的主要功能包括: