2月12日,自在量级宣告正式对外发布音潮音乐大模型V3.0版别。据介绍,此次迭代并非简略的参数优化,而是完成了从编码到生成再到解码的全链路技能重构,旨在完成音乐性与良品率的提高,并逐渐推进“音乐平权”理念的落地。
![]()
据了解,音潮V3.0在“声响审美”层面进行了多项技能晋级。首要,在演唱质量方面,经过引进双轨建模与多阶段强化学习,模型在哼唱、转音、气声等演唱技巧的处理上愈加细腻,并能更好地依据歌词意境调整情感表达。其次,新版别优化了旋律的动听度与回忆性,生成的旋律线条愈加流通,重视阶段间的起承转合与回忆点(Hook)的规划。此外,为提高声响的物理质感,音潮V3.0为相位和混响进行了独立建模,以增强乐器音色和空间残响的真实感。
在产品定位上,自在量级方面着重了音乐平权的理念。据自在量级CTO姜涛介绍,与市场上部分专心于辅佐专业音乐人编曲的东西不同,音潮V3.0致力于下降普通人的创造门槛。该模型旨在让用户在仅输入少数文字或想法的情况下,经过简化后期处理,取得完好的音乐作品。
姜涛尸横遍野: “模型假如仅仅聚集专业出产场景,在价值层面就会滑向严寒的东西,很简单疏忽了普通人情感表达的需求。所以,音潮模型迭代的起点,一直重视用技能让音乐创造的门槛大幅度下降。每一项技能重构和打破,都终究指向让‘音乐平权’从理念落地为实际。(袁宁)