AI 一键为你成音乐,人人皆可成为作曲家
在今年一月份的时候,Google 正式对外发布了 MusicLM,一款实验性 AI 工具,可快速将文本生成一段美妙动听的音乐。
比如,用户填入「晚宴上的深情爵士乐」提示词,MusicLM 便会生成两个歌曲版本,供你选择。Google 会通过你做出的选择,用于改善并持续优化模型。
早些时候,该产品仍在封闭开发,不过,现在已经正式发布了,所有用户可通过 Google AI Test Kitchen 进行申请,加入候补名单,通过后便可试用。
不论是生成的音频质量,还是文本描述的遵循,其质量都要远高于之前的系统。
不仅如此,为了让更多人可以加入 AI 生成音乐领域,Google 还发布了 MusicCaps。一个由 5.5k 音乐文本对组成的数据集,其中包含由人类专家提供的丰富文本描述。
基于现有 AI 在文本生成领域的出色表现,我相信接下来也能开始在音乐领域,看到它展现出惊人一面。
在可预计的未来几个月,各类 AI 工具与产品将会开始出现一波大爆发,无数的全栈工程师正在用自己富有创意的大脑,借助 AI 的能力改变世界。
无论是企业办公、电商设计、市场营销,都已经开始出现 AI 的身影。在接下来的新科技时代, AI 将无处不在。
数据统计
相关导航

ChatTTS 是一个在 GitHub 上广受欢迎的开源文本转语音(Text-to-Speech, TTS)模型,专门为对话场景设计。它支持中英文双语,能够生成高质量、自然流畅的语音,适用于大型语言模型(LLM)助手的对话任务、对话式音频和视频介绍等应用。ChatTTS 的语音合成能力得益于其大规模的数据训练。其主要模型使用了大约100,000小时的中英文数据进行训练,这使得它能够准确捕捉语音的细微变化,生成逼真的语音效果。此外,项目团队还计划开源一个经过40,000小时数据训练的基本模型,这将有助于学术界和开发人员社区的进一步研究和开发。ChatTTS 的核心功能包括多语言支持、细粒度控制(如加入笑声、停顿和语气词)以及预训练模型的支持,这些特性使得它在语音合成领域表现出色。通过这些功能,ChatTTS 不仅能够生成自然流畅的语音,还能实现个性化配音,满足不同应用场景的需求。ChatTTS 是一个功能强大且灵活的开源文本转语音模型,适用于多种对话场景和应用,其高质量和自然的语音合成能力得到了广泛认可和应用。