关于我们

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻公共列表

音乐ChatGPT时刻来了!Suno V3秒生爆歌曲,12人团队创造了非凡的AI

发布时间:2024-03-25 10:06:18

声明:本文来源于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。

【新智元导读】未来的热门歌曲可能会被人工智能承包!最近,人工智能初创公司Suno震惊地推出了V3音乐生成模型,震惊了世界。只需几秒钟就可以生成2分钟美丽的音频。网民们说:音乐ChatGPT时刻来临!

「人类很快就会进入,只听自己用AI做曲子的时代」!

图片

最近,人工智能初创公司Suno AI重磅推出第一款可制作「广播级」音乐生成模型-V3,一度在网上掀起轩然大波。

V3只需几秒钟就能创作出2分钟的完整歌曲。

为激发人们的创作灵感,Suno v3还增加了更丰富的音乐风格和流派选项,如古典音乐、爵士乐、Hiphop、电子等时尚曲风。

图片

最重要的是,它已经免费向所有用户开放!

图片

网友们纷纷上线创作,各种AI生成的歌曲简直让人觉得「颅内高潮」。

在Suno主页上,有一个人工智能生成歌曲的排名,其中排名第一的是C-A-P-Y-B-A-R-A、第二首是Cyberpunk Starter,第三首是中文版「水调歌头」。

图片

接下来,听听这首歌「水调歌头·明月什么时候?」,唱出中国古典美。

水调歌头,新智元,1分钟

还有这首现代音乐「着了魔」,听了之后,真的有一种爱的冲脚。

着魔,新智元,3分钟,

图片

再来一首英文歌Woodss and Wonder。

WoodsandWonder,新智元,1分钟

有人表示,「简直离大谱!Suno AI V3的效果感秒杀一大片歌手,以后还会有原创吗?」?

Suno官员表示,V4已经在开发中,并将在未来推出一些新的功能。

就在这几天,外媒爆料OpenAI正在进入好莱坞,与电影制片人、导演建立合作关系。

图片

此前,就连好莱坞大导演Tyler Perry直言不讳地说,看完Sora制作的视频后,他直接搁置了自己影视工作室8亿美元的扩建计划!

如今,除了电影制作领域,音乐产业也即将被人工智能攻占。

ChatGPT音乐时刻来了!

Suno V3诞生后,很多网友表示只想听AI写的歌。

图片

网友「向阳乔木」让Claude3写歌词,然后让Suno V3配乐。

图片

给Claude3输入提示,「敲击金属风格,谈古战场的残酷战斗」。

不得不称赞,Claude30opus真的很强大,看完歌词的战场画面就感觉到了。

图片

接着,进入Suno主页,让V3生成配乐。

图片

细品这金属乐的味道,真的很美!

也有网友HylaruCoder填写了《东风破》的歌词。

图片

Suno V3的生成简直就是一样的。

国外网友做了一个AI工具大联动,Midjourney生图,Runway让它动起来,最后让Suno配乐。

图片

再听一首日语版的AI歌,pika还配了视频,绝子!

开发者Leeoxiang使用「将近酒」生成一首歌,并感慨地说,「如果有这么好听的《近酒》,小时候背唐诗也不会那么痛苦。」。

图片

现代版的「将近酒」,一起听。

近酒,新智元,1分钟

周董的「夜曲」翻版,也很好听。

图片

夜曲,新智元,2分钟

Perplexity 人工智能首席执行官表示,这是下一个人工智能独角兽。持怀疑态度的人会说这是一个加油站。客观事实是惊人的迭代速度、声音和音质,以及越来越多地使用Suno而不是Spotify的习惯。

图片

网友Yangyi总结了Suno从9月30秒音频生成到现在的2分钟,AI在半年内发生了翻天覆地的变化。

图片

还有人说,「ChatGPT音乐时刻来了」!

图片

只需要几秒钟,就能产生2分优美的音乐

在Suno创造一个任何人都可以通过自然语言无门槛创造音乐的工具。

图片

用户可以用任何语言创作一首歌曲,只用几个简短的单词。

官方声称,许多著名艺术家已经在使用Suno,但Suno的核心用户群仍然是没有任何音乐制作经验的普通人。

他们最近更新了最新的版本v3, 完整的歌曲可以在几秒钟内完成。

与之前的版本相比,v3生成的音乐质量更高,可以制作各种风格和流派的音乐和歌曲。

提示词的连贯性也有了很大的提高,歌曲结尾的质量也有了很大的提高。

此外,随着v3版本的推出,他们还发布了人工智能音乐水印系统。平台生成的每一段音乐都添加了无法识别的声音水印,以保护用户在Suno的创作,打击未来的剽窃,防止Suno产生的音乐滥用。

物理学博士希望每个人都能自己制作音乐

位于麻省剑桥的Suno创始团队,离哈佛校园很近。

Shulman4创始人、Freyberg、Georg Kucsko和Martin Camacho都是机器学习专家。在Suno成立之前,他们在剑桥的一家公司名叫Kensho Technologies公司工作。

图片

Shulman和Martin Camacho都是业余音乐爱好者,他们经常在Kensho工作时一起即兴演奏音乐。

在Kensho工作期间,四人的主要任务是开发一种用于转录上市公司财务报告电话会议的AI语音转录技术。

后来,他们发现人工智能文生图片和文本生成领域的变化似乎没有在音频领域引起任何波澜,所以他们想在这个方向上做点什么。

起初,他们制作了一个名为bark的文本到语音程序。然而,当他们调查早期的bark用户时,他们发现用户真正想要的是音乐生成工具。

所以他们找到了一个真正适合自己的方向。

Suno目前只有12名员工,但现在他们正在扩大规模,他们正在加盖现有临时办公空间的办公空间。

Mikey Shulman

他是Kensho创始团队的机器学习团队负责人。在创立Suno之前,他也是MIT斯隆管理学院的兼职讲师。

图片

他博士毕业于哈佛大学物理专业。

对于Suno来说,他希望世界上有10亿人将来能够通过它来制作自己的音乐。在他看来,能制作音乐的人比想消费音乐的人少得多,这是一种非常不平衡的情况。

然而,音乐生成需要解决一个非常大的困难,那就是音频不像文字那样离散。

声音是一系列波型的连续信号。

根据Shulman的说法,高质量音频的采样率通常是44khz或48khz,这意味着「每秒48000token」。

因此,去年,许多人工智能研究人员认为,即使他们见证了大语言模型和文生图片的爆炸性增长,这些产品在声音领域的出现也可能需要很多年的时间。

Shulman说,他们在走到今天之前,已经找到了很多新的方法和技巧。在未来,他们需要更直观的方法让用户以任何他们想要的方式生成歌曲和音乐。

Martin Camacho

他也毕业于哈佛大学,曾是Kensho的1号员工,是一家四人共同工作的公司的首席架构师。

图片

Georg Kucsko

他的简历几乎和Shullman一模一样,毕业于哈佛大学物理学博士学位,曾在Kensho和MIT斯隆管理学院任职。

图片

Keenan Freyberg

本科毕业于乔治华盛顿大学,后来在多家公司担任运营、产品等职务。

图片

图片

参考资料:

https://twitter.com/op7418/status/1771011983779000494

https://www.rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/


/template/Home/Zkeys/PC/Static