性爱娃娃 三只羊“财色灌音”是假的,但背后时间是果然恐怖。
要说这段时候哪家公司风头正盛,那非三只羊莫属性爱娃娃,隔三差五就要上一趟新闻,照旧法制栏地方那种。
这不前几天,月饼门的事件还没昔日,又来了个灌音门。
事情是这样的, 9 月 20 号的时候网上短暂流传出了一段,疑似三只羊高管卢某的灌音。
灌音里波及到了多位三只羊的女主播,具体实质咱在这就未几作念商议了,但照实很炸裂。。。
灌音爆出来后,就在网上飞速引起了一波热度。有东谈主说这段灌音纯纯是男的喝多了吹的给力,但商议的风向很快又造成了这玩意儿,到底是不是 AI 生成的,以至还钓出来不少所谓的 AI 各人,出手一顿分析。
适度没两天,警方的通报就出来了:王人散散吧,是 AI 干的。
而此次事件的另外一位主角, Reecho 睿声公司也终于浮出了水面,锤了我方的用户一把。
专诚义的是,即使是官方王人露面了,但照旧有网友认为卢某是 " 酒后吐真言 " ,通报也不外是把锅,甩给了没法儿自证的 AI 。
但岂论咋说,东谈主官方访问通报王人出来了,你信也好不信也罢,这事儿就这样定调了。
不外以差评君对 AI 语音的了解,像三只羊灌音门这种情况,的确是有可能的。主如果现阶段的 AI 语音时间,照实如故挺闇练的了。
因为我们只需要上传一两句话,剩下的平直甩给 AI 就行,分分钟就能克隆一个东谈主的音色。
这样说吧,当今 AI 语音合成里相比常见、开源技俩也相比多的,就数 TTS 、 SVC&RVC 两大类时间。
所谓 TTS ,粗造来说等于 Text To Speech ,把文本迤逦谚语音。像许多 AI 数字东谈主、有声书、视频配音,大伙儿刷抖音频频听到的 " 顾惜看,这个男东谈主叫小帅 " ,还有剪映素材库里那些 TVB 女声、广西表哥。。。基本王人是 TTS 干的。
像此次三只羊灌音门牵连到的 Reecho 睿声,亦然一个 TTS 模子的生成网站。我们其实也在他们网站上,克隆过差评君的声优蛋蛋的声息,大伙儿不错听听看到底像不像。
上来先用《 意大利面拌 42 号混凝土 》的 " 名篇节选 " 整一波,你别说,你还真别说。音色的复刻进度能有个 80%-90% ,况且讲话的口吻也贼像,不仔细听还以为在作念什么妥贴科普。
我们蓝本还思借着 AI 差评君给大伙儿送一波福利,但没思到这个 AI 小小翻车了一下, 10 台 iPhone 16 说成了 " 一零台 iPhone sixteen " 。。。穿帮的实在是太解析了,这福利思送王人送不出去呀,可惜可惜。
借 AI 的口,你以至还能听到差评君管深广差友们借债。就连国庆节自发加班 7 天,还不要加班费这种话,从这位 " AI 差评君 " 的嘴里说出来,你也能听出心甘宁肯的滋味。
除此以外,东谈主家阿谁声息阛阓里还不错我方选查考好的声息 AI ,不仅有我们的好一又友影视飓风 Tim ,以至还有主播电棍,坤哥和派蒙,就连五星褒贬家麦克阿瑟也能拿来用。
有一说一,这种进度的克隆如故至极传神了,是以当今回头看三只羊灌音门,好像 AI 参与的着实度又高了小数。而有些一又友可能还认为,那这个 AI 若何就能把那种醉态、浑沌不清的话王人模拟出来呢?
这就得说到 SVC&RVC 了。这内部 SVC ( Singing Voice Conversion )是用来唱歌的,而 RVC ( Retrieval-based-Voice-Conversion )的场景多用在直播,这俩王人是及时把语音改造成 AI 查考的音色,俗称变声器。
由于输入的是音频,是以它就能把一个东谈主的声息迤逦的更信得过,以至连口吻、声调这些东西王人不错迤逦得很当然。如果是歌声改造,以至还能效法音色和唱腔。
像 GitHub 上有个叫 So-Vits-SVC 的开源技俩,就一手打造了AI 孙燕姿、唱《 泪桥 》比原唱伍佰还顺耳的陶喆。
你要懒的我方查考,那还不错在魔搭社区用 " xz 乔希 " 的技俩平直开玩;以至剪映和必剪这些编著软件里王人如故用上了自家的 AI 语音,除了那些营销号语音你也不错生成我方的。
乃至于粗率找个器具蚁集网站一搜,多得是不错平直上手用的家具。
我们之前用 " 花儿不哭 " 开源的 RVC 及时变声算法,也作念过一个差评君变声器。
以至还专门作念了一个相配差评的出手界面。
至于遵守大伙儿自个儿品吧,我打保票,这完全不是隔邻差评君的声优蛋蛋录的。
况且那时我们还专门给变声器作念了个硬件外挂,当今还搁办公室里呢。
东谈主在这边对着麦讲话,音响那里及时就能把声息造成蛋蛋的。
看起来挺给力是吧,不外这玩意也不是短暂就这样先进了。
主要语音生成这一块照实低调,你就说这几年这些 AI 的宣传,一个个王人好像是奔着炸裂全天地去的。三天两端画大饼,谁还驰念语音生成是若何个情况。
在线测速存眷的东谈主少,再加上时间积聚也多,那可不等于闷声发大财嘛。只不外当今短暂出圈了,群众才嗅觉到感喟。
说到底照旧 AI 时间这些东西的门槛王人裁汰了,你思 cos 哪个东谈主的声线王人至极浅显。
不外真话,时间特出是一趟事儿,但避重就轻地说,用这玩意儿来违规人科的案例,并不在少数。
也不是咱制造啥懆急,新华网客岁九月就报谈过了有关的乱来妙技,你思思家里年事大的老东谈主,如果接到跟你讲话声息一模相通的乱回电话,说你际遇了危机,会不会把棺材本王人给骗子骗走?
不啻国内,这事在海外照样有,就连好意思国知名密码管制器具公司 LastPass 的 CEO ,王人被伪造声息拿去乱来了。
尽管当今如故有不少机构在研究若何处理安全问题,探索若何识别伪造语音等凭据,比如有磋磨标明,咫尺不错通过算法声纹认证和语音取证等方针,对 AI 合谚语音进行鉴识。
但这些更多照旧在找 AI 语音上的 bug 来松懈的,就好像数手指和穿模来松懈 AI 图片相通,只好模子一升级,这些方针可能就也没辙了。
不外差评君认为,要从根柢上处理问题,就还得从生成式模子自己开赴。
给 AI 生成的图片、音视频也打上雷同水印的象征,同期诞生和软件也大约检索到这些标签,教导群众这些实质并非信得过。
像是谷歌就如故出手磋磨在 AI 生成的音频声谱上,添加能被视觉化的特定象征,这样既不会影响用户听感也浅显识别。
总的来说,在生成式 AI 的影响下,以后眼见不一定为实,耳听也可能为虚。归根结底时间在发展的同期,防患时间浮滥的对策也必须作念好。
别光思着说 " 时间无罪 " ,上个这样喊的东谈主如故蹲了好多年,当今王人出来了。
不外对三只羊来说,固然始作俑者如故被握,但这东谈主靠 AI 推在他们身上这把劲,揣度影响还会络续挺久,至于后续若何发展,我们照旧再等等看吧。
撰文:西西 & 纳西
性爱娃娃