,,

海螺AI：30秒就能完美復(fù)刻你的聲音，這就是當(dāng)今最強(qiáng)的中文AI語(yǔ)音克隆

當(dāng)前位置：點(diǎn)晴教程→知識(shí)管理交流 →『技術(shù)文檔交流』

admin

2025年1月6日 21:21 本文熱度 107

中文，在AI世界，好像突然一夜崛起了。

一直以來(lái)，AI繪圖和AI聲音，都有類似的痛點(diǎn)：

無(wú)法直出中文海報(bào)，以及克隆的中文聲音幾乎沒(méi)法聽。

而前者，隨著上周的即夢(mèng)v2.1，得到了很好的解決。后者，過(guò)往有N多產(chǎn)品試圖去解決，但是解決的都很差。

閉源的有11labs，英文強(qiáng)到爆炸，中文幾乎沒(méi)法聽總是一股子大佐味。開源的，有F5、GPT-sovits、ChatTTS等等，但是不僅本地部署使用困難，出來(lái)的情緒說(shuō)實(shí)話，也不咋地。

而這個(gè)周末，中文的語(yǔ)音克隆痛點(diǎn)，我發(fā)現(xiàn)，被解決了。

幸福來(lái)的如此突然。

我直接給大家聽一段我用克隆的AI唐國(guó)強(qiáng)老師，念滿江紅的語(yǔ)音。

震撼的我頭皮發(fā)麻。

玩了將近2年的AI聲音了，我也是第一次見，能用中文念詩(shī)，念的如此情緒飽滿的AI聲音。

而這，僅僅只需要，30秒的音頻素材就可以。

給我30秒，我就可以，偷走你的聲音。

這個(gè)AI語(yǔ)音，來(lái)自MiniMax的海螺AI。

嗯，就是那個(gè)把人物情緒表演拉滿，在海外AI視頻圈大殺特殺的海螺AI。

周末我打開海螺AI，準(zhǔn)備跑幾個(gè)case視頻的時(shí)候，意外的發(fā)現(xiàn)，他們悄悄的居然在海外版上線了Audio模塊。

今年1月我就寫過(guò)一篇海螺AI聲音克隆的文章，但是那時(shí)候，只能在AI助手上，克隆你自己。

而現(xiàn)在，可以克隆任何人了。

在火速體驗(yàn)完以后，我終于可以說(shuō)：

這就是當(dāng)今最強(qiáng)的，AI中文語(yǔ)音克隆，沒(méi)有之一。

一周時(shí)間，AI繪圖和AI聲音，中文世界兩開花。

這兩年，你知道我們是怎么過(guò)來(lái)的嗎。

突然有點(diǎn)淚目，兄弟們，過(guò)年了，真的。

海螺AI Audio網(wǎng)址在此：https://www.hailuo.ai/audio

最頂上左邊的就是Audio，剛剛新上的聲音功能，最右邊那個(gè)就是之前爆火的Video。

最爽的是，目前免費(fèi)，不要錢。

海螺AI的Audio用起來(lái)也非常的簡(jiǎn)單，最左邊的側(cè)邊欄，分為兩個(gè)tab。

第一個(gè)是Text to Speech（TTS），也就是你克隆完的聲音模型可以在這個(gè)地方進(jìn)行文字生成音頻了。

第二個(gè)就是Voices，可以在里面進(jìn)行聲音的克隆。

我做個(gè)case，給大家詳細(xì)演示一下。

我們先進(jìn)入到Voices頁(yè)面。

直接點(diǎn)那個(gè)“創(chuàng)建您的聲音克隆”按鈕，目前每個(gè)人可以免費(fèi)創(chuàng)建3個(gè)聲音。

你可以上傳語(yǔ)音，也可以直接錄音。

上傳的語(yǔ)音最少上傳10s的音頻片段就可以克隆了，不過(guò)這個(gè)樣本其實(shí)不是特別夠，所以我一般推薦音頻素材最好在30s左右，當(dāng)然你也可以更長(zhǎng)，不過(guò)一般不需要超過(guò)5分鐘。

這里我直接去B站，扒了一段唐國(guó)強(qiáng)老師在《三國(guó)演義》里面的朗誦片段。

扒出來(lái)的聲音素材是這樣的，你們可以聽一下。

,50秒

情緒起伏很大，抑揚(yáng)頓挫拉滿，非常完美的原始素材。

直接上傳到海螺AI里面去。

有個(gè)降噪選項(xiàng)，可選可不選，如果你的素材比較純凈干凈，可以不用。開的話可以幫你把一些背景音什么的都剔除掉。

最后需要選一下原始素材的語(yǔ)言，海螺AI支持12種語(yǔ)言，分別是：

中文、粵語(yǔ)、英語(yǔ)、韓語(yǔ)、日語(yǔ)、印尼語(yǔ)、西語(yǔ)、葡語(yǔ)、法語(yǔ)、意大利語(yǔ)、俄語(yǔ)、德語(yǔ)。

你的原始素材的語(yǔ)言是什么樣的，就選什么語(yǔ)言，克隆出來(lái)的聲音模型就會(huì)得到最好的效果，比如我上傳的這個(gè)唐國(guó)強(qiáng)老師的素材是中文的，就選中文就行。

很快，大概只要幾十秒的時(shí)間，唐國(guó)強(qiáng)老師的聲音，就克隆好了。

回到TTS界面。

點(diǎn)擊此位置，就可以切換到剛剛克隆完的唐國(guó)強(qiáng)老師的聲音模型。

我們直接，讓唐國(guó)強(qiáng)老師，來(lái)念一首李白的《將進(jìn)酒》吧。

這首詩(shī)我太喜歡了，《長(zhǎng)安三萬(wàn)里》李白那一段上天入地，駕鶴登仙的演繹，更是將這首詩(shī)在我心中的地位，推向了最巔峰。

我們直接把《將進(jìn)酒》的最后一段扔進(jìn)去。

“主人何為言少錢，徑須沽取對(duì)君酌。五花馬，千金裘，呼兒將出換美酒，與爾同銷萬(wàn)古愁?！?/strong>

海螺有個(gè)非常牛逼的點(diǎn)是，可以支持切換情緒。

目前有六種情緒：開心、生氣、悲傷、驚訝、恐懼、厭惡。

《將進(jìn)酒》的最后一段，在我的認(rèn)知里，雖然一種憤慨，有一種激昂，但是底層情緒，確是悲涼的。

我只要一瞬，卻也要讓這世間，看到我這一瞬的光輝。

所以，在海螺AI的情感選擇上，我選了悲傷。

點(diǎn)擊生成，幾秒鐘的時(shí)間，一段語(yǔ)音，就出現(xiàn)在了你的面前。

唐國(guó)強(qiáng) 將進(jìn)酒,數(shù)字生命卡茲克,18秒

為了更加形象的展示，我把這段音頻做了個(gè)照片驅(qū)動(dòng)對(duì)口型，視頻看起來(lái)更直觀一些。

又比如，我們可以再克隆一個(gè)林黛玉的聲音。

讓她來(lái)催一催鮮蝦包。

這聲音，直接人麻了。

林黛玉的聲音和情緒，都被還原到了極致。

而這句話，如果讓11labs克隆林黛玉的聲音來(lái)念呢，我給你們聽一下，有多么的鬼畜。

林黛玉11labs,數(shù)字生命卡茲克,2秒

這就是我在文章開頭，說(shuō)的一股子大佐味。

不是說(shuō)11labs不好，11labs一直以來(lái)是世界上公認(rèn)的最強(qiáng)的AI聲音產(chǎn)品，但是在中文表現(xiàn)上，真的是沒(méi)法用的狀態(tài)。

而這一次，海螺AI挺身而出，終于，補(bǔ)足了中文領(lǐng)域幾乎是空白的短板，把中文的聲音克隆的音色相似度和情緒，推上了巔峰。

成功率也極高，我想說(shuō)的是，我上面所有的case，全部是一遍直出，沒(méi)有抽過(guò)一次卡，這點(diǎn)，真的難能可貴。

再給大家看一個(gè)影視颶風(fēng)TIM的例子。

影視颶風(fēng)是我最喜歡以及最崇拜的頻道，沒(méi)有之一。相信看過(guò)影視颶風(fēng)的觀眾也都無(wú)數(shù)次聽過(guò)TIM那句：

“Hello大家好，我是TIM，歡迎收看影視颶風(fēng)?！?/strong>

而這一次，我們讓AI來(lái)說(shuō)這句話，讓大家聽聽，海螺AI的復(fù)刻有多么的強(qiáng)。

注意，為了避免擬合，所以我在上傳到海螺AI的30秒TIM的素材里，是沒(méi)有這句開場(chǎng)白的，都是他在聊一些別的東西。

AI直出如下，讓李四維化身TIM：

跟我記憶中已經(jīng)聽過(guò)無(wú)數(shù)次的TIM的開場(chǎng)白，沒(méi)有任何區(qū)別。

這就是現(xiàn)在海螺AI，能達(dá)到的程度。

這就是現(xiàn)在，最強(qiáng)的AI中文聲音克隆，沒(méi)有之一。

作為一個(gè)見證了這兩年AI發(fā)展的親歷者，這一周的感受格外強(qiáng)烈。

從即夢(mèng)讓中文海報(bào)一夜之間"通關(guān)"，到海螺AI讓中文語(yǔ)音克隆達(dá)到了前所未有的高度，我仿佛看到了中文AI能力的爆發(fā)時(shí)刻。

想想兩年前，我們還在為中文大模型和國(guó)際巨頭的差距而焦慮。

那時(shí)的AI世界，幾乎是英語(yǔ)的獨(dú)角戲。

中文的存在感，就像是一個(gè)可有可無(wú)的配角。

但現(xiàn)在，這個(gè)局面正在被改寫。

當(dāng)我們能用AI輕松制作出中文海報(bào)，當(dāng)唐國(guó)強(qiáng)老師的聲音能被完美克隆，當(dāng)林黛玉的語(yǔ)氣都能被精準(zhǔn)還原。

也許，這就是屬于中文世界的AI時(shí)代的序章。

而這一切，才剛剛開始。

閱讀原文：原文鏈接

該文章在 2025/1/7 11:46:14 編輯過(guò)

關(guān)鍵字查詢

中文

聲音

秒

相關(guān)文章

正在查詢...

點(diǎn)晴ERP是一款針對(duì)中小制造業(yè)的專業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國(guó)內(nèi)大量中小企業(yè)的青睞。

點(diǎn)晴PMS碼頭管理系統(tǒng)主要針對(duì)港口碼頭集裝箱與散貨日常運(yùn)作、調(diào)度、堆場(chǎng)、車隊(duì)、財(cái)務(wù)費(fèi)用、相關(guān)報(bào)表等業(yè)務(wù)管理，結(jié)合碼頭的業(yè)務(wù)特點(diǎn)，圍繞調(diào)度、堆場(chǎng)作業(yè)而開發(fā)的。集技術(shù)的先進(jìn)性、管理的有效性于一體，是物流碼頭及其他港口類企業(yè)的高效ERP管理信息系統(tǒng)。

點(diǎn)晴WMS倉(cāng)儲(chǔ)管理系統(tǒng)提供了貨物產(chǎn)品管理,銷售管理,采購(gòu)管理,倉(cāng)儲(chǔ)管理,倉(cāng)庫(kù)管理,保質(zhì)期管理,貨位管理,庫(kù)位管理,生產(chǎn)管理,WMS管理系統(tǒng),標(biāo)簽打印,條形碼,二維碼管理,批號(hào)管理軟件。

點(diǎn)晴免費(fèi)OA是一款軟件和通用服務(wù)都免費(fèi)，不限功能、不限時(shí)間、不限用戶的免費(fèi)OA協(xié)同辦公管理系統(tǒng)。

日韩欧美国产精品免费一二-日韩欧美国产精品亚洲二区-日韩欧美国产精品专区-日韩欧美国产另-日韩欧美国产免费看-日韩欧美国产免费看清风阁

海螺AI：30秒就能完美復(fù)刻你的聲音，這就是當(dāng)今最強(qiáng)的中文AI語(yǔ)音克隆

海螺AI：30秒就能完美復(fù)刻你的聲音，這就是當(dāng)今最強(qiáng)的中文AI語(yǔ)音克隆