第19頁
書迷正在閱讀:嫡枝為上、浪漫愛情、穿書后我成了錦鯉影帝、宮廷生存紀(jì)事、[HP]藍(lán)魂、何以聲聲慢、小桃的春天、豪門嬌妻、愛與死(西幻)、毀了他
據(jù)說它最初是給音樂行業(yè)錄制小樣的,但是發(fā)行之后問津者寥寥。制作方一拍腦門,開了個(gè)腦洞:“我們不做音樂軟件,做虛擬歌姬?!庇纱?,初音未來誕生,虛擬偶像概念進(jìn)入人們的視線。 謝晉說:“設(shè)計(jì)軟件框架的時(shí)候,我們對比了幾款竟品,其中最普及的是vocaliod和utau。它們的實(shí)現(xiàn)原理差不多,預(yù)先錄制人聲,對人聲排列組合,再加上音調(diào),組成一支歌曲。” “我們扒了兩款軟件的框架,最后還是決定,放棄這種純機(jī)械式合成,改為仿生式的。也就是基于機(jī)器學(xué)習(xí)算法的AI軟件,我們把它命名為,電子聲帶?!?/br> “因?yàn)闆]有先例,研發(fā)期非常困難,不過第一個(gè)版本出來之后,給了人相當(dāng)大的驚喜。制作出來的成曲,最差也能達(dá)到歌姬級別?!彼c(diǎn)了一下鼠標(biāo),對樓清焰說,“董事長,來聽聽它說的第一句話吧?!?/br> 音響里傳出一個(gè)清朗的男聲。 “hello,world.” 樓清焰頓時(shí)發(fā)現(xiàn):“這是我的聲音?” “這是大家投票決定的。”謝晉揶揄地看過來。 不知為何,被點(diǎn)破心思之后,他反倒覺得樓清焰有點(diǎn)親切。 “還行,挺自然的?!?/br> “這是AI算法的功勞?!敝x晉說,“我們設(shè)計(jì)了一種深度學(xué)習(xí)算法,軟件會對音源庫進(jìn)行特征提取,用提取出來的特征信息進(jìn)行訓(xùn)練,最終,為每組音源庫生成獨(dú)一無二的數(shù)據(jù)模型?;谶@個(gè)模型,合成語音會自然許多?!?/br> “這還不是最理想的。最理想的那種合成語音,不用組合人聲,是憑借AI算法的高智能,憑空生成聲音。不過……” “不過你們沒這個(gè)技術(shù)。”樓清焰說。 他想了想,描述道:“聲音的本質(zhì)是震動,在音響里就是膜片的震動,這種震動由電磁場引起,而電磁場的控制方式,是線圈通不通電。通電為1,不通電為0。” “所以,計(jì)算機(jī)聲音的本質(zhì)是一串二進(jìn)制數(shù),是不同排列組合的1和0。這叫做數(shù)字信號。” “最理想的語音合成,不是組合音節(jié),而是直接組合數(shù)字信號。” 樓清焰:“我說的對嗎。” 謝晉實(shí)實(shí)在在地驚訝了。 他一直以為樓清焰是個(gè)不學(xué)無術(shù)的紈绔,就算所有人都搞懂了計(jì)算機(jī)原理,他也不可能搞懂的那種。 沒想到他真的懂。 樓清焰還沒說完,他繼而道:“理論上,AI軟件通過深度學(xué)習(xí),可以掌握數(shù)字信號的規(guī)律,構(gòu)建一個(gè)數(shù)據(jù)模型,再基于模型生成語音?!?/br> “但是,這需要一個(gè)大前提——機(jī)器學(xué)習(xí)算法能直接從數(shù)字層做特征提取?!?/br> 他問道:“能嗎?” 謝晉服了,這人為啥總是一下子問到最關(guān)鍵的地方。 “現(xiàn)在確實(shí)沒這個(gè)技術(shù)。我們設(shè)計(jì)的特征提取算法,主要瞄準(zhǔn)聲音的波形表現(xiàn),頻率、相位這些?!彼唵蔚卣f。 樓清焰又說:“不止缺這一個(gè)技術(shù)吧。做了特征提取,知道怎么歸納總結(jié)嗎?知道怎么訓(xùn)練模型嗎?會寫算法嗎?設(shè)想過這個(gè)計(jì)算量有多龐大嗎?” 謝晉:“……” 樓清焰發(fā)覺有點(diǎn)說過了,遂拍拍他肩膀,鼓勵道:“不過你們已經(jīng)做得很好了,能達(dá)到這個(gè)程度非常了不起……嗯,下一步工作是什么?” 謝晉:“……”看出來你是在敷衍了。 “軟件的構(gòu)造有點(diǎn)臃腫,只有在工作站上才能流暢運(yùn)行,下一步先考慮優(yōu)化問題?!?/br> “好的?!睒乔逖嬉簿褪请S口一問。 他不在意軟件本身,得知已經(jīng)有了AI語音合成的雛形,他來這趟的目的就已經(jīng)達(dá)成了。 謝晉研發(fā)的這款電子聲帶,其實(shí)還是提前錄制人聲,再進(jìn)行排列組合。只不過基于AI算法訓(xùn)練的數(shù)據(jù)模型,會對音頻波形進(jìn)行修改,讓聲音變得流暢自然,更加真實(shí)。 這款軟件的局限性在于算法。音頻領(lǐng)域的特征提取沒有可參考前例,謝晉團(tuán)隊(duì)必須把數(shù)字音頻研究透徹,然后基于其特性設(shè)計(jì)新算法——不僅是邏輯框架,還包括萬惡的數(shù)學(xué)模型。這可不是一朝一夕能搞出來的。 但是樓清焰呢,他腦子里有現(xiàn)成的。 在星際時(shí)代,聲音合成是一項(xiàng)非常普及的技術(shù),宇宙人早就可以在編碼層面生成各種聲音,還出現(xiàn)了一種新職業(yè),叫音頻作家。 類比于文學(xué)作家,音頻作家就是直接創(chuàng)作廣播劇的那種。 聲音合成算法,是入門智械編程學(xué)習(xí)的一個(gè)啟蒙案例??梢娝唵蔚绞裁闯潭?。在地球上也可以實(shí)現(xiàn),條件是幾套新的數(shù)學(xué)模型,一臺大型計(jì)算機(jī)。 佳輝就有大型計(jì)算機(jī),用作app服務(wù)器的,暫時(shí)關(guān)停服務(wù)器來計(jì)算軟件,好像也沒什么大不了的。 樓清焰只有一個(gè)人,不可能寫出一個(gè)完整的軟件,不過他有謝晉的代碼基礎(chǔ),只要實(shí)現(xiàn)了那幾個(gè)數(shù)學(xué)模型,用大型計(jì)算機(jī)快速完成機(jī)器學(xué)習(xí)運(yùn)算,就可以達(dá)成他的目的。 嗯,他只是想讓樓皓宸“說”幾句話而已。 謝晉不知道他老板正在醞釀多么黑暗的犯罪過程,他看著樓清焰,心里已經(jīng)對他完全改觀了。 龍困淺灘,虎落平陽,卻顯得從容自若。落魄時(shí)不露難色,面對員工的消極嘲諷,姿態(tài)依舊那么強(qiáng)硬。他懂計(jì)算機(jī),懂智能技術(shù),并不是大家以為的那種不學(xué)無術(shù)的廢物。最重要的是,他竟然懂他的想法。