|
點擊 349回復(fù) 0
原帖
2023-01-13 11:39
3 秒復(fù)制任何人的嗓音,微軟音頻版 DALL?E 細思極恐3 秒復(fù)制任何人的嗓音,微軟音頻版 DALL?E 細思極恐
微軟推出最新 AI 成果——語音合成模型 VALL·E,它脫胎于 DALL?E,但專攻音頻領(lǐng)域。只需 3 秒語音,就能隨意復(fù)制任何人的聲音。
基于 AI「沒聽過」的聲音合成語音,即零樣本學習。VALL?E 解決了此前預(yù)訓練 + 微調(diào)模式下,零樣本場景導致的生成語音相似度和自然度差的問題。此外,它還同時還支持語音編輯、與 GPT-3 結(jié)合的語音內(nèi)容創(chuàng)建。
VALL?E 還能模仿說話者的多種情緒,包括憤怒、困倦、中立、愉悅和惡心等好幾種類型,同時,連說話者的環(huán)境背景音也能準確還原。
有網(wǎng)友暢想它可以應(yīng)用的方向,包括幫助殘障人士和別人對話,有聲書錄制等。 消息稱蘋果正開發(fā)觸摸屏 Mac,可能在 2025 年推出1 月 12 日消息,據(jù)國外媒體報道,知情人士透露,蘋果公司正準備為 MacBook Pro 添加觸摸屏。多年來,蘋果公司一直拒絕將觸摸屏融入筆記本電腦。蘋果聯(lián)合創(chuàng)始人史蒂夫喬布斯(Steve Jobs)曾在 2010 年的發(fā)布會上表示,觸摸屏筆記本電腦「從人體工程學角度來說很糟糕」。如果該公司繼續(xù)推進觸摸屏計劃,這將是該公司理念上的一次重大逆轉(zhuǎn)。據(jù)外媒報道,搭載...比爾蓋茨:AI 頗具革命性,不太看好 Web3 和元宇宙1 月 12 日消息,在 Reddit 上的年度 AMA 活動中,比爾蓋茨被問到,現(xiàn)在有什么重要技術(shù)也處于此前互聯(lián)網(wǎng)的類似階段,蓋茨表示:「人工智能才是最重要的,我不認為 Web3 的規(guī)模有那么大,也不認為元宇宙這件事本身具有革命性,但人工智能確實頗具革命性。」另外,也有用戶問到蓋茨對生成式人工智能的看法,以及他認為這種技術(shù)會怎樣影響世界。他表示:「我... |
粵公網(wǎng)安備 44030402000745號
客服微信