AI 將可快速分離人聲、各式樂器等音源,Facebook 開源 Demucs 計畫
作者 雷鋒網 | 發布日期 2020 年 03 月 11 日 10:59 |
音樂源分離,是利用技術將一首歌曲分解成它的組成成分,如人聲、低音和鼓,這和人類大腦的工作很類似,大腦可以將一個單獨的對話,從周圍的噪音和一屋子的人聊天中分離出來。
如果你擁有原始的錄音室多軌錄音,這很容易實現,你只需調整混音來分離一個音軌,但是,如果你從一個普通 MP3 檔案開始,所有的樂器和聲音都被混合到一個立體聲錄音中,即使是最複雜的軟體程式也很難精確地挑出一個部分。
Facebook AI 的研究人員已經開發了一個系統,可以做到這一點──精確度高得驚人。
創建者名叫亞歷山大‧笛福茲(Alexandre Defossez),是 Facebook 人工智慧巴黎實驗室的科學家。笛福茲的系統被稱為 Demucs,這個名字來源於「音樂資源深度提取器」,其工作原理是檢測聲波中的複雜模式,對每種樂器或聲音的波形模式建立一個高層次的理解,然後利用人工智慧將它們巧妙地分離。
笛福茲說,像 Demucs 這樣的技術,不僅能幫助音樂家學習複雜的吉他即興重複段落,總有一天,它還能讓人工智慧助理在嘈雜的房間裡更容易聽到語音指令。笛福茲說,他的目標是讓人工智慧系統擅長辨識音頻源的組成部分,就像它們現在可以在一張照片中準確地區分不同的物體一樣。「我們在音頻方面還沒有達到同樣的水平。」他說。
分解聲波的更好方法
聲源分離長期以來一直吸引著科學家。1953 年,英國認知科學家科林‧切爾瑞(Colin Cherry)創造了「雞尾酒會效應」這個詞語,用來描述人類在擁擠嘈雜的房間裡專注於一次談話的能力。
工程師們首先試圖透過調整立體聲錄音中的左右聲道,或調整均衡器設置來提高或降低某些頻率,進而隔離歌曲的人聲或吉他聲。
基於聲譜圖的人工智慧系統,在分離出以單一頻率響起或共振的樂器的音符方面相對有效,例如鋼琴或小提琴旋律。
這些旋律在聲譜圖上顯示為清晰、連續的水平線,但是隔離那些產生殘餘噪音的撞擊聲,比如鼓、低音拍擊,是一項非常艱鉅的任務。鼓點感覺像一個單一的、即時的整體事件,但它實際上包含了不同的部分。對於鼓來說,它包括覆蓋較高頻率範圍的初始撞擊,隨後是在較低頻率範圍內的無音高衰減。笛福茲說,一般的小鼓「就頻率而言,到處都是」。
聲譜圖只能將聲波表現為時間和頻率的組合,無法捕捉到這樣的細微差別。因此,他們將鼓點或拍子低音處理成幾條不連續的垂直線,而不是一個整齊、無縫的聲音。這就是為什麼透過聲譜圖分離出來的鼓和低音軌道,聽起來常常是模糊不清的。
夠聰明的系統來重建缺失
基於人工智慧的波形模型避免了這些問題,因為它們不試圖將一首歌放到時間和頻率的僵化結構中。笛福茲解釋,波形模型的工作方式與電腦視覺相似,電腦視覺是人工智慧的研究領域,旨在讓電腦學會從數位圖像中辨識模式,進而獲得對視覺世界的高級理解。
電腦視覺使用神經網路來檢測基本模式──類似於在圖像中發現角落和邊緣──然後推斷更高級或更複雜的模式。「波形模型的工作方式非常相似」,笛福茲說。他解釋了波形模型如何需要幾秒鐘來適應歌曲中的突出頻率──人聲、低音、鼓或吉他──並為每一個元素生成單獨的波形。然後,它開始推斷更高比例的結構,以增加細微差別,並精細雕刻每個波形。
笛福茲說,他的系統也可以比做探測和記錄地震的地震儀。地震時,地動儀的底座會移動,但懸掛在上面的重物不會移動,這使得附著在重物上的筆可以畫出記錄地面運動的波形。人工智慧模型可以探測到同時發生的幾個不同地震,然後推斷出每個地震的震級和強度的細節。同樣,笛福茲的系統分析並分離出一首歌曲的本來面目,而不是根據預先設定的聲譜圖結構來分割它。
笛福茲解釋,構建這個系統需要克服一系列複雜的技術挑戰。他首先使用了 Wave-U-Net 的底層架構,這是一個為音樂源分離開發的早期人工智慧波形模型。然後他還有很多工作要做,因為聲譜圖模型的表現優於 Wave-U-Net。他透過添加線性單元來微調波形網路中分析模式的演算法參數。笛福茲還增加了長短期記憶,這種結構允許網路處理整個數據序列,如一段音樂或一段視頻,而不僅是一個數據點,如圖像。笛福茲還提高了 Wave-U-Net 的速度和記憶體使用率。
這些修改幫助 Demucs 在一些重要方面勝過 Wave-U-Net,比如它如何處理一種聲音壓倒另一種聲音的問題。「你可以想像一架飛機起飛,引擎噪音會淹沒一個人的聲音」,笛福茲說。
以前的波形模型,透過簡單地移除原始音頻源文件的一部分來處理這個問題,但是它們不能重建丟失材料的重要部分。笛福茲增強了 Demucs 解碼器的能力,「Demucs 可以重新創建它認為存在但卻迷失在混音中的音頻」,這意味著他的模型可以重新合成可能被響亮的鐃鈸聲影響而遺失的柔和鋼琴音符,因為它理解應該呈現什麼樣的聲音。
這種重構和分離的能力使 Demucs 比其他波形模型有優勢。笛福茲說,Demucs 已經與最好的波形技術相匹配,並且「遠遠超出」最先進的聲譜技術。
在盲聽測試中,38 名參與者從 50 首測試曲目中隨機抽取 8 秒鐘進行聽音,這 50 首曲目由 3 個模型分開:Demucs、領先波形、頻譜圖技術。聽眾認為 Demucs 在品質和無偽影(如背景噪音或失真)方面表現最佳。
Demucs 已經引起了人工智慧愛好者的興趣,精通技術的讀者可以從 GitHub 下載 Demucs 的代碼,代碼用 MusDB 數據集來分離音樂源。
笛福茲解釋,隨著 Demucs 的發展,它將為人們在家中創作音樂的數位音頻工作站帶來聲音的真實性。這些工作站提供了能夠喚起特定時代或風格的合成儀器,通常需要對原始硬體進行大量的數位化改造。
想像一下,如果音樂源分離技術能夠完美地捕捉 20 世紀 50 年代搖滾歌曲中用電子管放大器演奏的老式空心電吉他的聲音,Demucs 讓音樂愛好者和音樂家離這個能力更近了一步。
資料來源:https://technews.tw/2020/03/11/using-ai-for-music-source-separation/?fbclid=IwAR1C-0LhFNEkIFUg9QS3xRQK8VKeqKIkPEx9kh7QdGamcsCfUViwyeXyqXg
同時也有156部Youtube影片,追蹤數超過0的網紅7Car小七車觀點,也在其Youtube影片中提到,新在哪裡? ●此次為四代小改款車型,但改款程度比照大改款等級。 ●柴油車型同樣搭載 2.2 升渦輪引擎,導入最新的 Smartstream 科技,與舊款相比最大馬力微幅提升 2 匹,最大扭力提升 0.1kgm。 ●新增 Hyundai 於國內市場首見的渦輪油電動力,搭載 1.6 升 Turbo Hy...
地動儀 結構 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
AI 將可快速分離人聲、各式樂器等音源,Facebook 開源 Demucs 計畫
作者 雷鋒網 | 發布日期 2020 年 03 月 11 日 10:59 |
音樂源分離,是利用技術將一首歌曲分解成它的組成成分,如人聲、低音和鼓,這和人類大腦的工作很類似,大腦可以將一個單獨的對話,從周圍的噪音和一屋子的人聊天中分離出來。
如果你擁有原始的錄音室多軌錄音,這很容易實現,你只需調整混音來分離一個音軌,但是,如果你從一個普通 MP3 檔案開始,所有的樂器和聲音都被混合到一個立體聲錄音中,即使是最複雜的軟體程式也很難精確地挑出一個部分。
Facebook AI 的研究人員已經開發了一個系統,可以做到這一點──精確度高得驚人。
創建者名叫亞歷山大‧笛福茲(Alexandre Defossez),是 Facebook 人工智慧巴黎實驗室的科學家。笛福茲的系統被稱為 Demucs,這個名字來源於「音樂資源深度提取器」,其工作原理是檢測聲波中的複雜模式,對每種樂器或聲音的波形模式建立一個高層次的理解,然後利用人工智慧將它們巧妙地分離。
笛福茲說,像 Demucs 這樣的技術,不僅能幫助音樂家學習複雜的吉他即興重複段落,總有一天,它還能讓人工智慧助理在嘈雜的房間裡更容易聽到語音指令。笛福茲說,他的目標是讓人工智慧系統擅長辨識音頻源的組成部分,就像它們現在可以在一張照片中準確地區分不同的物體一樣。「我們在音頻方面還沒有達到同樣的水平。」他說。
分解聲波的更好方法
聲源分離長期以來一直吸引著科學家。1953 年,英國認知科學家科林‧切爾瑞(Colin Cherry)創造了「雞尾酒會效應」這個詞語,用來描述人類在擁擠嘈雜的房間裡專注於一次談話的能力。
工程師們首先試圖透過調整立體聲錄音中的左右聲道,或調整均衡器設置來提高或降低某些頻率,進而隔離歌曲的人聲或吉他聲。
基於聲譜圖的人工智慧系統,在分離出以單一頻率響起或共振的樂器的音符方面相對有效,例如鋼琴或小提琴旋律。
這些旋律在聲譜圖上顯示為清晰、連續的水平線,但是隔離那些產生殘餘噪音的撞擊聲,比如鼓、低音拍擊,是一項非常艱鉅的任務。鼓點感覺像一個單一的、即時的整體事件,但它實際上包含了不同的部分。對於鼓來說,它包括覆蓋較高頻率範圍的初始撞擊,隨後是在較低頻率範圍內的無音高衰減。笛福茲說,一般的小鼓「就頻率而言,到處都是」。
聲譜圖只能將聲波表現為時間和頻率的組合,無法捕捉到這樣的細微差別。因此,他們將鼓點或拍子低音處理成幾條不連續的垂直線,而不是一個整齊、無縫的聲音。這就是為什麼透過聲譜圖分離出來的鼓和低音軌道,聽起來常常是模糊不清的。
夠聰明的系統來重建缺失
基於人工智慧的波形模型避免了這些問題,因為它們不試圖將一首歌放到時間和頻率的僵化結構中。笛福茲解釋,波形模型的工作方式與電腦視覺相似,電腦視覺是人工智慧的研究領域,旨在讓電腦學會從數位圖像中辨識模式,進而獲得對視覺世界的高級理解。
電腦視覺使用神經網路來檢測基本模式──類似於在圖像中發現角落和邊緣──然後推斷更高級或更複雜的模式。「波形模型的工作方式非常相似」,笛福茲說。他解釋了波形模型如何需要幾秒鐘來適應歌曲中的突出頻率──人聲、低音、鼓或吉他──並為每一個元素生成單獨的波形。然後,它開始推斷更高比例的結構,以增加細微差別,並精細雕刻每個波形。
笛福茲說,他的系統也可以比做探測和記錄地震的地震儀。地震時,地動儀的底座會移動,但懸掛在上面的重物不會移動,這使得附著在重物上的筆可以畫出記錄地面運動的波形。人工智慧模型可以探測到同時發生的幾個不同地震,然後推斷出每個地震的震級和強度的細節。同樣,笛福茲的系統分析並分離出一首歌曲的本來面目,而不是根據預先設定的聲譜圖結構來分割它。
笛福茲解釋,構建這個系統需要克服一系列複雜的技術挑戰。他首先使用了 Wave-U-Net 的底層架構,這是一個為音樂源分離開發的早期人工智慧波形模型。然後他還有很多工作要做,因為聲譜圖模型的表現優於 Wave-U-Net。他透過添加線性單元來微調波形網路中分析模式的演算法參數。笛福茲還增加了長短期記憶,這種結構允許網路處理整個數據序列,如一段音樂或一段視頻,而不僅是一個數據點,如圖像。笛福茲還提高了 Wave-U-Net 的速度和記憶體使用率。
這些修改幫助 Demucs 在一些重要方面勝過 Wave-U-Net,比如它如何處理一種聲音壓倒另一種聲音的問題。「你可以想像一架飛機起飛,引擎噪音會淹沒一個人的聲音」,笛福茲說。
以前的波形模型,透過簡單地移除原始音頻源文件的一部分來處理這個問題,但是它們不能重建丟失材料的重要部分。笛福茲增強了 Demucs 解碼器的能力,「Demucs 可以重新創建它認為存在但卻迷失在混音中的音頻」,這意味著他的模型可以重新合成可能被響亮的鐃鈸聲影響而遺失的柔和鋼琴音符,因為它理解應該呈現什麼樣的聲音。
這種重構和分離的能力使 Demucs 比其他波形模型有優勢。笛福茲說,Demucs 已經與最好的波形技術相匹配,並且「遠遠超出」最先進的聲譜技術。
在盲聽測試中,38 名參與者從 50 首測試曲目中隨機抽取 8 秒鐘進行聽音,這 50 首曲目由 3 個模型分開:Demucs、領先波形、頻譜圖技術。聽眾認為 Demucs 在品質和無偽影(如背景噪音或失真)方面表現最佳。
Demucs 已經引起了人工智慧愛好者的興趣,精通技術的讀者可以從 GitHub 下載 Demucs 的代碼,代碼用 MusDB 數據集來分離音樂源。
笛福茲解釋,隨著 Demucs 的發展,它將為人們在家中創作音樂的數位音頻工作站帶來聲音的真實性。這些工作站提供了能夠喚起特定時代或風格的合成儀器,通常需要對原始硬體進行大量的數位化改造。
想像一下,如果音樂源分離技術能夠完美地捕捉 20 世紀 50 年代搖滾歌曲中用電子管放大器演奏的老式空心電吉他的聲音,Demucs 讓音樂愛好者和音樂家離這個能力更近了一步。
資料來源:https://technews.tw/…/using-ai-for-music-source-separation/…
地動儀 結構 在 大紀元 epochtimes.com Facebook 的最佳解答
【史海】現代人的迷思 中國古代發達的機械科技
中國是世界上機械發展最早的國家之一,中國古代的機械發明在現今科學領域當中都是令人嘖嘖稱奇,英國李約瑟博士就曾著作一本名叫《中國之科學與文明》列舉流傳到歐洲的中國古代廿六種發明,其中古機械就占有十八種之多,例如候風地動儀、水運儀像台、指南車、諸葛亮的木牛流馬及飛天木鳶等,不僅實用且結構巧妙。工程師或科學家試圖利用現今科學理論方式去推導解釋,但古代機械的奧妙結構是現有科學觀念無法解析的。
神傳文化:http://www.epochtimes.com/b5/15/6/11/n4454950.htm
地動儀 結構 在 7Car小七車觀點 Youtube 的最佳貼文
新在哪裡?
●此次為四代小改款車型,但改款程度比照大改款等級。
●柴油車型同樣搭載 2.2 升渦輪引擎,導入最新的 Smartstream 科技,與舊款相比最大馬力微幅提升 2 匹,最大扭力提升 0.1kgm。
●新增 Hyundai 於國內市場首見的渦輪油電動力,搭載 1.6 升 Turbo Hybrid 引擎。
●變速箱由舊款 8 AT手自排,改為 8 DCT 濕式雙離合器自手排。
●換上全新第三代底盤平台,150K 熱沖壓鋼材比例提升至 14.6%,車身抗拉強度提升至 67.3kgf/mm2,達到輕量化並增強車體結構目標。
●車長增加 15mm (4,770mm→4,785mm)、車寬增加 10mm (1,890mm→1,900mm)、車高提高 5mm (1,705→1,710mm),軸距不變 (2,765mm)。
●外觀導入 T-Shaped LED 日行光條設計與 T-Shaped LED 尾燈,分離式頭尾燈設計。
●導入全新 12.3吋 TFT-LCD 數位儀表(舊款為 7 吋)、原廠 8 吋多媒體螢幕(舊款為國產 10 吋主機)。
●新增 Hyundai 在台灣首見的 SBW 電子線傳排檔系統。
#Hyundai
#SantaFe
#Hybrid
Hyundai Santa Fe 車系最早於 2001 年登場,以強調戶外遊憩的用途獲得市場認同,至此開創品牌發展都會型休旅車之路。而第一代車型首次於 2004 年以進口車的身份引進國內,並於 2007 年將第二代車型國產化,提供 5 人座及 7 人座兩種車型,以較同級少數提供 7 人座的配置成為競爭的一大優勢,逐步在市場上獲得聲量後站穩銷售表現。2012 年第三代車型登場,並於 2014 年同樣以國產化的身分進軍國內市場。
現行第四代車型從國產轉回進口身分,自去年上市以來已有一年多之久,但礙於品牌及價格影響力不及對手,使得銷量不如以往,Hyundai 為了增加競爭力與話題性,這次改款除了外觀改進之外,亦換上全新的底盤平台及內裝設計,並且重新調整 Santa Fe 全車系等級配備,將原有的柴油動力優化之外,亦新增 1.6 升渦輪油電車款。
圖文報導:https://www.7car.tw/articles/read/75364
更多車訊都在【小七車觀點】:https://www.7car.tw/
【七哥試駕都在這邊】:https://reurl.cc/O1xnWr
--------------------------------------
「小七哥」親自實測嚴選的商品都在【七車坊】
https://shop.7car.tw/
台灣商用車專屬網站【商車王】
https://www.truck.tw/
記得訂閱追蹤YouTube唷 》》》
7Car →https://reurl.cc/pdQL7d
7Car新聞頻道 →https://reurl.cc/MvnRrm
台灣車文庫 →https://reurl.cc/ar61QQ
0:00 Hyundai Santa Fe
2:02 新在哪裡?
4:38 車系編成
6:06 外觀
8:38 車尾
12:26 內裝
19:39 後座
23:41 第三排
25:58 試駕心得
32:46 買、不買?
地動儀 結構 在 moto1hk Youtube 的最佳貼文
德國 thyssenkrupp 極品碳纖輪框的如藝術的生產過程
相關內容:
極品碳纖輪框抵港-德國thyssenkrupp
碳纖的魅力沒法擋,在車界更擁有超級巨星地位,所以編者每次見到碳纖維部件都會多望兩眼,欣賞縱橫交錯的紋路,若然見到結構複雜的碳纖輪框或碳纖車架,雙手更加奇癢無比,難忍撫摸之欲,感受一下完美無瑕的外層。適逢Motard Tech引入德國thyssenkrupp Style 1碳纖輪框,因此編者在拍攝過程中可以過足手癮,然而每一下動作都要格外小心,以免Hi花嬌嫩表層,因為高質素的碳纖輪框使用高品質的碳纖維及高質樹脂製造,還有製造過程涉及大量人手及十分耗時,導致製造成本甚高,所以價格較鍛造或壓鑄的合金輪框昂貴,可是當你提起碳纖輪框的時候,就會感受到不成比例的超輕重量,這就是碳纖輪框的價值所在。然而好多人仍然認為碳纖輪框非常鬆脆,若然高速輾過「大窿」或駛上路壆,甚至被石仔擊中都會爆鈴,非常危險。不過隨著碳纖維的品質愈來愈強,廠方更可以使用高端科技協助生產,產後更得到先進光學儀器檢測,以確保精密結構,因此新一代碳纖輪框的抗爆能力及耐用度不可以同日而語。
MOTARD TECH
九龍牛頭角定富街96號地舖
tel:2628 1096
地動儀 結構 在 7Car小七車觀點 Youtube 的最佳貼文
新在哪裡?
●採用新式樣大型水箱罩與保險桿設計,並換上全新 LED 燈組、Aracaju 17 吋鋁合金輪圈及 California 專屬銘牌,向品牌其他新世代車款看齊。
●全新中控台、儀表板、 MQB 多功能方向盤。標配 Active Info Display 10.25 吋全邏輯數位化儀表、Discover Pro 9.2 吋多媒體鏡面觸控螢幕音響主機。
●標配電動液壓可收納外掀式升降車頂帳篷。
●上鋪床架結構升級為「碟型彈簧」 (共 54 個 )。
●下鋪新增「 加厚型舒適雙人床墊 」。
●前排上方的多功能液晶中央控制面板增設「彩色螢幕」 和「水平儀」。
●多功能置衣櫃改 「一面式」。
●廚房外側的充電裝置新增兩個掛勾、原本 T6 的 12V 則改為兩個 USB充電槽。
●乘客艙窗戶從蝴蝶窗開關改為從上下往內壓。
●標配 IQ. DRIVE 智能駕駛輔助,全速域 ACC 主動式車距調節巡航系統跟車到停再啟動、車前碰撞預警系統、後方橫向車流警示系統含剎車輔助功能、車道維持及偏移警示系統、遠光燈輔助系統、自動停車輔助系統、環艙距離感應雷達。
#Volkswagen
#California
#Ocean
福斯商旅 California 車系是 1988 年從 T3 Transporter 開始列為常規產品編制,但是,最初的 California 車型並非是由福斯商旅生產,而是由一家德國商用車改裝廠 Westfalia 負責操刀,包括 California 車型獨有的上掀式車頂,以及車艙內的櫥櫃、廚具以及床架等,從 T3 世代開始到 2004 年的 T4 世代都是由 Westfalia 負責 California 車型的生產運作。
延伸閱讀:https://www.7car.tw/articles/read/73578
更多車訊都在【小七車觀點】:https://www.7car.tw/
【七哥試駕都在這邊】:https://reurl.cc/O1xnWr
--------------------------------------
「小七哥」親自實測嚴選的商品都在【七車坊】
https://shop.7car.tw/
台灣商用車專屬網站【商車王】
https://www.truck.tw/
記得訂閱追蹤YouTube唷 》》》
7Car →https://reurl.cc/pdQL7d
7Car新聞頻道 →https://reurl.cc/MvnRrm
台灣車文庫 →https://reurl.cc/ar61QQ
地動儀 結構 在 地動儀的原理是什麼?復原地動儀的製作結構,多年的疑惑解開了 的推薦與評價
地震是一種破壞力極強的地質災害地球版塊運動導致地震誕生為了提前感知地震的發生作為當時的天文學家張衡在公元132年發明了世界上第一架 地動儀. ... <看更多>