當音樂趕上人工智能 -- 歌手們都在「雲競演」,做曲家就不想試試「雲譜曲」?

專屬圖1.png

今年年初電視上不少唱歌類節目採用了一種「雲競演」的方式。其實說白了,這就是利用視頻會議讓你們分別在本身家裏參加節目錄制,只不過爲了便於不懂技術的人理解,使用了「雲競演」這樣的稱呼。算法

不過本文咱們要談的「雲譜曲」可沒那麼簡單!並非做曲家在本身家裏經過訪問某些雲服務來譜寫優美音樂,而是讓任何人,哪怕沒有接受過相關訓練的普通人,在雲服務的幫助下,本身寫出好聽的旋律來!segmentfault

你從小就有玩音樂的夢?那麼來吧,Amazon Web Services (AWS) 挺你,幫你圓夢!網絡

寓教於樂,AI 起始並沒那麼難入門

在2019 AWS re:Invent 技術大會上,AWS 發佈了 AWS DeepComposer,這是世界上第一個結合了人工智能生成服務的音樂鍵盤。本文將介紹該服務,告訴你如何使用預訓練的模型快速生成本身的第一個音樂做品。同時你將瞭解到 DeepComposer 背後的人工智能技術基礎知識:生成對抗網絡(GAN),並瞭解如何使用生成對抗網絡訓練本身的模型。composer

說到這個 DeepComposer,它的背後起始還有一些有趣的故事。人工智能和機器機器學習是近年來的熱門話題,但從事有關工做須要瞭解和掌握模型和算法、代碼編寫等一系列計算機學科的知識,不少有志於從事該行業的人員所以不得不望而卻步。框架

爲了幫助更多人學習實用的機器學習知識並從中得到樂趣,AWS 在過去三年裏,每一年都發布了一個基於機器學習的設備。機器學習

2017年推出的世界上第一臺支持深度學習的攝像頭 AWS DeepLens,能夠幫助開發人員瞭解用於機器視覺的機器學習。2018年推出的 AWS DeepRacer,是一種經過強化學習驅動的全自動1/18比例賽車。而2019年發佈的此係列第三個做品 AWS DeepComposer,是一種能夠配合人工智能生成服務使用的音樂鍵盤。函數

cloud-composition-service-based-on-machine-learning-generation-algorithms-aws-deepcomposer1.png

AWS DeepComposer,譜寫華美樂章

AWS DeepComposer 是一款32鍵,兩個八度的 MIDI 音樂鍵盤。藉此,開發人員可使用預訓練模型或自建的基於人工智能生成服務的模型爲音樂做曲、編排和演奏。性能

除了直接購買硬件形態的 AWS DeepComposer 鍵盤,任何用戶也可使用AWS控制檯裏的虛擬鍵盤實現相同玩法。學習

使用 AWS DeepComposer 的主要步驟以下:人工智能

  1. 登陸到 AWS 控制檯並啓動 DeepComposer 服務;
  2. 使用音樂鍵盤彈奏錄製簡短的音樂旋律,或使用預先錄製的音樂旋律;
  3. 根據喜歡的音樂類型選擇一個預訓練或本身經過 SageMaker 產生的生成模型;
  4. 使用此模型生成新的由不一樣樂器產生的複音成分;
  5. 在控制檯中播放和錄製生成的樂曲;
  6. 導出做品爲 MIDI 或 MP3格式,隨後便可在 SoundCloud 音樂雲上共享。

cloud-composition-service-based-on-machine-learning-generation-algorithms-aws-deepcomposer2.png

使用預置的模型

下面首先看看如何使用預置模型快速生成咱們的第一個音樂做品。

  1. 在美東區打開控制檯並開啓 DeepComposer 服務,隨後跳轉 Music Studio。
  2. 在這裏能夠選擇預先錄製的樂曲,也能夠本身使用音樂鍵盤錄製一段旋律。
  3. 本例中咱們爲你們錄製了一段德沃夏克的《新世界》交響曲主旋律,而後能夠選擇預先訓練好的不一樣音樂風格模型:古典,爵士,搖滾或流行。
  4. 這些模型已經針對大量音樂數據集進行了相應類型的訓練,可供咱們直接使用。讓咱們試一試給這首旋律換換曲風,選擇「爵士」並生成音樂。
  5. 幾秒鐘後,能夠看到模型產生的音樂伴奏。隨後能夠給它們分配不一樣樂器:架子鼓,吉他,貝斯低音吉他,並加點絃樂。

cloud-composition-service-based-on-machine-learning-generation-algorithms-aws-deepcomposer3.png

接下來,聽聽成果吧。

這曲子如何?一樣,咱們也能夠將其改成古典、搖滾或流行的風格。最後,還能夠將樂曲導出爲 MIDI 或 MP3文件,並在 SoundCloud 賬戶上分享。

生成對抗網絡概覽

GAN(Generative adversarial network,生成對抗網絡)最先由 Ian Goodfellow 等人於2014年提出,以其優越的性能迅速成爲人工智能一大研究熱點。

生成對抗網絡由兩個網絡組成的,一個生成器網絡(Generator)和一個判別器網絡(Discriminator)。在對抗網絡框架中,生成器網絡模型與判別器網絡模型相對立。生成器無權訪問數據集,而是使用隨機數據,力圖生成一個真實數據集的樣本。判別模型學習肯定樣本是來自模型分佈仍是來自數據分佈。

生成模型能夠被認爲相似於一組僞造者,試圖生產假冒物品並在未經檢測的狀況下使用它,而判別模型相似於鑑別人員,試圖對物品的真僞作出判斷。這兩個網絡神經網絡經過競爭試圖超越對方並完成本身的任務。通過數千次迭代後,兩個網絡同時獲得訓練變得更好。

生成對抗網絡有普遍的使用場景,例如圖像生成、藝術品生成、音樂生成和視頻生成等等。固然在 DeepComposer 裏預置的模型就是這樣訓練產生的,供咱們使用編曲配器生成特定風格的音樂做品。

cloud-composition-service-based-on-machine-learning-generation-algorithms-aws-deepcomposer4.png

以前咱們曾發佈過一篇文章,介紹如何利用生成對抗網絡合成幾乎能夠以假亂真的「人類手寫筆跡」,感興趣的童鞋能夠點擊這裏閱讀。

訓練本身的模型

接下來一塊兒看看如何使用生成對抗網絡,根據喜歡的音樂數據集訓定製模型。咱們須要選擇:

  • 生成器和鑑別器的體系結構參數
  • 訓練過程當中的損失函數,用於測量算法輸出與指望值之間的差別
  • 超參數

在模型訓練期間,我能夠監控質量指標,收聽生成的樣本。對模型進行全面訓練後,就能夠像預先訓練的模型同樣生成定製的模型,並用它來生成具備獨特風格的音樂了。

AWS DeepComposer 這款服務也許將開啓您的做麴生涯。請訪問這裏瞭解更多相關信息,並註冊預覽該服務。註冊者將在音樂鍵盤上市時獲得電子郵件通知。

底圖2.png

相關文章
相關標籤/搜索