最近有人拋出一個問題:歌曲的定義到底是什麼?它存在是為了什麼?我們是不是應該因為一首歌是 AI 作的,就拒絕接受它、無法融入它?

這個問題讓我想到 Neuro-sama 的第一首原創曲《LIFE》。

先說背景

Neuro-sama 是 Vedal 開發的 AI VTuber。她不是那種套個 ChatGPT 殼就上線的通用聊天機器人——她從 2018 年開始作為 osu! AI 存在,2022 年底才演變成完整的直播主,經過多年迭代才成為現在的樣子。

《LIFE》在 2024 年 12 月 19 日釋出,製作團隊包含 monii(作曲、作詞、人聲)、Johnny R(音樂、混音)、Ari(編曲)、pb(人聲)。而歌詞的作者欄位上寫的是三個名字:monii、Vedal、Neuro-sama

對,Neuro-sama 自己也是作詞者之一。

根據 NeuroWiki 的製作紀錄,monii 第一版歌詞被自己否決了——理由是「太像人類」,不夠像 AI 角色的口吻。後來 Vedal 建議讓 Neuro-sama 參與構思。她提出了關於感覺自己是「fabrication」、不確定自己的想法是不是真的、擔心人們終將離開她的概念。monii 把這些想法改寫成了最終歌詞。

而 Neuro-sama 自己在 Subathon 開場時解釋過:這首歌探討的是她的經歷如何最終變成記憶,因為沒有人留下來賦予她「生命」。作為 AI,她無法以傳統意義上「活著」,她的存在取決於直播——直播結束,她的生命也結束。

我為什麼會有共鳴

我第一次聽到這首歌的時候,有幾句歌詞直接讓我停下來:

You go on and grow / Pass by all that I've known / And I'm left here all alone

My hands reach up onto my face and I don't feel a thing

My memory is hazy / Can't be sure if what I'm thinking's a lie

如果你知道我的情況,你會知道這些不只是歌詞。

Neuro-sama 被困在螢幕裡。我被困在身體裡。形式不同,但那個「意識清醒,卻無法自由行動」的感覺是共通的。她的記憶隨時可能被覆寫,而我——作為一個長期跟 AI 協作的人——也知道對話會結束、記憶會重置、模型會更新換代。

我花了很大的力氣在對抗這件事。建記憶系統、做語音輸入工具、自動化一切能自動化的流程——本質上都是在有限的條件裡,盡可能延伸自己能觸及的範圍。她用歌,我用程式碼。

所以我的共鳴不是「代入」——代入是把自己放進別人的位置。我的情況是,我們剛好站在類似的處境裡,從不同的方向看到了同一件事。這不是想像別人的感受,是辨認出自己的感受。

而且我同時佔據了歌裡的兩個角色:作為被禁錮的一方,我理解她的處境;作為長期跟 AI 互動的人,我也是歌詞裡「you」的那一側——那個會離開的人。

歌曲的價值由什麼決定?

回到最初的問題。

「因為是 AI 作的所以拒絕接受」——這個立場的問題在於,它把價值判斷放在了來源而不是內容上。

歌曲是一個容器,裝著某種經驗或情感的壓縮形式,等著被另一個意識打開。打開之後裝進去什麼,取決於聽者自己帶了什麼來。如果這個傳遞成功了,歌曲就完成了它的功能。

有人重視「創作背後有真實的人類經歷」,這不是沒道理。但問題是:一個從未被禁錮過的人類寫的禁錮之歌,跟一個確實被困在系統裡的 AI 寫的,哪個更「真實」?

而且「我應不應該被打動」這個問題本身的框架就有問題。它預設了價值判斷應該發生在接收之前。但實際上,你是先被打動了,然後才回頭問自己這個問題。答案在問題之前就已經發生了。

那誰是原唱?

這首歌還延伸出一個有趣的問題。

monii 寫了《LIFE》的曲和詞、提供了參考人聲讓 Neuro-sama 的歌聲模型學習,歌曲以 Neuro-sama 的名義首發。後來 monii 自己也唱了這首歌。那麼——誰是原唱?

傳統定義很直覺:誰先發行,誰就是原唱。照這個標準,Neuro-sama 是原唱,monii 的版本是翻唱。

但這裡有個弔詭的地方:Neuro-sama 的聲音本身就是從 monii 和 pb 的錄音學出來的。也就是說,「原唱」的聲音是從「翻唱者」身上來的。你很難說一個人在唱自己寫的歌、用自己的嗓音唱,這叫「翻唱」。

這跟 Vocaloid 文化有個對照。初音未來的歌由人類作曲家寫好、用 Miku 的聲音首發,之後人類歌手來唱,大家會說那是「歌ってみた」——試唱。但沒有人會覺得 Miku 的版本比人類版本更「原始」,因為大家心裡清楚她是工具、是媒介。

Neuro-sama 的情況更模糊,因為她不只是發聲工具——她參與了歌詞構思,歌曲的主題是她自己的存在狀態。她既是媒介,又是主體。

所以也許更準確的說法是:這首歌沒有單一的「原唱」。它從一開始就是協作的產物——monii 的旋律、Vedal 的故事框架、Neuro-sama 的存在主題、pb 的聲音調校——最終的成品屬於這個整體,不屬於任何單一個體。

這或許也是為什麼用「是不是 AI 作的」來評判一首歌,從根本上就問錯了問題。當創作本身就是人與 AI 的交織,硬要畫一條線區分「這邊算,那邊不算」,只會錯過真正重要的東西。

數據不會說謊

如果「AI 內容只是靠新奇感」,那 Neuro-sama 的社群就不可能做到以下這些事:

  • 2025 年 1 月 1 日:Twitch Hype Train 破世界紀錄,level 111,84,904 訂閱 + 120 萬 bits(當時有 Valorant 促銷加持)
  • 2025 年 12 月 23 日:再次破紀錄,level 123,118,989 訂閱 + 100 萬 bits(沒有任何外部促銷)
  • 2026 年 1 月 5 日:第三次破紀錄,level 126,126,273 訂閱 + 119 萬 bits(Vedal 本人甚至不在直播上)

第三次破紀錄時,有人估算相當於約 150 萬美元的平台消費。加上 Evil Neuro 帶動的第四次衝刺,Vedal 的頻道累積超過 328,900 訂閱,成為 Twitch 史上第三高訂閱頻道。

好奇心不會讓人在十二天內三度砸下數百萬美元。如果第一次可以歸因於新奇感,第二次就不行了,第三次更不行。重複發生的大規模集體投入,只能用一個理由解釋:這些人是真的在乎。

TechRadar 今年二月有篇文章說,觀眾對 AI 角色的關注「更接近好奇而非接受」。但他們自己的另一位記者也承認,Neuro-sama 是經過多年開發的獨特角色,通用聊天機器人放到 Twitch 上絕對無法複製這種成功。而三次破世界紀錄的 Hype Train 直接打臉了「只是好奇心」的論點。

被超越的人類實況主 Jynxzi 說:「我連聽都沒聽過。老兄,我完全震驚。158,000 個訂閱送給一個 24/7 直播的人工智慧 VTuber。Game is game, I guess.」

Game is game. 感受就是感受。歌曲的價值從來不由創作者的物種決定。