如果你看過我之前那篇關於 xvoice 專案的文章,你會知道我一直在找一個能真正聽懂我說話的語音輸入工具。

簡單回顧一下:我只能用右手食指打字,每一個字都是成本。「用說的取代打字」這件事,對我來說不是錦上添花,是剛需。

過去幾個月,我研究了 Silero VAD、faster-whisper、LLM 語意校正,還討論過怎麼把整套系統塞進 iOS 鍵盤擴充。結論是:iOS 鍵盤擴充有大約 50MB 的記憶體限制,本地跑 Whisper 根本塞不進去。

然後,就在我剛換 iPhone 不到三週,朋友丟了一個叫 Typeless 的東西給我。

我試了。

接近 100% 的辨識準確率。

我現在跟 Claude 討論的這整段對話,全都是用 Typeless 說的。

傳統語音辨識會把你說的每個字都打出來,包括「呃」、「嗯」、「就是那個」、還有你中途改口的句子。

Typeless 不會。

它會自動把 filler words 幹掉,偵測你重複講的句子只留最後一個版本,還會辨識你中途改口、只輸出你「真正想說的」。

更扯的是,它會根據你用的 App 調整語氣。Slack 口語一點,Email 正式一點。

剛才我跟 Claude 對話,隨口說了「一是什麼什麼,二是什麼什麼」,它直接幫我輸出成條列格式。

我當下反應:「哇靠,它還自動條列了。」

但它怎麼做到的?我花了一個月研究怎麼在 iOS 上跑本地 Whisper,結論是做不到。

那 Typeless 怎麼做到的?

答案很簡單:它根本沒在本地跑

我開飛航模式測試,完全無法使用。確認是雲端處理。

官方隱私政策寫得很清楚:

"Both your audio and contextual data are processed in real time on our cloud servers and immediately discarded once the result is returned to your device."

架構大概是這樣:

麥克風錄音 → 上傳雲端 → ASR 語音辨識 → LLM 語意理解與潤飾 → 返回裝置

官網寫「Everything stays local」指的是轉錄歷史記錄存在本地,不是處理過程。這兩件事不一樣。

至於他們用什麼 ASR 引擎,官方沒說。但從支援 100+ 語言、自動語言偵測這些特徵來看,我猜是 OpenAI Whisper API 或類似等級的東西。雲端大模型的能力本來就不是本地小模型能比的。

說實話,有一點好笑。

我花了一個月研究 VAD、Whisper、LLM 校正層的組合,結論是「iOS 本地做不到」。

結果人家直接繞過這個限制——既然本地做不到,那就不要在本地做。

但我不覺得白費。正因為我搞懂了整個技術棧,所以我一看到 Typeless 就知道它大概怎麼運作、為什麼要連網、隱私風險在哪裡。換成沒研究過的人,可能根本不會注意到「zero data retention」跟「local processing」是兩回事。

而且 Typeless 也驗證了我的假設:對於我的發音狀況,LLM 語意理解層是關鍵。傳統 ASR 聽錯了就是聽錯了,但如果後面接一個夠強的 LLM,它可以從上下文推敲出你真正想說什麼。

我的 xvoice 設計了同樣的架構(VAD + Whisper + LLM),只是我用本地 Whisper + OpenRouter 免費模型。Typeless 用的是雲端 Whisper(或更強的東西)+ 不知道什麼等級的 LLM。硬體資源差距在那裡,效果自然不同。

但隱私是用 Typeless 最需要想清楚的事。

你說的每一句話都會送到雲端。

官方宣稱「零資料保留」、「不用於訓練」,但你無法獨立驗證。隱私政策還提到會用「third-party LLMs」,具體是哪家也沒說。

如果你要處理機密內容(病歷、法律文件、商業機密),不要用。

但對於日常溝通、寫部落格、跟 AI 聊天,我可以接受這個風險。打字成本歸零這件事,對我的生活品質影響太大了。

如果你對隱私零容忍,可以看 Superwhisper(100% 本地,$249 終身)或 Aiko(免費,本地,但沒有 LLM 潤飾)。

工具 處理位置 AI 潤飾 離線 價格
Typeless 雲端 ✅ 完整 $12-30/月
Superwhisper 本地 ✅ 可配置 $249 終身
Aiko 本地 免費
Apple 聽寫 本地/雲端 內建
Wispr Flow 雲端 訂閱制

Typeless 免費版每週 4,000 字(平均一天約 570 字),日常短訊息夠用,但大量跟 AI 對話會撞到限制。Pro 版月付 $30,年付 $12/月。新帳號有 30 天試用,不用綁卡。

目前支援 iOS、macOS、Windows,Android 和 Web 寫「Coming soon」。我 12 月中剛換 iPhone,不到三週就發現這工具——運氣不錯。

Typeless 有個特別的功能叫 Speak to Edit——選取已經打好的文字,用語音說「改成更正式的語氣」或「把這段縮短」,它就會幫你改。這在競品上很少見。

Typeless 是我目前用過最接近「說話即打字」的工具。技術路線是「準確度優先、隱私妥協」——用雲端 AI 換極高的辨識率和智慧潤飾,代價是音訊會離開裝置。對我這種打字成本極高的人,這個取捨值得。

這篇文章跟 Claude 討論的過程,全程用 Typeless 輸入。