如果你看過我之前那篇關於 xvoice 專案的文章,你會知道我一直在找一個能真正聽懂我說話的語音輸入工具。
簡單回顧一下:我只能用右手食指打字,每一個字都是成本。「用說的取代打字」這件事,對我來說不是錦上添花,是剛需。
過去幾個月,我研究了 Silero VAD、faster-whisper、LLM 語意校正,還討論過怎麼把整套系統塞進 iOS 鍵盤擴充。結論是:iOS 鍵盤擴充有大約 50MB 的記憶體限制,本地跑 Whisper 根本塞不進去。
然後,就在我剛換 iPhone 不到三週,朋友丟了一個叫 Typeless 的東西給我。
我試了。
接近 100% 的辨識準確率。
我現在跟 Claude 討論的這整段對話,全都是用 Typeless 說的。
傳統語音辨識會把你說的每個字都打出來,包括「呃」、「嗯」、「就是那個」、還有你中途改口的句子。
Typeless 不會。
它會自動把 filler words 幹掉,偵測你重複講的句子只留最後一個版本,還會辨識你中途改口、只輸出你「真正想說的」。
更扯的是,它會根據你用的 App 調整語氣。Slack 口語一點,Email 正式一點。
剛才我跟 Claude 對話,隨口說了「一是什麼什麼,二是什麼什麼」,它直接幫我輸出成條列格式。
我當下反應:「哇靠,它還自動條列了。」
但它怎麼做到的?我花了一個月研究怎麼在 iOS 上跑本地 Whisper,結論是做不到。
那 Typeless 怎麼做到的?
答案很簡單:它根本沒在本地跑。
我開飛航模式測試,完全無法使用。確認是雲端處理。
官方隱私政策寫得很清楚:
"Both your audio and contextual data are processed in real time on our cloud servers and immediately discarded once the result is returned to your device."
架構大概是這樣:
麥克風錄音 → 上傳雲端 → ASR 語音辨識 → LLM 語意理解與潤飾 → 返回裝置
官網寫「Everything stays local」指的是轉錄歷史記錄存在本地,不是處理過程。這兩件事不一樣。
至於他們用什麼 ASR 引擎,官方沒說。但從支援 100+ 語言、自動語言偵測這些特徵來看,我猜是 OpenAI Whisper API 或類似等級的東西。雲端大模型的能力本來就不是本地小模型能比的。
說實話,有一點好笑。
我花了一個月研究 VAD、Whisper、LLM 校正層的組合,結論是「iOS 本地做不到」。
結果人家直接繞過這個限制——既然本地做不到,那就不要在本地做。
但我不覺得白費。正因為我搞懂了整個技術棧,所以我一看到 Typeless 就知道它大概怎麼運作、為什麼要連網、隱私風險在哪裡。換成沒研究過的人,可能根本不會注意到「zero data retention」跟「local processing」是兩回事。
而且 Typeless 也驗證了我的假設:對於我的發音狀況,LLM 語意理解層是關鍵。傳統 ASR 聽錯了就是聽錯了,但如果後面接一個夠強的 LLM,它可以從上下文推敲出你真正想說什麼。
我的 xvoice 設計了同樣的架構(VAD + Whisper + LLM),只是我用本地 Whisper + OpenRouter 免費模型。Typeless 用的是雲端 Whisper(或更強的東西)+ 不知道什麼等級的 LLM。硬體資源差距在那裡,效果自然不同。
但隱私是用 Typeless 最需要想清楚的事。
你說的每一句話都會送到雲端。
官方宣稱「零資料保留」、「不用於訓練」,但你無法獨立驗證。隱私政策還提到會用「third-party LLMs」,具體是哪家也沒說。
如果你要處理機密內容(病歷、法律文件、商業機密),不要用。
但對於日常溝通、寫部落格、跟 AI 聊天,我可以接受這個風險。打字成本歸零這件事,對我的生活品質影響太大了。
如果你對隱私零容忍,可以看 Superwhisper(100% 本地,$249 終身)或 Aiko(免費,本地,但沒有 LLM 潤飾)。
| 工具 | 處理位置 | AI 潤飾 | 離線 | 價格 |
|---|---|---|---|---|
| Typeless | 雲端 | ✅ 完整 | ❌ | $12-30/月 |
| Superwhisper | 本地 | ✅ 可配置 | ✅ | $249 終身 |
| Aiko | 本地 | ❌ | ✅ | 免費 |
| Apple 聽寫 | 本地/雲端 | ❌ | ✅ | 內建 |
| Wispr Flow | 雲端 | ✅ | ❌ | 訂閱制 |
Typeless 免費版每週 4,000 字(平均一天約 570 字),日常短訊息夠用,但大量跟 AI 對話會撞到限制。Pro 版月付 $30,年付 $12/月。新帳號有 30 天試用,不用綁卡。
目前支援 iOS、macOS、Windows,Android 和 Web 寫「Coming soon」。我 12 月中剛換 iPhone,不到三週就發現這工具——運氣不錯。
Typeless 有個特別的功能叫 Speak to Edit——選取已經打好的文字,用語音說「改成更正式的語氣」或「把這段縮短」,它就會幫你改。這在競品上很少見。
Typeless 是我目前用過最接近「說話即打字」的工具。技術路線是「準確度優先、隱私妥協」——用雲端 AI 換極高的辨識率和智慧潤飾,代價是音訊會離開裝置。對我這種打字成本極高的人,這個取捨值得。
這篇文章跟 Claude 討論的過程,全程用 Typeless 輸入。
