豆包輸入法的Mac版,終于正式上線了。
![]()
我自己已經內測使用了快1個月了,但是我等這一天,也真的等了好久好久。
因為這篇文章我想寫很久了,但是一直沒寫就是因為,對于大眾用戶來說,之前還一直沒有一個比較好的產品能讓大家去隨便的體驗語音輸入法,所以一直在等豆包輸入法上線,然后再發,這樣其實所有人就都可以開始把這種方式用起來了。
所以,我今天也終于可以推薦大家,都使用豆包輸入法的語音輸入,來在電腦上,跟你的AI進行對話了。
不只是在手機上。
在電腦上也是。
我給大家看看,我現在每天在Mac上vibe coding的裝備。
![]()
一臺Mac Mini,一個觸屏的屏幕,一個麥,一個自定義的6鍵宏鍵盤,配合Mac上的豆包輸入法,直接搞定一切。
我之前寫過一篇文章,叫,那篇文章里我就提到了,記日記最好的方法是口述,不要寫,打開備忘錄,用豆包輸入法,按住語音鍵,想到什么說什么,兩三分鐘說完,語音自動轉成文字。
![]()
那篇文章發出去之后,很多讀者留言說,試了,真好用,回不去了。
但那篇聊的是日記場景,但今天我想把這個觀點往前再推一步,我想說,不光是記日記,其實你跟AI的很多對話,你日常工作中的大量文字輸入,都可以嘗試使用語音輸入來完成。
因為如今,語音輸入法開始逐漸變得成熟,在AI加持之下,識別準確度還有糾錯能力、去口水詞之類的能力,都還有蠻大的提升的,我覺得已經到了一個從極客圈開始向外普及的過程。
我不知道大家,但是很多老讀者可能都知道,我是一個非常典型的I人,I的濃度占比高達96%的INTJ。
過去這么多年,我一直是能打字就絕對不張嘴,跟朋友聊天打字,跟同事溝通打字,跟AI對話還是打字。
所以在很長一段時間里,語音輸入這四個字對我來說,約等于社恐禁區。。。
但是,大概從去年下半年開始,我開始大量的進行vibe coding還有一些高強度任務之后,發現了一個讓我很難受的問題。
就是我跟Claude對話的時候,我打字的速度,嚴重拖慢了我跟AI進行交互的速度,甚至可能還會影響輸出的質量。
正常人說話的速度,中文大概是每分鐘200到300字,快的時候能到350。而打字呢,普通人大概是每分鐘40到60字,熟練的能到80或者90。
也就是說,語音輸入的速度,是打字的3到5倍。
而很多時候,我們如果都想給AI更多的的信息,純靠打字的話,讓你寫500字,可能真的是種折磨,很多人其實就是,提筆忘字,一篇空白。
但是如果你讓他說500字,那可能瞬間就滔滔不絕了,這其實是大腦推理機制的問題。
我之前幾乎不會給AI一個上百字的輸入,我當然知道給的上下文越多輸出越精準,但,我是真的懶啊,你讓我敲一個上百字的小作文,我是真的累啊。
我第一次真正意識到這個差距,是去年12月份,有一次晚上躺在床上,用語音給Claude描述一個我正在做的項目的需求,我當時真的懶得打字了,于是那是我第一次,克服了我的社恐障礙,反正我家里就我一個人。
那時候豆包輸入法手機版應該上線沒多久,我第一次打開了它,然后說了大概三分鐘,這一說就一發不可收拾,說了項目背景、目前遇到的問題、我試過的幾種方案、每種方案分別卡在哪里、我理想中的解決思路是什么樣的。
我一邊說豆包輸入法一遍流式出文字,最后差不多將800字左右。
我當時都懵了,我我居然心流式的輸出了3分鐘,居然輸出了800字,這是我可能打字給AI,永遠都寫不出來的長度。
Claude那一輪給的回復,質量比我平時打字對話好太多了,因為它拿到了足夠多的輸入,給了我幾乎最準確最棒的回答。
那一刻我就明白了一件事,在如今大模型智力程度已經飛躍到今天這個是簡單,你跟AI對話,你輸入的信息量,遠比精準度和結構化程度重要。
因為AI的強項就是從一堆雜亂的信息里提取關鍵信息、梳理邏輯、找到你真正要的東西。
這就好像你去看醫生,你跟醫生說我肚子疼,醫生能做的很有限。
但你跟醫生說“我昨天吃了頓火鍋,晚上12點開始肚子疼,一開始是左邊疼后來變成整個肚子都疼,今天早上拉了兩次還有點發燒,之前也偶爾會這樣但沒這次嚴重”,醫生就能判斷個八九不離十了。
跟AI對話其實是一個道理。
而語音輸入,天然就能幫你做到這一點,因為你來不及編輯。
我之前那篇日記的文章里就說過這個觀點。
就是打字的時候,你的大腦里有一個編輯在實時工作,它會幫你潤色、修剪、美化、克制,這個編輯在你寫公眾號文章的時候很有用,但在你跟AI對話的時候,它就是你最大的敵人。
回到今天的主角,豆包輸入法。
我先說一下前情提要,我從去年就開始在手機上用豆包輸入法的語音功能了,當時就覺得很驚艷。但手機端的語音輸入其實大家選擇還挺多的,坦率的講,微信輸入法、訊飛、搜狗,都還行。
但電腦端,那真的就難受的飛起了。
電腦端的比較好用的語音輸入,坦率地講,長期以來就是一片荒漠。
我當然知道有些付費的語音輸入法產品,但說實話雖然我已經在AI上花了很多很多錢了,但是在AI時代要付費的東西實在太多了,我真的不太想為了一個輸入法再多一筆訂閱。
然后之前我常用的微信輸入法,也上了AI語音識別,但坦率的講,識別率不太穩定。我試過好幾次,尤其是你離Mac的麥克風稍微遠一點,或者白天辦公室有點環境音,錯別字就開始冒出來了。
所以在豆包輸入法Mac版出來之前,我在電腦上其實一直還是比較割裂的狀態,畢竟我的大部分工作場景,還是電腦啊。
然后今年3月底的時候,豆包輸入法Mac版的內測版悄悄出來了,我當時也第一時間申請了內測,裝上了安裝包。
在用了一個月之后,我想說,它不僅免費,而且,跟很多付費的產品相比,體驗更是一樣好。
而現在,大家也終于,全都可以用上了,而且,不止語音輸入,拼音雙拼啥的全都有,非常的完整。
網址在此:https://shurufa.doubao.com/pc
你下載打開以后,直接安裝。
![]()
然后就會提示你,安裝完成了。
![]()
你就可以在你的頂部輸入法那個欄目這,點開,就可以看到豆包輸入法了。
![]()
我們先點進去上面的豆包輸入法的設置界面。
所有的東西基本都不太需要動。
唯獨有一個東西,就是快捷鍵那,你可以隨便預設一個你喜歡的鍵。
![]()
我個人習慣問題,我直接設成了右邊的Option鍵。
我那個宏鍵盤,其中一個按鍵也是映射的這個鍵,這就是標準的豆包輸入法說話鍵。
使用起來也究極簡單,就兩種輸入方式。
第一種就是長按你的快捷鍵,比如我是右Option鍵。
你就按住就行了,這時候,你的屏幕下方就會出現一個小條,代表正在輸入中了。
![]()
按住就是語音輸入,松開就是輸入完畢,這個邏輯很好理解對吧。
然后還有另一種模式,就是有些朋友,可能嫌一直按著太累,那也有辦法。
你直接雙擊快捷鍵,就會變成這樣。
![]()
這個時候,你就不需要按著了,你就可以直接開始口噴輸出,當你覺得說完了的時候,直接再次雙擊結束。
然后豆包的流式輸出做的非常的好,就是你按住快捷鍵開始說話,文字是實時往外吐的,你一邊說一邊就能感覺到,文字好像在輸入框里嘩嘩地流淌出來。
我直接給你做個示例,看看這個延時,你就懂了。
絲滑,無敵絲滑。
而且識別精準度極高,幾乎不需要我改任何字和詞,完全可以直接用。
我開始使用的時候,其實還有點不放心,在想著要不要確認一遍再發,后面發現中文場景下,幾乎都是對的,所以后來就再也沒確認過了。
Codex其實前段時間也上線了自己的語音輸入,類似于一個輸入法,你直接設好快捷鍵,按住一樣可以用語音輸入。
![]()
但是Codex它的輸入體驗,就真的不是特別好了,我給大家錄個屏實際看看,這個輸入的條其實跟豆包輸入法的有點像。
講真的,當你習慣絲滑無比源遠流淌、說完即輸入完的體驗之后,你肯定再接受不了這種錄音然后轉文字的感覺慢慢的輸入法了。
然后還有一個細節是,你在輸入的時候,它也會自動的去優化一些你的輸入,比如你說"這個項目的預算大概是...不對,應該是三十萬",他會實時識別到你的在糾正自己,他也會幫你直接改成正確的,這個很牛逼,你腦子里的想法和屏幕上的文字之間的延遲幾乎消失了。
然后還有一個對我很重要的能力,就是中英混說。
因為AI行業沒有辦法,就是有很多很多的你很難用中文表達的英文,比如ChatGPT、Claude、Skill、OpenAI、Harness、Promtp之類的。
但是我的英文又極爛,但是在我如此之爛的口語情況下,絕大多數的英文,居然還是可以識別對。
里面所有的英文單詞都沒有錯誤,甚至seedance還自動縮寫成了SD。
對于我這種英文苦手來說,真的非常非常友好。
而且有的時候,skill這個發音,我確實就發不準,但是你也可以通過都自動糾正功能給它改了,就是你錯一次以后,你手動改一下,你后面再動,就不會錯了。
比如這是我的母公司名,叫虛實空際,你如果是第一次輸入,或者其他的輸入法正常去打,是百分百會錯的。
但是因為我之前糾正過,所以我現在去說這個單詞,豆包輸入法就會自動的幫我改成虛實空際。
這是AI自己幫我改的,可不是我人改的,正是因為我以前糾正過,所以就不會再錯了。
還有skill這個單詞也是,我一生之敵,經常念不對,但是你糾正過一次以后,也就不會有問題了。
真的很強,你會發現,當你用的越久,這個輸入法,就會越用越準越用越懂你,你的語音輸入,也會越來越準,越來越不需要修改。
因為每個人的高頻詞匯表其實是不一樣的,AI輸入法如果不能學習你的用詞習慣,用久了依然會有一堆需要手動改的地方的話,那體驗就真的差太多了。
而且豆包輸入法有個點做的很好,在手機上體驗就不錯,就是輕聲抗噪。
這個其實解決了I人很重要的顧慮,就是我在辦公室不好意思出聲怎么辦。
豆包輸入法有輕聲模式,你就小聲嘟囔,它也能識別,我在辦公室試過,壓著嗓子說話,離電腦大概半米遠,識別率也基本沒怎么掉。
同事在旁邊根本聽不清我在說啥,但屏幕上的字還是嘩嘩出來,另外就是抗噪,咖啡館的背景音樂、鍵盤敲擊聲、偶爾路過的同事聊天聲,這些雜音它都能過濾掉,專注識別你的聲音,這個還是蠻香的。
以上這些點疊在一起,我也覺得可以給你推薦,轉向使用語音跟AI交互的時機了,而豆包輸入法,確實就是現在最合適大家更適合如你我一般的普通用戶的。
我上一篇日記的那篇文章的結尾說,從今天開始,記日記吧。
那今天這篇文章的結尾,我想說。
從今天開始,張嘴說話吧。
相信我,別再跟你的鍵盤,較勁了。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克
>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.