語音轉文字程式與中英文聽打逐字稿

錄音檔要轉成文字的話,微軟有內建語音轉文字程式,仿間也有許多軟體可以使用,然而再怎樣的程式軟體,都會有高比例的誤判情形,比不上人工作業來得精準,即使程式辨識完成的文字,還是得用心校稿,才能正確呈現錄音內容。

其實語音轉文字有專門的人工服務,業界也有專業術語在稱呼,就是:

1. 聽打

2. 逐字稿

聽打,就是邊聽語音邊打字的意思。

逐字稿就是將語音的內容一字不漏地逐字打出來,所以稱逐字稿。

人工作業的中英文聽打逐字稿方式一定比程式判斷還要準確,因為錄音環境與講者的速度語調等等,會讓語音有所變化,要將語音轉文字的時候就會出現落差,唯有依照前後文來判斷用字,才會提高準確度,這是程式軟體做不到的。

中英文聽打逐字稿的作業人員並不是聽到什麼打什麼而已,對文字的敏銳度要很夠,語音轉文字的正確度才會高。

我們的合作夥伴是經由測試快速機器語音所唸出的半文言文小說而打出逐字稿,中英文聽打員在此情境下仍能打出正確文字的才會錄用。我們的合作夥伴不但聽力優,文字敏銳度亦有相當水準,您有語音轉文字需求的時候,可以放心交給我們,我們的品質優於程式跟軟體是一定的,最重要的,是能避免您繁瑣的人工作業,如果沒經常在做中英文聽打逐字稿的,一小時的錄音檔花費十小時以上還不一定能打完(視音質而定)是很正常的。

中英文聽打逐字稿的作業非常繁瑣,又枯燥無趣,而我們的收費標準依您的作業工時來計算的話,時薪非常低,您花少少錢就能把語音轉文字做好,是很值得的投資。

語音轉文字(中英文聽打逐字稿)的工作要點

語音轉文字不管是程式作業還是人工中英文聽打逐字稿都一樣,除了錄音品質會產生轉換效率的差異之外,有些地方本來就被雜音干擾,甚至講者自己結巴說不清楚,這情況不管是程式或人工判斷都打不出正確的字。

人工作業的中英文聽打逐字稿在語音轉文字遇到錄音不清楚的地方,一定得標上時間點,標時間點的目的在於讓錄音者自己對照該文字與錄音之處,因為錄音者是在現場的人,比較清楚當時情境與講話者的口頭習慣,遇到本來就錄不清楚講不清楚的地方,由現場人員去決定用字是最正確的做法。

用軟體進行語音轉文字的效率不高是因為講者是自然講話,自然講話的特質是把許多音都連在一起,當音音相連時,軟體無法判斷那個聲音到哪個聲音之間是一個字,可能會把兩個字的聲音當成一個字判斷,諸如此類因素而產生誤判。

如果是要傳送訊息或搜尋網頁的簡短字句,沒必要請專人做中英文聽打逐字稿的,就可以使用語音轉文字軟體來達到目的,只要講話者在每個字之間稍有停頓,加上字句短,軟體的辨識率就可以提高很多。

一般的訪談錄音不可能為了配合語音辨識軟體而刻意在講話時有所停頓,幾乎都會連音,但,若是在電腦前使用語音輸入,講者可以控制自己講話的語調時,只要再加上硬體配合,語音轉文字就可以有很高的正確度。

語音辨識最需要的硬體設備是「人聲專用麥克風」人聲專用麥克風可以將人聲調整成最接近真人聲音的訊號來丟給軟體判讀,因為是傳送逼真的人聲,軟體誤判的機率就降低很多。

語音辨識軟體通常需要長時間學習,才能辨識正確,會導致這情況的原因有兩種,一是如上所述的講話方式與麥克風問題,二是軟體開發廠商夠不夠強,使用者可以多試用幾套看看。

如果不是自己要在電腦前講話給軟體判讀,而是在自然狀態下講話,最有效率的語音轉文字方式,只有人工作業的中英文聽打逐字稿而已。