SwiftScribe如何用 AI音頻轉錄工具SwiftScribe使用圖文說明教程
發表時間:2023-12-24 來源:明輝站整理相關軟件相關文章人氣:
[摘要]AI音頻轉錄工具SwiftScribe使用教程:百度美國推出了轉錄工具SwiftScribe,一個利用人工智能,讓用戶能快速將音頻快速轉成文字的免費網頁工具。百度在近年一直在持續改善其新一代深度語音識別系統DeepSpeech2。DeepSpeech2系統由百度硅谷人工智能實驗室(SVAIL)研發...
AI音頻轉錄工具SwiftScribe使用教程:
百度美國推出了轉錄工具SwiftScribe,一個利用人工智能,讓用戶能快速將音頻快速轉成文字的免費網頁工具。
百度在近年一直在持續改善其新一代深度語音識別系統DeepSpeech2。DeepSpeech2系統由百度硅谷人工智能實驗室(SVAIL)研發,并在去年被麻省理工科技評論評為2016年十大突破技術。
“百度在語音技術領域不斷進步,語音接口更為實用和有效。用戶可以愈加便利地與身邊的設備進行互動。百度的深度語音識別系統(DeepSpeech2)包含了一個非常龐大的神經網絡,引入了數以百萬計的轉錄語音。有時它在識別漢語語音片段方面,要比人為識別更加準確。”麻省理工科技評論寫道。
百度在去年也推出了應用DeepSpeech2的安卓輸入法應用TalkType,讓用戶能夠快速語音輸入文字。國際科技巨頭如微軟、亞馬遜、蘋果以及谷歌同樣在語音識別領域投入大量精力,但在長段語音識別轉錄上仍不及百度。
SwiftScribe支持上傳轉錄wav和mp3格式的音頻文件。一段30秒左右的音頻轉錄成文本時間大概為10秒,而一段1分鐘左右的文件大致需要30秒的轉錄時間。SwiftScribe最大支持用戶上傳1小時長的音頻文件,1小時的音頻則需要20分鐘左右的處理時間,百度的項目管理人武田介紹道。
但SwiftScribe的功能目前還沒有很完善,在轉錄成功后,用戶還需自行對文本進行編輯。SwiftScribe轉錄出來的文本是不帶標點符號的,用戶需要自行斷句、并對可能出現的錯誤進行更正、以及編輯英文單詞大小寫等。不過SwiftScribe同樣提供變速閱讀工具,讓用戶在校對編輯時可以調慢播放速度。


SwiftScribe的開發靈感源于武田在加州大學圣芭芭拉分校讀研期間的采訪經歷。
“我的母語不是英語,要整理一段1小時錄音對我來說要花上10個小時。而對于專業人士來說,時間也不短,大概要6小時,” 武田說道。
武田和同事Nina Wei在跟幾個速記員交流過后也為開發SwiftScribe找到了不少靈感。武田的團隊認為SwiftScribe能給速記員帶來1.67倍的效率提升,能縮短40%的工作時間,這也意味著他們能花同樣的時間賺到更多的錢。
顯而易見,SwiftScribe并不只是單單面向于速記員,它基于網頁,并免費為用戶提供服務,對于其他如記者等需要經常整理音頻文件的職業,SwiftScribe可謂是提高效率的神器。
“我們希望在未來能夠將其商業化,” 武田說道,透露在技術成熟后增加收費服務的打算。
武田的團隊計劃未來給SwiftScribe加入音頻自動轉錄文字、為視頻上字幕等功能,以及增加支持文件格式,并加入自動添加標點符號的功能。
學習教程快速掌握從入門到精通的電腦知識