發(fā)表時(shí)間:2023-06-23 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
清華紫光OCR官方版是一款專業(yè)優(yōu)秀的圖像識(shí)別工具。清華紫光OCR最新版能夠直接將圖片信息提取出來,支持從TIF、BMP和PCX圖片格式中讀取文字內(nèi)容。清華紫光OCR軟件還支持簡/繁體中文、英文和手寫中英文,可以快速完成識(shí)別,識(shí)別率、準(zhǔn)確率都十分的高。
清華紫光OCR軟件功能
清華紫光OCR支持Windows環(huán)境下的GB、BIG5、JIS和Shift-JIS等多種內(nèi)碼。在印刷體漢字識(shí)別中還加入了MMX優(yōu)化技術(shù),使識(shí)別速度得到了很大提高。我們用它識(shí)別一頁A4大小的印刷體中英文混排的純文本文件,只用了幾秒鐘。而且識(shí)別率非常高,只有極個(gè)別的字出現(xiàn)了差錯(cuò)。
在這個(gè)版本中新增了表格識(shí)別功能。選擇了識(shí)別表格的選項(xiàng)后,它會(huì)自動(dòng)將表格的框線先識(shí)別出來,再對(duì)表格中的文字進(jìn)行識(shí)別。文字全部識(shí)別出來之后會(huì)將文字按原樣恢復(fù)到表格中。在這項(xiàng)測試中識(shí)別率也很不錯(cuò)。但是在測試中我們的工程師發(fā)現(xiàn),當(dāng)文字與表格的框線距離較近時(shí),它的識(shí)別效果就沒有那么理想了。
如果用戶想對(duì)一個(gè)圖文混排的文件進(jìn)行識(shí)別,則清華紫光OCR還具有版面自動(dòng)分析功能。它自動(dòng)對(duì)掃描的版面進(jìn)行分析,把應(yīng)識(shí)別的文字區(qū)域劃分出來,之后進(jìn)行識(shí)別。對(duì)于被劃分區(qū)域內(nèi)的文字有很高的識(shí)別率,而且速度同樣很快。不過遺憾的是,在這個(gè)版本中沒有提供版面自動(dòng)恢復(fù)的功能,因此如果想把文件恢復(fù)成原來的版面,則還需要重新手動(dòng)排版。
它的導(dǎo)出功能可以將帶有表格的文當(dāng)導(dǎo)出成為RTF格式的文件,從而允許用戶在Word等應(yīng)用程序中繼續(xù)進(jìn)行編輯。它還可以將掃描進(jìn)來的圖像格式轉(zhuǎn)換成TIFF、BMP或PCZ等格式,具有很大的靈活性。
它的批量識(shí)別功能可以讓用戶一次把多頁文稿全部掃描之后再進(jìn)行識(shí)別,避免了掃描一頁識(shí)別一頁帶來的麻煩。這一版本最多可實(shí)現(xiàn)10000頁的批量識(shí)別。
該版本還增加了一項(xiàng)非常實(shí)用的功能,就是手寫體的識(shí)別。有了這一功能,許多以前手寫的信件或文件就可以掃描到計(jì)算機(jī)中,識(shí)別出來后用電子文檔的方式進(jìn)行保存了。
不過目前的手寫體識(shí)別功能還不夠完全成熟,它對(duì)書寫有很高的要求,如每個(gè)字之間要有一定的間隔,不能有連筆的情況等。盡管如此,手寫體識(shí)別這一功能還是能夠在一定程度上減輕文字錄入工作的負(fù)擔(dān)。
該OCR還具有自學(xué)習(xí)功能,當(dāng)遇到有生僻字時(shí),可以通過鍵盤輸入進(jìn)行學(xué)習(xí)。有了這一功能,用戶就可以自由地添加一些本來不“認(rèn)識(shí)”的字,大大拓寬了中文OCR系統(tǒng)的識(shí)別字符集。
清華紫光這一款專業(yè)版的OCR軟件,不僅可以對(duì)純文本文件進(jìn)行識(shí)別,而且可以進(jìn)行復(fù)雜的圖文混排和圖表文檔的識(shí)別,最大限度地把人們從繁雜的文字再錄入的工作中解脫出來。
清華紫光OCR軟件特色
1、識(shí)別率高、速度快:對(duì)于被劃分區(qū)域內(nèi)的文字有很高的識(shí)別率,而且速度同樣很快。
2、導(dǎo)出功能:可以將帶有表格的文當(dāng)導(dǎo)出成為RTF格式的文件,從而允許用戶在Word等應(yīng)用程序中繼續(xù)進(jìn)行編輯。
3、版面自動(dòng)分析:對(duì)圖文混排的文件具有版面自動(dòng)分析功能,它自動(dòng)對(duì)掃描的版面進(jìn)行分析,把應(yīng)識(shí)別的文字區(qū)域劃分出來,之后進(jìn)行識(shí)別。
4、轉(zhuǎn)換圖像格式:將掃描進(jìn)來的圖像格式轉(zhuǎn)換成TIFF、BMP或PCZ等格式,具有很大的靈活性。
5、批量識(shí)別:可以讓用戶一次把多頁文稿全部掃描之后再進(jìn)行識(shí)別,避免了掃描一頁識(shí)別一頁帶來的麻煩,這一版本最多可實(shí)現(xiàn)10000頁的批量識(shí)別。
6、手寫體識(shí)別:手寫的信件或文件就可以掃描到計(jì)算機(jī)中,識(shí)別出來后用電子文檔的方式進(jìn)行保存。
7、自學(xué)習(xí):當(dāng)遇到有生僻字時(shí),可以通過鍵盤輸入進(jìn)行學(xué)習(xí),用戶就可以自由地添加一些本來不“認(rèn)識(shí)”的字,大大拓寬了中文OCR系統(tǒng)的識(shí)別字符集。
8、漢字和英文混排、日文和英文混排、韓文和英文混排同時(shí)識(shí)別。
9、是唯一可以識(shí)別2萬多漢字的多體文字識(shí)別系統(tǒng),漢字識(shí)別國內(nèi)最優(yōu)。
10、支持多種環(huán)境接口。文通TH-OCR支持WINDOWS環(huán)境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內(nèi)碼,適合全球各個(gè)地區(qū)使用。TH-OCR還具有自學(xué)習(xí)功能,不論什么生僻字,都可以通過鍵盤輸入進(jìn)行學(xué)習(xí),大大拓寬了OCR系統(tǒng)的識(shí)別字符集。
清華紫光OCR使用方法
1.文件->打開,選擇要識(shí)別的文件,可以是tif、bmp、jpg格式的
2.命令->識(shí)別,會(huì)自動(dòng)識(shí)別的
3.識(shí)別完成后,軟件左邊的樹狀欄里會(huì)有圖像文件名,用鼠標(biāo)點(diǎn)開哪個(gè)加號(hào),就是識(shí)別后的文本文件
4.單擊它,軟件右邊上方是識(shí)別后的文本,下方是被識(shí)別的圖像文件
5.這時(shí)用鍵盤移動(dòng)光標(biāo),就能查看圖像和對(duì)應(yīng)文本,并能直接改動(dòng)文本
6.二值圖像就是只有黑白兩色的圖像,用windows自帶的畫圖軟件就能做出來
7.先用畫圖打開圖像,圖像->屬性,將顏色改成黑白,再存盤就得到二值圖像了
清華紫光OCR更新日志
1.修復(fù)若干bug;
2.優(yōu)化細(xì)節(jié)問題;
騰訊視頻官方版 | 45.34MB
愛奇藝視頻官方正式版 | 35.10MB
暴風(fēng)影音最新版下載 | 50.3MB
QQ音樂官方正式版 | 24.2MB
酷狗音樂2022下載 | 37MB