把掃描件轉(zhuǎn)化成文本格式

把掃描件轉(zhuǎn)化成文本格式

ID:12550149

大?。?9.00 KB

頁數(shù):3頁

時間:2018-07-17

把掃描件轉(zhuǎn)化成文本格式_第1頁
把掃描件轉(zhuǎn)化成文本格式_第2頁
把掃描件轉(zhuǎn)化成文本格式_第3頁
資源描述:

《把掃描件轉(zhuǎn)化成文本格式》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、首先你得先把這些打印稿或文件通過掃描儀掃到電腦上去,一般單位都有掃描儀,如果沒有也沒關(guān)系,用數(shù)碼相機拍也行,拍成圖片放到WORD里面去,不過在些之前,你還得裝一下WORD自帶的組件,03和07的都行。點開始-程序-控制面板-添加/刪除程序,找到Office-修改找到MicrosoftOfficeDocumentImaging這個組件,MicrosoftOfficeDocumentImagingWriter點在本機上運行,安裝就可以了。首先將掃描儀安裝好,接下來從開始菜單啟動“MicrosoftOffice/MicrosoftOffice工具

2、/MicrosoftOfficeDocumentScanning”即可開始掃描。  提示:Office2003默認(rèn)安裝中并沒有這個組件,如果你第一次使用這個功能可能會要求你插入Office2003的光盤進(jìn)行安裝。由于是文字掃描通常我們選擇“黑白模式”,點擊掃描,開始調(diào)用掃描儀自帶的驅(qū)動進(jìn)行掃描。這里也要設(shè)置為“黑白模式”,建議分辨率為300dpi。掃描完畢后回將圖片自動調(diào)入Office2003種另外一個組件“MicrosoftOfficeDocumentImaging”中。  點擊工具欄中的“使用OCR識別文字”按鍵,就開始對剛才掃描的

3、文件進(jìn)行識別了。按下“將文本發(fā)送到Word”按鍵即可將識別出來的文字轉(zhuǎn)換到Word中去了。如果你要獲取部分文字,只需要用鼠標(biāo)框選所需文字,然后點擊鼠標(biāo)右鍵選擇“將文本發(fā)送到Word”就將選中區(qū)域的文字發(fā)送到Word中了。此軟件還有一小技巧:通過改變選項里的OCR語言,可以更準(zhǔn)確的提取文字。例如圖片里為全英文,把OCR語言改為“英語”可以確保其準(zhǔn)確率,而如果是“默認(rèn)”則最終出現(xiàn)的可能是亂碼~還有:應(yīng)該說,PDF文檔的規(guī)范性使得瀏覽者在閱讀上方便了許多,但倘若要從里面提取些資料,實在是麻煩的可以。回憶起當(dāng)初做畢業(yè)設(shè)計時規(guī)定的英文翻譯

4、,痛苦的要命,竟然傻到用PrintScreen截取畫面到畫圖板,再回粘到word中,夠白了:(最近連做幾份商務(wù)標(biāo)書,從Honeywell本部獲取的業(yè)績資料全部是英文版的PDF,為了不再被折磨,花費了一個晚上的時間研究PDF和Word文件的轉(zhuǎn)換,找到下面2種方法,出于無產(chǎn)階級所謂的同甘共苦之心,共享下:)1、實現(xiàn)工具:Office2003中自帶的MicrosoftOfficeDocumentImaging應(yīng)用情景:目前國外很多軟件的支持信息都使用PDF方式進(jìn)行發(fā)布,如果沒有AdobeReader,無法查看其內(nèi)容,如果沒有相關(guān)的編輯軟件

5、又無法編輯PDF文件。轉(zhuǎn)換為DOC格式則可以實現(xiàn)編輯功能。盡管有些軟件也可以完成PDF轉(zhuǎn)換為DOC的工作,但很多都不支持中文,我們利用Office2003中的MicrosoftOfficeDocumentImaging組件來實現(xiàn)這一要求最為方便。  使用方法:????第一步:首先使用AdobeReader打開待轉(zhuǎn)換的PDF文件,接下來選擇“文件→打印”菜單,在打開的“打印”設(shè)置窗口中將“打印機”欄中的“名稱”設(shè)置為“MicrosoftOfficeDocumentImageWriter”,確認(rèn)后將該PDF文件輸出為MDI格式的虛擬打印文

6、件。  編輯提示:如果你在“名稱”設(shè)置的下拉列表中沒有找到“MicrosoftOfficeDocumentImageWriter”項,那證明你在安裝Office2003的時候沒有安裝該組件,請使用Office2003安裝光盤中的“添加/刪除組件”更新安裝該組件。  第二步:運行MicrosoftOfficeDocumentImaging,并利用它來打開剛才保存的MDI文件,選擇“工具→將文本發(fā)送到Word”菜單,并在彈出的窗口中勾選“在輸出時保持圖片版式不變”,確認(rèn)后系統(tǒng)提示“必須在執(zhí)行此操作前重新運行OCR。這可能需要一些時間”,

7、不管它,確認(rèn)即可。  編輯提示:目前,包括此工具在內(nèi)的所有軟件對PDF轉(zhuǎn)DOC的識別率都不是特別完美,而且轉(zhuǎn)換后會丟失原來的排版格式,所以大家在轉(zhuǎn)換后還需要手工對其進(jìn)行后期排版和校對工作。2、實現(xiàn)工具:SolidConverterPDF應(yīng)用情景:利用Office2003中的MicrosoftOfficeDocumentImaging組件來實現(xiàn)PDF轉(zhuǎn)Word文檔在一定程度上的確可以實現(xiàn)PDF文檔到Word文檔的轉(zhuǎn)換,但是對于很多“不規(guī)則”的PDF文檔來說,利用上面的方法轉(zhuǎn)換出來的Word文檔中常常是亂碼一片。為了恢復(fù)PDF的原貌

8、,推薦的這種軟件可以很好地實現(xiàn)版式的完全保留,無需調(diào)整,而且可以調(diào)整成需要的樣板形式。??????使用方法:????????1、下載安裝文件SolidConverterP

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。