- ·上一篇:在WORD里面打字的笔顺,怎么输入?
- ·下一篇:怎样在word中制作混合页面
如何把扫描的文件转换成文本?!
1.如何把扫描的文件转换成文本?!
OFFICE2003自带一个可以转换PDF格式的文件,可以用它,我用过,不错 首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
如果在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。 运行 Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。
这可能需要一些时间”,不管它,确认即可。 小提示:Microsoft Office Document Imaging对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
2.请问如何把扫描的文字转换成word文档,而不是图形文件
建议你安装Office的时候选择将其附加程序完全安装.
然后在XP系统下。扫描仪连接后,双击扫描仪,然后会出来一个 Microsoft Office Documents Scanning 的提示..
选用它来扫描。待扫描完成后.上方有个带word图标的按钮.按一下。你就会发现你扫描的文字已经存在于word中了..只不过他存出来是web格式的.doc文档。你做简单的转化就行了.
这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。
以上是在windows XP + Office 2003下运行通过.
除此之外.你可以装OCR软件,它的用途就是识别图片内的文字,但是对于太过于复杂的图片识别效果很不好。.
比较好的有老牌的紫光OCR.你可以试试.
3.怎样将扫描件转换成word文档
请你试用汉王PDF OCR8.1简体中文版的PDF识别软件,简单易用免费,无限制,但要逐页转换。
方法是下载安装汉王pdf ocr8.1,运行并打开PDF文件,如PDF的字号较小,在打开时请不用默认分辨率,自行设定最高分辨率为600DPI,逐页打开PDF文件后,可直接进行识别,但最好是进行水平调整,手工设置识别区域,分出文字区、表格区和图片区,然后才开始识别,这样的识别率较高,识别后进行校稿,对照原稿校正错别字。最后是选择已识别转换校对好的页面,在菜单-输出-到指定输出文件格式,可输出为TXT、RTF、XLS等文件格式。
如要输出WORD格式,请选择RTF格式,用WORD打开后,将文字从文字框中复制出来按需要编辑一下即可。
4.怎样把扫描件转换成word文档
1.装一下WORD自带的组件,03和07的都行。点开始-程序-控制面板-添加/删除程序,找到Office-修改 找到Microsoft Office Document Imaging 这个组件,Microsoft Office Document Imaging Writer 点在本机上运行,安装就可以了。
2.你得先把这些打印稿或文件通过扫描仪扫到电脑上去。由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。这里也要设置为“黑白模式”,建议分辨率为300dpi。
3.之后将扫描好的图片文档另存为“BMP”文档,再将此BMP模式的文档另存为“TIFF”文档。
4.将此TIFF文档在“Microsoft Office Document Imaging”中打开。 点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到 Word中去了。如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中 了。
