本操作适合金鸣表格文字识别程序的网页版(新版)。
表格识别:
excel(xlsx):将需识别的图片转换成编辑的xlsx格式,此格式仅支持excel2007以上版本或wps打开。
excel(xls):将需识别的图片转换成编辑的xls格式,此格式支持excel2003以上版本或wps打开。
文表混合(doc):可识别图片中的文字和表格,并输出可编辑的文表混合的word。
高精还原:
结构还原:将图片中显示的文字按原有结构输出排版。
智能分段:可智能分段输出文字,比较适合对分段要求较高、排版结构较简单的图片识别,如合同、书本等。
显示表格:针对结构还原输出,当图片中有表格线时,输出的文档也会显示表格线。
显示图片:针对结构还原输出,将图片做为背景显示文档。
自动切边:主要针对翻页拍照或扫描出来的图片,能将无关部分剪切掉,以提高识别率。
保留印章:能自动识别印章,并在输出的文档按原位置显示。
文字识别:
纯文本输出:识别结果为无格式的txt文本文件。
有格式word:识别结果为无格式的word文档,即不保留排版和样式。
有格式word:相当于高精还原中的“结构还原”输出,保留排版输出word,尽可能还原其原有结构,但不显示表格线和印章,识别精度也较其逊色。
要点:
如果要输出excel,最适合使用“表格识别”模块,如果要还原图片中的文字排版结构/保留印章/智能分段,可以用高精还原,如图片中以表格为主,也可选择高精还原中的“仅提取表格”。
如果不要求保留印章和显示表格,只要保留文字排版并输出word,也可以尝试用普通还原。
文表混合输出调用的是表格识别模块,比较适合以表格为主或带有表格的图片识别转换。