ByteScoutPDFMultitool(PDF数据文本提取器)可以从pdf文件中提取数据和文本集,不管是PDF到XML,还是PDF到CSV,甚至还可以用正则表达式搜索文本从扫描的PDF文本,提取原始图像和更多!
![ByteScoutPDFMultitool(PDF数据文本提取器)](https://thumb.jfcdns.com/thumb/n2319k2abh14oa36/16f5c98864bb7321_460_0.jpeg)
基本简介
多功能工具ByteScoutPDFMultitool包括的功能从PDF文件中提取数据和文本集:PDF到XML,PDF到CSV,PDF为文本阅读使用OCR,用正则表达式搜索文本从扫描的PDF文本,提取原始图像和更多!包括OCR读数从图片中的文字,支持英语,德语,法语,西班牙语。以及提取文件附件,提取从PDF包文件,从PDF表单中提取FDF和XFA数据,提取ZUGFeRD发票数据作为XML,从合并PDF页面和更多!
软件特色
使用这个通用的应用程序,可以将PDF文件转换为多种文档和图像格式,读取损坏的文本,从文档中提取数据等等。ByteScoutPDFMultitool是一个易于使用且功能强大的转换套件,可以帮助用户将PDF文件保存为其他常见格式,如TXT、CSV、HTML甚至图像。
功能介绍
1.PDF转换及其扫描图像转换为文本搜索PDF文件;
2.阅读文本扫描文件(支持英语,德语,西班牙语,法语和更多)与功能的HTMLPDF浏览器后;
3.PDF到CSV转换,PDF到XML和XLS,PDF到XLSX和PDF到HTML的转换;
4.能够自动查找PDF文档中的表;
5.额外的选项,以分割,合并,提取页面从PDF;
6.在PDF文档中执行正则表达式搜索;
7.从PDF、XFA、XFDF中提取附件和内部数据;
8.将PDF转换为TIFF,PDF转换为PNG,PDF转换为BMP,PDF转换为HTML;
9.打印PDF文档;
更新日志
=大大提高了OCR的质量和性能。
=选择OCR等级的新选项。
=减少选择模式中过多的绘画。
=修正“合并文件”工具中“删除”按钮的行为。
=改进PDF文档的解析。
=改进PDF文档的呈现。
=其他较小的修复和改进。