|
回复: [12.28]PDF2TXT 1.2 - 完美支持中/英文PDF到TXT的DQ
引用:
|
作者: sandman
完美支持中/英文PDF到TXT的DQ,它χ形PDF文n的理能力超^Adobe的Acrobat, OCR版已支持Embed Font的抽取,於D像PDF也能抽取其中的文本。
wf明
1.完全支持PDF1.4fh(Acrobat 5.0支持)
2.支持日文(SHIFT-JIS、EUC等a)文本的抽取
3.支持BIG5文本的抽取
4.完全基於Unicode群耍支持字符集更多更V
5.任何工具件生成的PDF文n均可解析,PDF的炔垮e`流可以自蛹m正。
6.支持TrueType、Type0、Type1等字wa的理
7.实Windows界面,操作更楸憬
8.生成的TXT文n可保留原版面的格式丫
9.支持批量理
10.OCR插件支持OCR中文Re,可抽取任何PDF中的中文字符
11.可直接解析指定的PDF,c面序oP。
12.界面友好,在DQr既支持文件的DQ,也支持批量文件同rDQ,可以O置DQ的,可以只D任何一,也可以DQ任意之鹊乃有。
点这里下载
|
用过,好像不怎么好用,有些文档转换不成功
|