查看单个帖子
旧 2005-01-28   #2
liccry
黄金会员
黄金会员五级会员
级别:10 | 在线时长:287小时 | 升级还需:43小时级别:10 | 在线时长:287小时 | 升级还需:43小时级别:10 | 在线时长:287小时 | 升级还需:43小时级别:10 | 在线时长:287小时 | 升级还需:43小时
 
liccry 的头像
 
注册: 05年01月27日
来自: +1 GMT
帖子: 569
声望力: 26
声望: 72 liccry 略通道行
积分:24
精华:5
现金:52两梁山币
资产:1002两梁山币
致谢数: 0
获感谢文章数:1
获会员感谢数:1
回复: [12.28]PDF2TXT 1.2 - 完美支持中/英文PDF到TXT的DQ

引用:
作者: sandman
完美支持中/英文PDF到TXT的DQ,它χ形PDF文n的理能力超^Adobe的Acrobat, OCR版已支持Embed Font的抽取,於D像PDF也能抽取其中的文本。
wf明
1.完全支持PDF1.4fh(Acrobat 5.0支持)
2.支持日文(SHIFT-JIS、EUC等a)文本的抽取
3.支持BIG5文本的抽取
4.完全基於Unicode群耍支持字符集更多更V
5.任何工具件生成的PDF文n均可解析,PDF的炔垮e`流可以自蛹m正。
6.支持TrueType、Type0、Type1等字wa的理
7.实Windows界面,操作更楸憬
8.生成的TXT文n可保留原版面的格式丫
9.支持批量理
10.OCR插件支持OCR中文Re,可抽取任何PDF中的中文字符
11.可直接解析指定的PDF,c面序oP。
12.界面友好,在DQr既支持文件的DQ,也支持批量文件同rDQ,可以O置DQ的,可以只D任何一,也可以DQ任意之鹊乃有。

点这里下载
用过,好像不怎么好用,有些文档转换不成功
liccry 当前离线