mathematica12.2有没有办法提取PDF文件指定矩形区域的文本?
mathematica吧
全部回复
仅看楼主
吧务
level 7
wengdeping88
楼主
2021年02月05日 06点02分
1
吧务
level 7
wengdeping88
楼主
我的文件差不多都是图片里这个样子的,每次表格样式都是其中一种,每个文件很多张相同样式的,里面的内容都是文本,可以复制,只是想实现自动批量处理
2021年02月06日 04点02分
2
吧务
level 15
xzcyr
翻了翻12.2的文档好像没说加了相关功能啊……感觉最现实的做法还是先全导进去再想法子提取。
这个不妨去SE试试。
2021年02月06日 07点02分
3
wengdeping88
谢谢!我也看了12.2,能导出文本,但是文本的顺序又不能保证从左到右、从上到下;识别文本的话又很容易出错。
2021年02月06日 12点02分
level 8
jiaoeyushushu
搞成图片,截取制定的位置,然后文字识别行吗?
2021年03月05日 10点03分
4
wengdeping88
一来不想有识别错误,二来对中文的识别效果也不理想。
2021年03月06日 00点03分
1