PCMag编辑选择和审查产品独立.如果您通过附属链接购买,我们可能获得佣金,这有助于支持我们的测试。

如何将pdf文件转换为Word文档和图像文件

相当多的应用程序,包括一些免费的,可以把你的pdf文件变成可编辑的Word文档或图像文件,你可以嵌入其中。这比你想象的要简单。

插图:René拉莫斯

这是一个常见的问题。有人给你发了一个PDF文件,你需要对它进行大规模的修改,这种大规模的编辑在你常用的PDF编辑器应用程序中是不可能做到的轻编辑到PDF.如何将PDF转换为可以进行编辑以添加或删除段落、将文本从文档的一个部分移到另一个部分等的文档?

还有一个问题:你需要将PDF转换成图片文件,以便在网上显示,插入到文档中,或上传到只接受jpg格式的网站。这个问题比第一个问题容易解决得多——答案在故事的结尾。

对PDF文件进行大规模编辑的唯一方法是将其转换为文字处理文档,这样你就可以在Word、谷歌Docs或任何其他文字处理应用程序中编辑它。困难的是,PDF(便携文档格式)标准是Adobe在20世纪90年代创建的开放标准,它与DOCX文字处理格式完全不兼容,而DOCX文字处理格式现在是Microsoft Word和几乎所有其他东西的标准。不要相信任何声称能让PDF编辑像Word一样简单的供应商。这种编辑在PDF文件中是不可能的。你必须先把PDF转换成另一种文档。

这个问题没有完美的解决方案,但有很多足够好的解决方案。您应该使用哪种解决方案取决于您需要编辑的PDF类型。如果PDF是通过从Windows、Mac或Linux应用程序导出到PDF创建的,那么解决方案相对简单,因为PDF的文本嵌入到PDF文件中,可以提取。然而,如果PDF是通过扫描或拍摄打印文本创建的,那么问题就困难得多,因为需要对扫描的图像使用OCR(光学字符识别)来提取文本,而这个过程总是有引入错误的风险。


如何判断PDF是应用程序创建的还是扫描的?

如果你不知道一份PDF文件是由应用程序创建的,还是由相机或扫描仪创建的,下面是如何找出答案的方法。

在默认的PDF应用程序中打开PDF,例如Windows 11中的Edge, macOS中的Preview,或adobeacrobatreader(在一个新窗口中打开).试着用鼠标拖动来选择一些文本。如果您可以选择文本,那么PDF是从应用程序导出的—或者它已经应用了OCR,这也一样好。如果不能选择文本,则需要扫描PDF并应用OCR,然后才能将其转换为Word文档。


如何转换pdf与嵌入式文本使用Word

让我们从不需要OCR的pdf开始,换句话说,带有嵌入式文本的pdf。转换PDF最简单的方法是在Microsoft Word中打开它,让Word转换内容。

像在Word中打开任何其他文件一样打开它。启动Word,打开文件>,选择PDF文件。或者右键单击文件,选择用> Microsoft Word打开。该文件可能需要一些时间来处理,然后作为可编辑的Word文档打开。

在Word中打开文件,右键单击文件图标并选择用> Microsoft Word打开

这个解决方案工作得相当好,但内容可能看起来并不完全正确。PDF中的内容“固定”在页面上的一个位置,PDF不允许插入或删除段落,同时保留文档的流程,就像在文字处理程序中那样。

以下是微软列出的可能无法正确转换的内容:

  • 具有单元格间距的表

  • 页面颜色和页面边框

  • 追踪变化

  • 脚注跨度超过一页

  • 尾注

  • 音频、视频和PDF活动元素

  • PDF书签

  • PDF标记

  • PDF的评论

  • 字体效果,如辉光或阴影(在Word文件中,效果用图形表示)

当你在Word中打开PDF文件时,你可能会看到一个警告:

在Microsoft Word中打开PDF时出现的警告

它说:“Word现在会把你的PDF文件转换成可编辑的Word文档。”“这可能需要一段时间。生成的Word文档将经过优化,允许你编辑文本,所以它可能看起来不完全像原始的PDF,特别是如果原始文件包含很多图形。”

也就是说,图像会被拉进来,但它们可能不是你想要的位置。你的文本可能会出现在文本框中,而不是在页面中自由流动。但至少你会有一个可以使用的文档。

如果你想在编辑完成后将其导出为PDF格式,只需使用Word的导出或另存为菜单,将文档导出为PDF格式。

顺便说一下,这种转换不仅适用于Word桌面应用程序,也适用于Word的免费网页应用程序版本(可在office.com找到)。你在Word Online中打开一个PDF文件,它是可见的,但点击“在Word中编辑”链接,你可能会看到一个文件转换警告:

在将pdf转换为可编辑文档时,在microsoftword中看到文件转换警告

接着是另一个关于布局更改的警告,等等。但内容将在那里和可编辑,即使看起来不稳定。试试吧。


Acrobat、Adobe的PDF转换器和谷歌文档方法

在Word中打开PDF只是将PDF文件转换为DOCX格式的一种方法。使用pdf编辑应用程序(如Adobe Acrobat DC)可能会得到更好的效果。根据我的经验,在将pdf导出为Word格式方面,Acrobat做得比其他任何工具都好。

在Acrobat中打开PDF文件,从菜单中选择文件/导出到…,并导出到Word格式。在整理页眉和页脚等页面格式方面,Acrobat做得比Word好得多。Word有时会将标题中的文本与文档的文本混淆,但Acrobat几乎总是正确的。

Acrobat的问题是它要花钱——但Adobe提供了一个免费在线PDF转换器(在一个新窗口中打开)您可以使用它来获得与从Acrobat得到的相同的结果。

Adobe的免费在线工具,包括一个将pdf文件转换为可编辑的Word文档的工具
使用Adobe的免费在线工具转换PDF文件

你可以找到更便宜的PDF软件,将应用程序创建的PDF转换为DOCX格式,但我还没有找到任何一个可以像Acrobat那样做得好。

其他数十个免费的在线PDF转换网站承诺提供可编辑的文本,但我不推荐它们中的任何一个作为可信任的上传数据的地方。不过,Adobe已经足够完善,我可以放心使用它来处理普通文档,不过我不会上传任何我非常需要保密的文件。

我有时还听到有人推荐用谷歌Docs将PDF文件转换成Word文件。使用说明与使用Acrobat类似:打开文件进行编辑,然后下载Word格式的文件。然而,每次我尝试的结果都很糟糕。你的运气可能会好一些。


如何将扫描文档转换为Word格式

到目前为止,我所写的所有内容都集中在从应用程序导出的PDF上,这样文本就嵌入到PDF中了。如何转换扫描仪或相机生成的pdf文件?

根据扫描图像的质量,你可能能够在Word中打开它,Word的内置OCR可能能够创建可编辑的文本。我曾成功处理过清晰的单页图片,但Word根本无法处理复杂的内容,比如扫描一本书,而且往往会产生无法使用的文本和图像混合。

在将扫描图像转换为可编辑的文本时,Acrobat在创建PDF方面做得不错,但它的功能远不及OCR工具的编辑选择(Editors’Choice),ABBYY FineReaderPDF 15($199)。FineReader的OCR引擎比我试过的其他任何东西都更准确,它还有一个独特的错误检查功能,就像文字处理器中的拼写检查器一样,所以你可以在导出结果之前修复OCR错误。FineReader将结果导出为Word、PDF和其他格式,生成的文件比我发现的任何文件都有用得多。

如果您仍然拥有被扫描或转换为图像文件的原始文档,则可以使用带有OCR的移动扫描应用程序捕获和提取文本。


如何将PDF导出为JPG或其他图像格式

如果你需要将PDF文件转换成图像文件,在Mac上要比在PC上容易得多。

在Mac上,只需在预览中打开PDF。使用File > Export菜单并选择您想要的图像格式和您喜欢的选项,您就有了您的图像文件。

在Windows上,最好的无成本方法是创建一个免费的Adobe帐户(在一个新窗口中打开)然后转到cloud.acrobat.com/exportpdf(在一个新窗口中打开).将PDF拖到窗口上。进入“转换为>图像>图像格式(JPEG、PNG或TIFF)”,使用滑块选择图像质量。多页pdf被转换成单独的图像文件。然后,您可以下载带有映像文件的ZIP文件。

如果您担心隐私问题,不想与Adobe共享数据,那么可以使用许多图像编辑器将PDF导出为图像文件。我最喜欢的是XnViewMP(在一个新窗口中打开),供个人和教育使用免费。当您在XnViewMP中打开PDF时,您可能需要按照提示安装用于处理PDF和PostScript文件的开源GhostScript应用程序,但是您可以使用XnViewMP将PDF导出为任何标准图像格式。请记住,所有字体都将从可扩展的TrueType格式转换为位图,小文本将看起来块状。

如果需要微调导出选项,任何商业PDF编辑器都可以导出到图像文件。FineReader, Acrobat和PDF-Xchange编辑器(在一个新窗口中打开)所有的工作都有很好的效果,包括选项,创建小文件适合显示在网上,插入到文档,或使用其他地方,pdf不支持或不方便。

Tips & Tricks<\/strong> newsletter for expert advice to get the most out of your technology.","first_published_at":"2021-09-30T21:23:24.000000Z","published_at":"2022-08-31T18:37:00.000000Z","last_published_at":"2022-08-31T18:36:55.000000Z","created_at":null,"updated_at":"2022-08-31T18:37:00.000000Z"})" x-show="showEmailSignUp()" class="rounded bg-gray-lightest text-center md:px-32 md:py-8 p-4 mt-8 container-xs">

比如你在读什么?

报名参加提示和技巧通讯的专家建议,以获得最大限度的技术。

本通讯可能包含广告、交易或附属链接。订阅通讯表明您同意我们的使用条款而且隐私政策.您可以随时取消订阅通讯。beplay体育苹果下载


感谢您的报名!

您的订阅已被确认。留意你的收件箱!

注册其他通讯beplay体育苹果下载

你会喜欢的PCMag故事

关于爱德华·门德尔松

Edward Mendelson自1988年以来一直是《PC杂志》的特约编辑,并撰写了大量关于Windows和Mac软件的文章,特别是关于办公、互联网和实用程序的文章。

阅读爱德华的完整简历

阅读爱德华·门德尔松的最新文章

Baidu
map