这款文档转换工具,用了会上瘾

技宅空格2019-03-16 10:10:18

点击上方的「技宅空格」可以快速关注我们

全文 2300+ 字,阅读预计耗时 6 分钟

「咱们老王今天又布置作业了,在 QQ 群里。」

「哎呀,这次的怎么又是一个 Word 文件。」


自从上了大学之后,对于很多需要在电脑上完成的作业,老师们基本上是一言不合就往 QQ 群里放一个「.docx」,把所有的题目都塞在里面。



这往往会让我们感觉到头疼,特别是编程作业。虽然 Windows 作为一个多窗口的操作系统给我们提供了非常便捷地提供了快捷的分屏方案,但是,这仍然满足不了我们的需求。


Word 打开速度相较于记事本还是慢了不少,而且 Word 里的文本并非纯文本,在复制粘贴的时候很多情况下容易遇到一些奇奇怪怪的问题,最重要的是,即使是在微软自己家的 VSCode 里,Word 文件根本就没有办法打开!


这就让人非常头大了。于是空格灵机一动,我们完全可以把 Word 转换成 Markdown 或者是「.txt」啊,这不就完事了吗?


于是,空格发现了这个用多了真的会上瘾的神器。

Pandoc


这又又又又是一个开源的软件,Free! 虽然开源软件相较于一些商业化的软件来说在功能上会略显单一,在界面上会略显单薄,但是开源软件中也不乏精品。今天空格给大家推荐的这一个「Pandoc」正是一个不可多得的精品。



为什么说它是个神器呢?使用 Pandoc,你可以在非常多格式的文本里进行自由转换,笔者稍数了一下,Pandoc 支持的文档格式达到了近 30 种。


神奇的是,Pandoc 并没有转换上的限制,原则上 Pandoc 支持其支持的文档格式中任意两种格式的相互转化,且我们并不需要进行什么多余的设置,一切都是自动化的。


可以说 Pandoc 的存在就像是一把瑞士军刀, 这么一个小东西足以满足你对文档转换的一切需求。


由于 Pandoc 的迭代速度比较快,这里空格就给大家提供一个正版的下载地址(长按识别下方图中的二维码),需要注意的是最近国内通向 Github 的网络似乎是有一些堵塞,你可能需要一个更科学的上网方式。


使用方法


Pandoc 本身是一个命令行工具,没有图形化使用起来确实可能会有一点点吃力,不过好在 Pandoc 命令并不复杂,一行命令就能解决文档转换。


为了方便大家的使用,这里空格整理了一个 Pandoc 的命令参数表:



关于 Pandoc 的使用,这里空格举一个例子。


比如今天王老师用 Word 文件布置了一个作业,但是我们只想要纯文本,于是我们该怎么做呢?



首先我们用「Win+R」快捷键呼出「运行」对话框,敲入「cmd」,并按下回车,这个时候我们就能看到我们非常熟悉的黑框框了。


在切换好盘符之后,我们从资源管理器复制文档文件夹的地址,通过「cd」命令跳转到对应的目录下。



这里我们假设我们需要转化的文档叫「questions.docx」,需要输出的文件名为「questions.txt」,这个时候我们只需要下面这么一行命令:


pandoc questions.docx -o questions.txt


这个时候 Pandoc 会根据文件自动猜想其格式,给它几秒钟执行时间,最终我们就能得到下图这样一个文档了:


一行命令的事,我们就能把一个 docx 文档转化成一个纯文本文件。


当然,如果我们想让它变成一个网页、变成一个 Markdown 文本,甚至变成电子书、PDF 都是可以的。


当然我们也有一个更简单的方法,由于 Windows 的命令提示符是支持拖拽的,所以我们也可以先新建好对应的输出文件,然后用拖拽来组合这个命令。不过这种方式空格并不推荐,因为通过拖拽输入的路径均为「绝对路径」,所以我们必须要先新建好输出文件,而不是手动输入文件名。


需要注意的是,Pandoc 对表格的支持并不好,如果是转换到 Markdown 等这样支持渲染表格的文档格式,它仍然会将表格用最原始的字符方式展现出来,而不是借用转换到对应格式之后的渲染方法。



在获得了纯文本之后,我们可以非常方便的查看、打开、复制,也可以将其直接载入到 VSCode 这样支持分栏显示的编辑器里进行编辑、查阅。


当然,我们也可以随时将其转换回去。


大家都知道 Markdown 可以对一个文档进行非常轻松、快捷的排版,所以我们可以快速通过 Markdown 来写一个笔记。


你可能会问,什么是 Markdown 呢?


# 这是一个 Markdown 的标题

这是 Markdown 的正文


上述就是一个符合 Markdown 语法的文本样例,我们只需要通过一些简单的标识符就能赋予对应文本格式,这也是为什么对喜欢写笔记、写博客的同学来说,Markdown 是一个非常高效的文件格式。


有的时候我们在大学里交作业经常性需要提交一些文本,使用 Word 编辑往往会让人感觉比较麻烦,因为在 Word 里面光是标题的格式我们可能就需要非常繁琐地去调整。即使是加粗或编号,我们也需要停下写作来进行操作,这非常影响写作的连贯性。



然而使用 Markdown+Pandoc,我们就能避免这种烦恼。Pandoc 在转换文本的过程中会将 Markdown 的各级标题、正文按照 Word 文档的样式标准进行转换,熟悉 Word 的同学都知道,我们只需要调整对应的预置样式,就能快速改变所有对应本文的样式。


相较于在 Word 里编写文档来说,在 Markdown 里,我们能更直观地编写文档,同时我们也不需要因为某一段文本的样式需要调整而中断写作,整个体验会非常流畅。



不论你是学生还是职员,笔者认为 Pandoc 都能成为一个提升你办公效率的神器,说实话,在习惯了使用「Pandoc+?」这样基于某种文档格式转换的文档写作模式之后,笔者真的没有打开 Word 的欲望了。相较于 Word 来说,其他格式的文档更易于备份、管理、随时随地编辑。



今天的文章就到这里,希望今天的文章能对你的办公起到实质性的帮助。如果想获得更多 Pandoc 方面的使用指南,活在使用过程中遇到了什么疑问,空格欢迎你加入下方的读者交流群。


这里是技宅空格,我们明天见。



读者交流群(加群答案 - 催更):296770564


Copyright © 丰城计算器学习组@2017