如何将您的Medium内容导出、排序和转换为Markdown

如何将您的Medium内容导出、排序和转换为Markdown

在我之前的文章中如何导出您的所有Medium内容 (opens new window)中,我们讨论了您如何备份您的内容以及Medium提供的优缺点。

对我来说,导出的两个最大的缺点是内容以HTML形式存在,并且故事、评论和草稿都被分组放在一个名为“posts”的文件夹中。

因此,我着手开发了一个解决方案来解决这两个不足之处。

  • 我希望将文章转换为Markdown格式
  • 我希望将文章按照不同的子文件夹进行排序

这是用Python编写的,但脚本是公开可用的,我鼓励任何人都可以分叉该存储库,以便在其他语言中构建它或为自己的目的进行扩展。如果您不愿意接过这个任务,那么请转到“问题”选项卡,并记录一个问题,如果有您想要更改的内容,我会尽力协助。 ## 解决方案

这个自定义脚本会在指定的文件夹(默认为/posts)中进行搜索,并执行以下两个操作:

  1. 将每个HTML文件转换为Markdown文件
  2. 将文件分类到三个子目录之一:(drafts, stories, comments)

分类机制需要一些技巧才能找到,但我已经确定了以下逻辑:

  • 草稿的文件名以draft_开头
  • 故事的HTML内容包含用于标题的<h3>标签
  • 评论的HTML内容不包含<h3>标签

如何使用medium-story-parser #