如何将您的Medium内容导出、排序和转换为Markdown
如何将您的Medium内容导出、排序和转换为Markdown
在我之前的文章中如何导出您的所有Medium内容 (opens new window)中,我们讨论了您如何备份您的内容以及Medium提供的优缺点。
对我来说,导出的两个最大的缺点是内容以HTML形式存在,并且故事、评论和草稿都被分组放在一个名为“posts”的文件夹中。
因此,我着手开发了一个解决方案来解决这两个不足之处。
- 我希望将文章转换为Markdown格式
- 我希望将文章按照不同的子文件夹进行排序
这是用Python编写的,但脚本是公开可用的,我鼓励任何人都可以分叉该存储库,以便在其他语言中构建它或为自己的目的进行扩展。如果您不愿意接过这个任务,那么请转到“问题”选项卡,并记录一个问题,如果有您想要更改的内容,我会尽力协助。 ## 解决方案
这个自定义脚本会在指定的文件夹(默认为/posts
)中进行搜索,并执行以下两个操作:
- 将每个HTML文件转换为Markdown文件
- 将文件分类到三个子目录之一:(drafts, stories, comments)
分类机制需要一些技巧才能找到,但我已经确定了以下逻辑:
- 草稿的文件名以
draft_
开头 - 故事的HTML内容包含用于标题的
<h3>
标签 - 评论的HTML内容不包含
<h3>
标签