主包做了一个论文阅读自动化工具:从 PDF 到 Markdown 知识库。以前主包用zotero管理和读论文,最大的问题不是找不到 PDF,而是 PDF 很难真正进入我的知识库。PDF 适合保存、排版和引用,但不太适合二次加工。同时一些翻译服务,插件不太好用。

同时如果想复制内容,经常格式混乱。

  • 想让 AI 总结,容易受分页、页眉页脚、分栏影响。

  • 想做笔记,内容和想法经常分离。

  • 想建立知识关联,只能手动整理。想放进 Obsidian,也很难变成真正可编辑、可链接的知识节点。

所以我做了一个自动化工作流。主要功能流程很简单:

  1. 上传一篇 PDF,系统会自动把文献解析成 Markdown。Markdown 相比 PDF,对知识管理更友好:它是纯文本,方便搜索和版本管理。结构清晰,标题、段落、列表、公式、图片都更容易被处理。可以直接放进 Obsidian,和其他笔记建立双向链接。也更适合 AI 阅读、总结、翻译和问答。后续接入 LLM、RAG 知识库时,Markdown 比 PDF 更容易切分、索引和召回。

  2. 如果上传的是英文论文,系统会自动翻译成中文 Markdown。如果本身就是中文文档,就不会重复翻译。

  3. 最后会生成一个完整目录:原始 PDF、Markdown 正文、中文译文、问答、元信息、Obsidian Base 数据库记录

  4. 它还会自动抓取论文信息,比如作者、年份、DOI、期刊、引用数、影响因子、JCR 分区、中科院分区等。

  5. 更重要的是,它会扫描参考文献。如果这篇论文引用了我 Obsidian 里已有的论文,就会自动建立双向链接。让每篇论文进入知识库之后,都变成可阅读、可编辑、可检索、可关联、可被 AI 使用的 Markdown 知识节点。

网站:

视频介绍: