神器WebToEpub

背景

自从doocer渐渐停止服务以来(印象中是2020年7月左右),
一直找不到一个能够将在线教程转换为电子书的方法.
偶然间遇到了WebToEpub这个神器.迫不及待记录下来.

介绍

一个用于将在线教程转换为电子书的chrome插件.
特色

  1. 对于有着章节结构的网页,能够嗅探到各个目录链接,大大减少手工劳动
  2. 可以发现多层目录,甚至相比doocer只能发现一层目录还强
  3. 拥有大量自定义功能
    1. 选取页面的哪些部分(仅仅content)
    2. 排除页面的哪些部分(比如广告,不必要的链接,按钮等)
    3. 自定义提取后的css样式

缺点:

  1. 能够自定义就基本意味着内置的部分不多
  2. 转换代码块有一些css上的问题,需要手动纠正
  3. fetch图片时虽然给出了报错(没有拼接好相对路径),但图片还是正常下载下来了

简单使用

  1. 打开想电子书化的页面
  2. 点击并启动插件,此时会弹出一个配置页面
  3. 进行提取配置
    1. 主要是写css选择器来过滤内容
    2. 使用 Test 来预览效果,注意右侧的滚动条,
      可能由于网页本身有大片空白而只看到很少的字
    3. 使用Apply就进入了下一个页面
  4. 进行输出配置
    1. 设置书名,作者,封面等等(自定义功能太丰富了)
    2. 输出时的CSS
    3. 选择要输出的章节
    4. 最好勾选(skip chapters that return HTTP 404 error)
  5. 输出即可

通用代码输出配置

1
2
3
4
pre {
padding: 0.85em 1em;
border: 1px solid black;
}

后续流程

如果想在kindle上查看该电子书,
则推荐使用另一个神器Calibre,该工具可以:

  1. 转换epub到kindle支持的格式(azw3,mobi等),并且可以精确选择输出设备为kindle oasis.
  2. 传文件到kindle.
    1. 不是用标准的打开外接磁盘,拷贝文件到特定文件夹,有点小失望.

参考

  1. WebToEpub官方