曲淡歌@qudange

2024 年 7 月 16 日

语音笔记AudioPen的“平替”

前言

在b站发出AudioPen的视频后，有网友问有没有能自己部署的项目做平替，那今天就来分析一下如何找到AudioPen的平替。

现有项目

AudioPen的工作原理其实并不复杂，语音转文字–>文字发给LLM，也就是说它并没有核心技术，只是现有技术的整合，因此如果去google以audio notes为关键词搜索，能找到好几个类似的软件，但是他们的定价策略甚至还比不过AudioPen，因此不考虑这类软件。

语音输入法+LLM

最简单的办法就是用语音输入法输入一段文字，然后发给任何一个大语言模型（比如ChatGPT），然后告诉它：“你现在是速录员，请把下面的口语整理为通顺的书面表达”，通过微调提示词，可以得到不同的效果。

Alog：ios平台+需要网络

如果使用的苹果设备，可以去app store搜索alog，这是一个可以使用自己的LLM key的软件，同时还支持apple watch端，是一个我比较看好的软件，它采用ios内置的本地语音转文字功能，仅需要自己去解决第二步的问题，而互联网上有很多免费的key获取途径。

OralPen：ios平台+需要网络

Allwillcome/OralPen: 出口， AI 成章| Record voice and refine it into language ChatGPT understands.

这是一个使用ios的快捷指令实现的脚本，也是通过ios内置的本地语音转文字，然后将转录稿发送给自定义的LLM，其实只要读懂了这个脚本，几乎就可以在任何一种设备上复刻AudioPen。

![[assets/Pasted image 20240716175420.png|assets/Pasted image 20240716175420.png]]

whisper+llm本地离线：任何平台+无需网络

通过上面的两个例子，我们完全可以通过whisper本地模型来转录语音，再用LLM来处理文字，如果本地算力足够，可以通过如ollama等服务在本地部署自己的LLM并通过api来使用它。

小结

看上去有很多方法，但殊途同归，他们都是采用的同样一套原理。但是AudioPen的效果出奇的好，可能作者在某些细节进行了处理，因此，如果想得到最好的效果，目前来看，我还是推荐付费使用产品。如果只是想尝鲜，完全可以用语音输入法那个方案，同时像ChatGPT本身就支持语音输入，也可以直接让它帮你总结。

本文永久更新地址:

https://blogs.qudange.top/p/2024-07-16-audiopen-substitute/

#geek^[17] #元知识^[4] #效率工具 #知识管理 #笔记软件

2024 年 7 月 16 日 364 45

回复取消回复

曲淡歌@qudange

2021 年 8 月 5 日

滴答清单教育优惠
https://www.dida365.com/education
使用edu邮箱可以享受75折

#效率工具 #购物^[2]

2021 年 8 月 5 日 394

曲淡歌@qudange

2020 年 3 月 21 日

我的云笔记使用体验+优缺点分析

前言：本文旨在记录自己对各种云笔记本的体验与权衡选择，并且一次专业的评测，若内有谬误与夹带私货，引起您的不适，请及时点击右上方的X。最后，衷心希望可以为后来者减少筛选下的工作量，由于笔者使用不同云笔记本的程度深浅各异，本文可能有许多不客观的地方，欢迎大家指正。
　

OneNote

有道云笔记

印象笔记

印象笔记现在是我的主力云笔记本。我着重在有道，印象，为知笔记三者中做了选择。

关于三者的各种优劣对比，在知乎已经不胜其数，笔者不再对价格，平台，分级模式等老生常谈的问题进行分析，有兴趣的请自行移步知乎。

笔者做的网页剪藏对比↓

enter description here

PS：在刚刚做完这个表格之后，惊奇的发现印象和有道云笔记没法展示这个表格中的图片，而为知笔记可以。这也与后文中笔者的观点“为知笔记有着最强大的编辑器”相呼应。

印象笔记强大的网页剪藏功能：

高亮功能：在剪藏网页的时候，用鼠标选定文字即可高亮，再次点击取消高亮

enter description here

然后在剪藏的内容中文字也会得到高亮。（两幅图不对应，仅做展示）

enter description here

页面重排布（阅读模式）剪藏：

enter description here

此外印象笔记的网页剪藏支持当场添加标签和注释，这一点为知笔记可以，有道云不行。

为知笔记

：

优点

：拥有目前我使用过的笔记中，最强大的文本编辑器。并且拥有最强的可拓展性。
文本编辑器展示1
文本编辑器展示2
甚至支持富文本编辑器（这个是拓展插件）
这玩意居然还支持富文本编辑器（这个是移植百度的）

缺点

：

1.ＵＩ杂乱，功能分类重叠

例如：
导出文件１
导出文件２
两种导出文件的方式，分别在客户端的右上方和最左侧，而且这两种功能并不一样

　　　　　　　　　　　　　第一种导出

　　　　　　　　　　　　　第二种导出

可以看到，两种导出支持的格式和操作逻辑都是不同的。这种使用体验的割裂感在为知笔记中处处可见。

２.灾难体验的搜索功能

如果非要从为知笔记的种种缺点中挑选一个最让我不能忍受的缺点，那一定就是这个无比垃圾的搜索功能。
首先我们探讨一下一个云笔记的搜索功能应该具有怎样的功能。
从云笔记的“云”字上看，既然我们选择了使用云笔记，当然是为了不把笔记储存在本地磁盘上。原因主要有二：
１.云笔记可以多平台多设备无缝切换　
２.云笔记保证笔记的安全性（这一点从之前为知笔记的倒闭风波上看，也令人堪忧

分析过后，既然我们的需求是不把笔记放在本地，那么搜索功能也一定在云端完成，而为知笔记的云搜索功能就是一坨×，有时候甚至连检索普通的文字文本都做不到。
　　　　　　　　
　　　　　　　以下是ｗｉｎ端和安卓端的情况
enter description here
2901912ebc0bc4a5f910155e7f9e201

我测试了各种办法，比如在线搜索支持模糊搜索“＠ｍｉｒｒｏｒ？”，结果也失败了。最终唯一可以检索到这么一个简单单词的办法是把笔记缓存到ｐｃ本地，然后用本地的检索。（Ｐｓ：安卓端还只能用在线检索。ｈｏｌｙｓｈｉｔ）

而我心目中的检索功能，不仅要做到文字标题和内容的精确／模糊检索，最好也要支持文件内，图片内的文本检索。这一点印象笔记确实做到了。在印象笔记篇我会夸它的。

joplin

幕布

以下产品支持的平台均存在局限性

* 小书匠

平台：WIn；网页

作为一个用户基数在本文中可能是最小的工具，小书匠可能不为人知，但是它的强大绝对是超乎大众想象的。先简单介绍一下小书匠：

“小书匠编辑器是一个支持离线与在线的markdown文本编辑器,并实现了多种第方三数据存储集成(evernote,印象笔记,github,dropbox等)。 ”
enter description here

荒原往事

#效率工具

语音笔记AudioPen的“平替”

前言

现有项目

语音输入法+LLM

Alog：ios平台+需要网络

OralPen：ios平台+需要网络

whisper+llm本地离线：任何平台+无需网络

小结

本文永久更新地址:

回复取消回复

我的云笔记使用体验+优缺点分析

OneNote

有道云笔记

印象笔记

为知笔记

优点

缺点

1.ＵＩ杂乱，功能分类重叠

２.灾难体验的搜索功能

joplin

幕布

* 小书匠

手机记事本

纯纯写作

可乐记

麻雀记

语雀

#效率工具

语音笔记AudioPen的“平替”

前言

现有项目

语音输入法+LLM

Alog：ios平台+需要网络

OralPen：ios平台+需要网络

whisper+llm本地离线：任何平台+无需网络

小结

本文永久更新地址:

回复 取消回复

我的云笔记使用体验+优缺点分析

OneNote

有道云笔记

印象笔记

为知笔记

优点

缺点

1.ＵＩ杂乱，功能分类重叠

２.灾难体验的搜索功能

joplin

幕布

* 小书匠

手机记事本

纯纯写作

可乐记

麻雀记

语雀

回复取消回复