#效率工具

曲淡歌
曲淡歌@qudange

2024 年 7 月 16 日

语音笔记AudioPen的“平替” 

前言

在b站发出AudioPen的视频后,有网友问有没有能自己部署的项目做平替,那今天就来分析一下如何找到AudioPen的平替。

现有项目

AudioPen的工作原理其实并不复杂,语音转文字–>文字发给LLM,也就是说它并没有核心技术,只是现有技术的整合,因此如果去google以audio notes为关键词搜索,能找到好几个类似的软件,但是他们的定价策略甚至还比不过AudioPen,因此不考虑这类软件。

语音输入法+LLM

最简单的办法就是用语音输入法输入一段文字,然后发给任何一个大语言模型(比如ChatGPT),然后告诉它:“你现在是速录员,请把下面的口语整理为通顺的书面表达”,通过微调提示词,可以得到不同的效果。

Alog:ios平台+需要网络

如果使用的苹果设备,可以去app store搜索alog,这是一个可以使用自己的LLM key的软件,同时还支持apple watch端,是一个我比较看好的软件,它采用ios内置的本地语音转文字功能,仅需要自己去解决第二步的问题,而互联网上有很多免费的key获取途径。

OralPen:ios平台+需要网络

Allwillcome/OralPen: 出口, AI 成章| Record voice and refine it into language ChatGPT understands.

这是一个使用ios的快捷指令实现的脚本,也是通过ios内置的本地语音转文字,然后将转录稿发送给自定义的LLM,其实只要读懂了这个脚本,几乎就可以在任何一种设备上复刻AudioPen。

![[assets/Pasted image 20240716175420.png|assets/Pasted image 20240716175420.png]]

whisper+llm本地离线:任何平台+无需网络

通过上面的两个例子,我们完全可以通过whisper本地模型来转录语音,再用LLM来处理文字,如果本地算力足够,可以通过如ollama等服务在本地部署自己的LLM并通过api来使用它。

小结

看上去有很多方法,但殊途同归,他们都是采用的同样一套原理。但是AudioPen的效果出奇的好,可能作者在某些细节进行了处理,因此,如果想得到最好的效果,目前来看,我还是推荐付费使用产品。如果只是想尝鲜,完全可以用语音输入法那个方案,同时像ChatGPT本身就支持语音输入,也可以直接让它帮你总结。

本文永久更新地址:

https://blogs.qudange.top/p/2024-07-16-audiopen-substitute/

#[17] #[4] #效率工具 #知识管理 #笔记软件
2024 年 7 月 16 日 98 43

回复

曲淡歌
曲淡歌@qudange

2020 年 3 月 21 日

我的云笔记使用体验+优缺点分析 

前言:本文旨在记录自己对各种云笔记本的体验与权衡选择,并且一次专业的评测,若内有谬误与夹带私货,引起您的不适,请及时点击右上方的X。最后,衷心希望可以为后来者减少筛选下的工作量,由于笔者使用不同云笔记本的程度深浅各异,本文可能有许多不客观的地方,欢迎大家指正。
 

OneNote

有道云笔记

印象笔记

印象笔记现在是我的主力云笔记本。我着重在有道,印象,为知笔记三者中做了选择。

关于三者的各种优劣对比,在知乎已经不胜其数,笔者不再对价格,平台,分级模式等老生常谈的问题进行分析,有兴趣的请自行移步知乎。

笔者做的网页剪藏对比↓

表格
enter description here

PS:在刚刚做完这个表格之后,惊奇的发现印象和有道云笔记没法展示这个表格中的图片,而为知笔记可以。这也与后文中笔者的观点“为知笔记有着最强大的编辑器”相呼应。

印象笔记强大的网页剪藏功能:

高亮功能:在剪藏网页的时候,用鼠标选定文字即可高亮,再次点击取消高亮

enter description here

然后在剪藏的内容中文字也会得到高亮。(两幅图不对应,仅做展示)

enter description here

页面重排布(阅读模式)剪藏:

enter description here

此外印象笔记的网页剪藏支持当场添加标签和注释,这一点为知笔记可以,有道云不行。

为知笔记

优点

:拥有目前我使用过的笔记中,最强大的文本编辑器。并且拥有最强的可拓展性。
文本编辑器展示1
文本编辑器展示2
甚至支持富文本编辑器(这个是拓展插件)
这玩意居然还支持富文本编辑器(这个是移植百度的)

缺点

1.UI杂乱,功能分类重叠

例如:
导出文件1
导出文件2
两种导出文件的方式,分别在客户端的右上方和最左侧,而且这两种功能并不一样

             第一种导出
第一种导出
             第二种导出
第二种导出

可以看到,两种导出支持的格式和操作逻辑都是不同的。这种使用体验的割裂感在为知笔记中处处可见。

2.灾难体验的搜索功能

如果非要从为知笔记的种种缺点中挑选一个最让我不能忍受的缺点,那一定就是这个无比垃圾的搜索功能。
首先我们探讨一下一个云笔记的搜索功能应该具有怎样的功能。
从云笔记的“云”字上看,既然我们选择了使用云笔记,当然是为了不把笔记储存在本地磁盘上。原因主要有二:
1.云笔记可以多平台多设备无缝切换 
2.云笔记保证笔记的安全性(这一点从之前为知笔记的倒闭风波上看,也令人堪忧

分析过后,既然我们的需求是不把笔记放在本地,那么搜索功能也一定在云端完成,而为知笔记的云搜索功能就是一坨×,有时候甚至连检索普通的文字文本都做不到。
        
       以下是win端和安卓端的情况
enter description here
2901912ebc0bc4a5f910155e7f9e201

我测试了各种办法,比如在线搜索支持模糊搜索“@mirror?”,结果也失败了。最终唯一可以检索到这么一个简单单词的办法是把笔记缓存到pc本地,然后用本地的检索。(Ps:安卓端还只能用在线检索。holyshit)

而我心目中的检索功能,不仅要做到文字标题和内容的精确/模糊检索,最好也要支持文件内,图片内的文本检索。这一点印象笔记确实做到了。在印象笔记篇我会夸它的。

joplin

幕布


以下产品支持的平台均存在局限性

* 小书匠

平台:WIn;网页

作为一个用户基数在本文中可能是最小的工具,小书匠可能不为人知,但是它的强大绝对是超乎大众想象的。先简单介绍一下小书匠:

“小书匠编辑器是一个支持离线与在线的markdown文本编辑器,并实现了多种第方三数据存储集成(evernote,印象笔记,github,dropbox等)。 ”
enter description here

手机记事本

纯纯写作

可乐记

麻雀记

语雀

#效率工具
2020 年 3 月 21 日 347

Loading...
载入中

已到底部

没有可加载的页面

C
写微博
S
搜索
J
下一篇微博/评论
K
上一篇微博/评论
R
回复
E
编辑
O
显示隐藏评论
T
回顶部
L
登录
H
显示隐藏帮助
Ctrl+Enter
提交发布
ESC
取消并清除内容