#geek

曲淡歌
曲淡歌@qudange

2024 年 8 月 26 日

测试在根目录下能否正常倒序显示文章 

测试在根目录下能否正常倒序显示文章

本文永久更新地址:

https://blogs.qudange.top/p/%e6%b5%8b%e8%af%95%e5%9c%a8%e6%a0%b9%e7%9b%ae%e5%bd%95%e4%b8%8b%e8%83%bd%e5%90%a6%e6%ad%a3%e5%b8%b8%e5%80%92%e5%ba%8f%e6%98%be%e7%a4%ba%e6%96%87%e7%ab%a0/

#geek
2024 年 8 月 26 日 44 18

回复

曲淡歌
曲淡歌@qudange

2024 年 8 月 26 日

安卓透明代理,上手 box for magisk 

前言

在使用安卓设备的时候也有科学上网的需求,而直接使用app层级的代理会遇见以下几种问题:
1. 部分app会检测代理:比如soul微调,检测代理的主要原因都是为了防破解/防抓包
2. vpn app不稳定,容易被杀后台
3. 在使用命令行时无法通过app代理
综上所述,需要实现透明代理。目前有两个项目是比较符合的我的需求,同时又有着比较低的上手门槛的:
1. 神秘盒子:基于singbox的代理模块,无法使用自定义的分流配置,但是上手简单,有app作为图形化界面
2. box for magisk:支持诸如v2ray和clash等核心,支持自定义配置,~~目前没有图形化界面~~ 可以用app管理,但是不能在app里设置订阅。

项目实践

安装记录

  1. 下载并刷入模块
  2. 在刷入时用音量+选择下载内核,或者刷入后使用命令行
    su -c /data/adb/box/scripts/box.tool upcore(此命令为更新指定的内核,需要先确认配置文件)
   # 更新 Clash 管理面板
su -c /data/adb/box/scripts/box.tool upyacd
  1. 配置/data/adb/box/settings.ini
interva_update="@daily"  #更新频率
run_crontab="true"  #开启定时更新
subscription_url_clash="<订阅地址>"  #配置clash订阅地址,如果handshake报错可以把https改为http
renew=true  #采用订阅文件中的分流规则
  1. 终端中运行命令su -c /data/adb/box/scripts/box.tool subs
  2. 如果有需要更新Geo数据库,可以采用su -c /data/adb/box/scripts/box.tool geox
  3. 如果需要同时更新订阅与Geo,可以使用su -c /data/adb/box/scripts/box.tool subs

本文永久更新地址:

https://blogs.qudange.top/p/2024-07-14-box-for-magisk/

#[5] #geek #[4] #[2]
2024 年 8 月 26 日 162
曲淡歌
曲淡歌@qudange

2024 年 8 月 12 日

Obsidian 实现复制时自动上传图片到图床 

Obsidian 实现复制时自动上传图片到图床

【QuickAdd脚本】带图复制-自动上传图片到图床 – 经验分享 – Obsidian 中文论坛

我新开一个库可以用,但是在主力库里就不行,报错为

assets/Pasted image 20240808164552.png

QuickAdd: (ERROR) failed to run user script 带
图复制.Error:
The “path" argument must be of type string.
Received undlefined

这个问题很奇怪,我在新开的空白ob库里没有遇见,但是在主力库就有这个问题。

怎么排查问题?

  • 尝试删除js脚本后再执行命令,看看是不是脚本的问题——删除后报错找不到脚本,看来不是这个问题。

然后我想为什么空白库是对的,多半是插件或者设置的问题,然后我把脚本发给kimi,kimi分析到一个关键点,就是文件路径。

于是我发现问题了:试用的时候发现一个问题:

如果内部链接类型设置为基于当前笔记的相对路径,脚本会报错
QuickAdd: (ERROR) failed to run user script 带图 复制.Error: The “path" argument must be of type string. Received undefined

采用绝对路径也会有同样问题。改为尽量短路径就正常了。

用chatgpt修复这个bug(还得是chatgpt哇),修复版的脚本为:

const path = require('path');
const quickAddApi = app.plugins.plugins.quickadd.api;
const { editor, file, containerEl } = app.workspace.activeEditor;
const url = "http://127.0.0.1:36677/upload";

module.exports = async () => {
  const files = app.vault.getFiles();
  let selection = "";
  let content = "";
  selection = editor.getSelection();
  console.log("Selected text:", selection);

  for (let line of selection.split("\n")) {
    let embed = "";
    if (line) {
      embed = matchSelectionEmbed(line);
    }
    console.log("Matched embed:", embed);

    if (embed && /\.(png|jpg|jpeg|gif|bmp)$/.test(embed)) {
      let wikiPath = getFilePath(files, embed); // 匹配Wiki链接
      if (!wikiPath) {
        new Notice(`❌无法找到文件: ${embed}`);
        console.log(`❌无法找到文件: ${embed}`);
        continue;
      }

      // 获取绝对路径
      const imgPath = app.vault.adapter.getFullPath(wikiPath);
      console.log("Image path:", imgPath);

      const data = await uploadFiles([imgPath], url);
      if (data.success) {
        const imgWiki = `![[${embed}]]`;
        const imgLink = `![${embed}](${data.result})`;
        line = line.replace(imgWiki, imgLink);
      } else {
        new Notice(`❌上传 ${path.basename(imgPath)} 图片失败`);
        console.log(`❌上传 ${path.basename(imgPath)} 图片失败`);
      }
    }
    content += line + "\n";
  }

  console.log("Final content:", content);
  copyToClipboard(content)
  new Notice(`✅复制成功`);
};

// 获取文件路径函数
function getFilePath(files, baseName) {
  let matchingFiles = files.filter(f => {
    const fullPath = f.path;
    console.log(`Comparing ${fullPath} with ${baseName}`);
    return fullPath.endsWith(baseName);
  });

  if (matchingFiles.length === 0) {
    console.log(`No files matched for: ${baseName}`);
    return undefined;
  }

  return matchingFiles[0].path;
}

function matchSelectionEmbed(text) {
  const regex = /!\[\[?([^\]]*?)(\|.*)?\]\]?\(?([^)\n]*)\)?/;
  const matches = text.match(regex);
  if (!matches) return;
  if (matches[3]) return decodeURIComponent(matches[3]);
  if (matches[1]) return decodeURIComponent(matches[1]);
}

async function uploadFiles(imagePathList, url) {
  const response = await requestUrl({
    url: url,
    method: "POST",
    headers: { "Content-Type": "application/json" },
    body: JSON.stringify({ list: imagePathList }),
  });
  const data = response.json; // 直接访问 `json` 属性,而不是调用 `json()` 方法
  return data;
};

function copyToClipboard(extrTexts) {
  const txtArea = document.createElement('textarea');
  txtArea.value = extrTexts;
  document.body.appendChild(txtArea);
  txtArea.select();
  if (document.execCommand('copy')) {
      console.log('copy to clipboard.');
  } else {
      console.log('fail to copy.');
  }
  document.body.removeChild(txtArea);
}

使用方法

  1. 安装插件quickadd
  2. 在quickadd中设置脚本存放目录 Template Folder Path,然后在对应目录下新建 带图复制.js,把代码粘贴进去
  3. 新建一个宏,选择刚刚新建的脚本
  4. 安装piclist,配置好图床
  5. 在obsidian中选中要分享的文本,其中需要包含要上传的图片,然后ctrl+p使用脚本
  6. 粘贴即可

直接把图片上传到github

用 github publisher 插件能把图片上传到 github,但是图片在文章中的格式是 [[]] 的 wiki 链接,因此我们需要通过正则的方式来转换格式。

参考这篇文章 obsidian图片链接转换成markdown语法,不关闭wiki链接_obsidian图片显示变成链接-CSDN博客

同时上面这个方法还可以解决这个问题:obsidian 粘贴进来的图片名字会自动带空格,如 Pasted image 20240806221817.png

最后发布后就能看到在 github 是可以正常查看图片了,但是为了同步到其他平台,可以批量的在图片路径前面加上 https://github.com/dangehub/github2wp/blob/main/_posts

方法也很简单,就是搜索 assets/,然后替换为 https://github.com/dangehub/github2wp/blob/main/_posts/assets/

  • 但是为什么同步到 wordpress 的文章里图片没有了?

同步到 wp 的是 html 代码:

<p><img alt="" src="https://github.com/dangehub/github2wp/blob/main/_posts/assets/Pasted%20image%2020240806214536.png" /></p>

直接访问这个链接是对的,但是这段 html 代码不能正常工作。
比如放到 obsidian 中:



上面的分隔线中就是这段 html 代码,无法显示图像。为什么?

去调试台看了下,报错 (失败)net::ERR_BLOCKED_BY_ORB,~~这是跨域问题~~

但是都没人说 github 的图片会限制跨域,检查之后发现 https://github.com/dangehub/github2wp/blob/b85405e3ef0c15a3caf57a038a545e0842d43996/_posts/assets/Pasted%20image%2020240806214536.png 指向的不是图片本身,https://github.com/dangehub/github2wp/blob/b85405e3ef0c15a3caf57a038a545e0842d43996/_posts/assets/Pasted%20image%2020240806214536.png?raw=true 才是图片本身,替换为这个链接就好了。

即用 png?raw=true 替换 png

本文永久更新地址:

https://blogs.qudange.top/p/obsidian%20%e5%ae%9e%e7%8e%b0%e5%a4%8d%e5%88%b6%e6%97%b6%e8%87%aa%e5%8a%a8%e4%b8%8a%e4%bc%a0%e5%9b%be%e7%89%87%e5%88%b0%e5%9b%be%e5%ba%8a/

#geek
2024 年 8 月 12 日 49 46
曲淡歌
曲淡歌@qudange

2024 年 8 月 11 日

Obsidian tar插件实现obsidian内部集成LLM对话 

Tars插件简介

通过大语言模型(LLM)api,把AI集成到obsidian内部,使用方法为使用ob内部的tag标记触发对应AI即可。#

示例

新对话 #我 : 你好,请介绍你自己

qwen : 你好,我是来自阿里云的大规模语言模型,我叫通义千问。我可以生成各种类型的文本,如文章、故事、诗歌、故事等,并能够根据不同的场景和需求进行变换和扩展。此外,我还能够回答问题、提供信息和与用户进行交互,帮助解决疑惑和提供有益的建议。如果你有任何问题或需要帮助,欢迎随时向我提问!

使用教程

  1. 安装插件并配置api
  2. 输入 新对话
  3. 再输入 #qwen 回车即可触发 (此处的qwen为自定义项)

本文永久更新地址:

https://blogs.qudange.top/p/obsidian%20tar%e6%8f%92%e4%bb%b6%e5%ae%9e%e7%8e%b0obsidian%e5%86%85%e9%83%a8%e9%9b%86%e6%88%90llm%e5%af%b9%e8%af%9d/

#geek
2024 年 8 月 11 日 55 30
曲淡歌
曲淡歌@qudange

2024 年 8 月 11 日

Obsidian 实现复制时自动上传图片到图床 

Obsidian 实现复制时自动上传图片到图床

【QuickAdd脚本】带图复制-自动上传图片到图床 – 经验分享 – Obsidian 中文论坛

我新开一个库可以用,但是在主力库里就不行,报错为

assets/Pasted image 20240808164552.png

QuickAdd: (ERROR) failed to run user script 带
图复制.Error:
The “path" argument must be of type string.
Received undlefined

这个问题很奇怪,我在新开的空白ob库里没有遇见,但是在主力库就有这个问题。

怎么排查问题?

  • 尝试删除js脚本后再执行命令,看看是不是脚本的问题——删除后报错找不到脚本,看来不是这个问题。

然后我想为什么空白库是对的,多半是插件或者设置的问题,然后我把脚本发给kimi,kimi分析到一个关键点,就是文件路径。

于是我发现问题了:试用的时候发现一个问题:

如果内部链接类型设置为基于当前笔记的相对路径,脚本会报错
QuickAdd: (ERROR) failed to run user script 带图 复制.Error: The “path" argument must be of type string. Received undefined

采用绝对路径也会有同样问题。改为尽量短路径就正常了。

用chatgpt修复这个bug(还得是chatgpt哇),修复版的脚本为:

const path = require('path');
const quickAddApi = app.plugins.plugins.quickadd.api;
const { editor, file, containerEl } = app.workspace.activeEditor;
const url = "http://127.0.0.1:36677/upload";

module.exports = async () => {
  const files = app.vault.getFiles();
  let selection = "";
  let content = "";
  selection = editor.getSelection();
  console.log("Selected text:", selection);

  for (let line of selection.split("\n")) {
    let embed = "";
    if (line) {
      embed = matchSelectionEmbed(line);
    }
    console.log("Matched embed:", embed);

    if (embed && /\.(png|jpg|jpeg|gif|bmp)$/.test(embed)) {
      let wikiPath = getFilePath(files, embed); // 匹配Wiki链接
      if (!wikiPath) {
        new Notice(`❌无法找到文件: ${embed}`);
        console.log(`❌无法找到文件: ${embed}`);
        continue;
      }

      // 获取绝对路径
      const imgPath = app.vault.adapter.getFullPath(wikiPath);
      console.log("Image path:", imgPath);

      const data = await uploadFiles([imgPath], url);
      if (data.success) {
        const imgWiki = `![[${embed}]]`;
        const imgLink = `![${embed}](${data.result})`;
        line = line.replace(imgWiki, imgLink);
      } else {
        new Notice(`❌上传 ${path.basename(imgPath)} 图片失败`);
        console.log(`❌上传 ${path.basename(imgPath)} 图片失败`);
      }
    }
    content += line + "\n";
  }

  console.log("Final content:", content);
  copyToClipboard(content)
  new Notice(`✅复制成功`);
};

// 获取文件路径函数
function getFilePath(files, baseName) {
  let matchingFiles = files.filter(f => {
    const fullPath = f.path;
    console.log(`Comparing ${fullPath} with ${baseName}`);
    return fullPath.endsWith(baseName);
  });

  if (matchingFiles.length === 0) {
    console.log(`No files matched for: ${baseName}`);
    return undefined;
  }

  return matchingFiles[0].path;
}

function matchSelectionEmbed(text) {
  const regex = /!\[\[?([^\]]*?)(\|.*)?\]\]?\(?([^)\n]*)\)?/;
  const matches = text.match(regex);
  if (!matches) return;
  if (matches[3]) return decodeURIComponent(matches[3]);
  if (matches[1]) return decodeURIComponent(matches[1]);
}

async function uploadFiles(imagePathList, url) {
  const response = await requestUrl({
    url: url,
    method: "POST",
    headers: { "Content-Type": "application/json" },
    body: JSON.stringify({ list: imagePathList }),
  });
  const data = response.json; // 直接访问 `json` 属性,而不是调用 `json()` 方法
  return data;
};

function copyToClipboard(extrTexts) {
  const txtArea = document.createElement('textarea');
  txtArea.value = extrTexts;
  document.body.appendChild(txtArea);
  txtArea.select();
  if (document.execCommand('copy')) {
      console.log('copy to clipboard.');
  } else {
      console.log('fail to copy.');
  }
  document.body.removeChild(txtArea);
}

使用方法

  1. 安装插件quickadd
  2. 在quickadd中设置脚本存放目录 Template Folder Path,然后在对应目录下新建 带图复制.js,把代码粘贴进去
  3. 新建一个宏,选择刚刚新建的脚本
  4. 安装piclist,配置好图床
  5. 在obsidian中选中要分享的文本,其中需要包含要上传的图片,然后ctrl+p使用脚本
  6. 粘贴即可

直接把图片上传到github

用 github publisher 插件能把图片上传到 github,但是图片在文章中的格式是 [[]] 的 wiki 链接,因此我们需要通过正则的方式来转换格式。

参考这篇文章 obsidian图片链接转换成markdown语法,不关闭wiki链接_obsidian图片显示变成链接-CSDN博客

同时上面这个方法还可以解决这个问题:obsidian 粘贴进来的图片名字会自动带空格,如 Pasted image 20240806221817.png

最后发布后就能看到在 github 是可以正常查看图片了,但是为了同步到其他平台,可以批量的在图片路径前面加上 https://github.com/dangehub/github2wp/blob/main/_posts

方法也很简单,就是搜索 assets/,然后替换为 https://github.com/dangehub/github2wp/blob/main/_posts/assets/

  • 但是为什么同步到 wordpress 的文章里图片没有了?

同步到 wp 的是 html 代码:

<p><img alt="" src="https://github.com/dangehub/github2wp/blob/main/_posts/assets/Pasted%20image%2020240806214536.png" /></p>

直接访问这个链接是对的,但是这段 html 代码不能正常工作。
比如放到 obsidian 中:



上面的分隔线中就是这段 html 代码,无法显示图像。为什么?

去调试台看了下,报错 (失败)net::ERR_BLOCKED_BY_ORB,~~这是跨域问题~~

但是都没人说 github 的图片会限制跨域,检查之后发现 https://github.com/dangehub/github2wp/blob/b85405e3ef0c15a3caf57a038a545e0842d43996/_posts/assets/Pasted%20image%2020240806214536.png 指向的不是图片本身,https://github.com/dangehub/github2wp/blob/b85405e3ef0c15a3caf57a038a545e0842d43996/_posts/assets/Pasted%20image%2020240806214536.png?raw=true 才是图片本身,替换为这个链接就好了。

即用 png?raw=true 替换 png

本文永久更新地址:

https://blogs.qudange.top/p/2024-08-11-obsidian-pic-upload/

#geek
2024 年 8 月 11 日 152
曲淡歌
曲淡歌@qudange

2024 年 8 月 7 日

用 n8n 实现三步翻译 

用 defy 搭建三步翻译老是报错,想自托管发现 defy 的配置要求很高,于是准备先用之前的 n 8 n 试试。

更新 n 8 n:1.0.4 更新到 1.44.1

采用这样的结构时,会报错 Expected to find the prompt in an input field called 'chatInput' (this is what the chat trigger node outputs). To use something else, change the 'Prompt' parameter

感觉像是个 bug,明明已经能读取前两个节点的输出,但是 n 8 n 还是提示无法读取到上上个节点。然后细查日志发现报错

NodeOperationError: No prompt specified at getPromptInputByType (/usr/local/lib/node_modules/n8n/node_modules/@n8n/n8n-nodes-langchain/dist/utils/helpers.js:71:15) at Object.execute (/usr/local/lib/node_modules/n8n/node_modules/@n8n/n8n-nodes-langchain/dist/nodes/chains/ChainLLM/ChainLlm.node.js:412:65) at Workflow.runNode (/usr/local/lib/node_modules/n8n/node_modules/n8n-workflow/dist/Workflow.js:728:19) at /usr/local/lib/node_modules/n8n/node_modules/n8n-core/dist/WorkflowExecute.js:673:51 at /usr/local/lib/node_modules/n8n/node_modules/n8n-core/dist/WorkflowExecute.js:1086:20

后面我发现问题来自于 prompt 的设置,原来每个 llm chain 一开始就有一个 prompt 设置,而默认是继承自上一个节点,而我的第一个 llm chain 节点就没设置它。

搞定后展示一下翻译效果:

原文:
It’s so creepy and weird. I’ll go back and play DoDS and HL 2 DM etc and it’s still like a chat room while you play, it makes gaming so much more casual and enjoyable. I play this game and try to engage in any way and get literally no response from anyone. Is it just because this is a newer game so it’s full of antisocial teenagers who don’t know how to talk to each other? I just honestly don’t get it. It’s not that you’re obligated to chat, but it seems very weird to pretend that you’re not playing with other human beings.

Edit: I actually think this is why I lose interest in this game so quickly. In the old school games my team could be getting destroyed but it doesn’t bother me because we’re all chatting and having a good time. In this game it’s just silence anyway, doesn’t even feel like I’m playing against actual people so I don’t feel bad leaving in the middle of a match if we’re getting rolled.

Google 翻译:
这太令人毛骨悚然和奇怪了。我会回去玩 DoDS 和 HL 2 DM 等游戏,玩的时候它仍然像一个聊天室,它让游戏变得更加休闲和愉快。我玩这个游戏并尝试以任何方式参与,但几乎没有得到任何人的回应。难道只是因为这是一款较新的游戏,所以里面充满了不知道如何与对方交谈的反社会青少年?老实说我不明白。这并不是说你有义务聊天,但假装你没有和其他人一起玩似乎很奇怪。
编辑:我实际上认为这就是我这么快对这款游戏失去兴趣的原因。在老式的学校比赛中,我的球队可能会被摧毁,但这并不困扰我,因为我们都在聊天,玩得很开心。无论如何,在这款游戏中,一切都是沉默,甚至感觉不到我是在和真人比赛,所以如果我们被淘汰,我不会因为在比赛中途离开而感到难过。

三步翻译:
实在是太奇怪而且让人有点不舒服了。回想当年玩《DoD:S》和《HL 2 DM》等游戏的时候,那种体验就像是在一间聊天室里面玩游戏,让整个游戏玩起来更加轻松且愉快。但当我玩这款游戏时,不管我怎么试图互动,却几乎得不到任何人的回应。难道仅仅因为这是一款新游戏,所以里面都是些不太愿意交流彼此的社恐少年吗?我真的搞不清楚是怎么回事。我不是说大家必须聊天,但完全假装没有和其他玩家一起玩的感觉总是让人觉得有点别扭。
编辑:我想这可能是导致我对这款游戏兴趣迅速消退的原因之一吧。在游戏中,即便是我们队伍大败亏输,我也不至于特别沮丧,因为我们那时都在愉快地聊天。但在这款游戏中,整个世界就像是一片寂静,根本感受不到自己是在跟其他玩家对战,所以我们遭受挫败时,我中途退出时也就没有什么内疚感了。

下面展示一下三步翻译的过程:

直译:
真是太诡异又让人不舒服。我回到过去玩 DoDS 和 HL 2 DM 等游戏时,感觉就像在一个聊天室里游戏,这让整个游戏体验变得更加轻松愉快。然而玩这款游戏时,无论我怎样尝试互动,却几乎得不到任何人的回应。难道仅仅因为这是一款新游戏,所以满是那些不懂得彼此交谈的社交恐惧少年?我真的不明白这是怎么回事。我不是说大家非得聊天不可,只是假装没有和其他玩家一起游戏,总让我觉得有些奇怪。\n\n 编辑:我想明白了,这可能就是我迅速对这个游戏失去兴趣的原因。在以前的老游戏中,即使我的队伍被杀得人仰马翻,我也不会感到烦闷,因为我们都在欢快地聊天。而在这款游戏中,四周一片寂静,根本感受不到是在和真人对战,所以我们被碾压时,我中途离开也不会有丝毫的愧疚感。

然后是用 ai 进行反思:
<直接翻译>中存在的问题:\n\n 1. 不符合中文的表达习惯:\n – “真是太诡异又让人不舒服”:中文通常不以”真是太…”这样的句式表达负面强烈的情感。\n \n 2. 句子结构笨拙:\n – “我玩这款游戏时,无论我怎样尝试互动,几乎得不到任何人的回应”:应改为“当我玩这款游戏时,无论怎样尝试互动,几乎得不到任何人的回应”更加自然流畅。\n \n 3. 表达含糊不清,难以理解:\n – “难道仅仅因为这是一款新游戏, 所以满是那些不懂得彼此交谈的社交恐惧少年?” : 整个句子表达过于生硬,不易于理解其意图。\n – “而这款游戏中, 四周一片寂静, 根本感受不到是在和真人对战”: 这里使用“真人”来指代其他在线玩家显得较为突兀且不自然。一般情况下,在这种语境中并不会强调对战的对象是否为真实的人,因为在网络游戏中默认就是与真人对战。\n\n 4. 表达不够地道:\n – “所以, 我们被碾压时, 我中途离开也不会有丝毫的愧疚感” : 愧疚感的表达在此处显得过于严肃,通常在网络游戏中玩家们会更倾向于用更加随意的语气来描述此类情况。\n\n 注: 以上指出的问题并未提供修改后的版本。

此处我采用的是通义千问的 qwen-long 模型,它的实力在目前的 llm 中算不上非常强劲,这正好能说明三步翻译的强劲实力。

做成 api 来配合划词翻译

先启动 n 8 n 的测试模式,然后用划词翻译发送一次,得到划词翻译的发包格式

"body": {

"model": "qwen-long",

"messages": [

{

"role": "user",

"content": "This is an embeddable Chat widget for n8n. It allows the execution of AI-Powered Workflows through a Chat window."

}

然后需要根据格式调整 n8n

n8n 自动翻译完之后的输出为


[

{

"text": "<改进翻译>\n\n这是一款专为 n8n 设计的、可嵌入式的聊天工具,它使用户能够在聊天窗口内执行由人工智能驱动的工作流程。\n\n在这个版本里解决了以下问题:\n1. 调整了“可嵌入式”的位置,使之更符合中文的语言习惯。\n2. 简化并调整了句子结构,将“它能让用户通过聊天窗口来运行由人工智能驱动的工作流程”改写为更贴合中文表达习惯和流畅度的表述:“它使用户能够在聊天窗口内执行由人工智能驱动的工作流程”。\n3. 增强了句子之间逻辑关系的连贯性。"

}

]

而划词翻译需要接受来自 openai 格式的json,因此需要把上面n8n 的输出转换一下。

openai 格式参考为:

{
  "id": "b3e86c70-bd28-995b-a6e9-c47ab55c6495",
  "model": "qwen",
  "object": "chat.completion",
  "created": 1722959731,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hello! How can I assist you today?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 1,
    "completion_tokens": 9,
    "total_tokens": 10
  }
}

注意,在http request 中不能使用引号和换行。

在 prompt 中要求不要使用引号,然后用节点来处理换行符,最后得到效果如下:

可以看到这个效果已经相当好了。

本文永久更新地址:

https://blogs.qudange.top/p/2024-08-07-n8n_3steps_translate/

#geek #翻译
2024 年 8 月 7 日 159 45
曲淡歌
曲淡歌@qudange

2024 年 7 月 16 日

语音笔记AudioPen的“平替” 

前言

在b站发出AudioPen的视频后,有网友问有没有能自己部署的项目做平替,那今天就来分析一下如何找到AudioPen的平替。

现有项目

AudioPen的工作原理其实并不复杂,语音转文字–>文字发给LLM,也就是说它并没有核心技术,只是现有技术的整合,因此如果去google以audio notes为关键词搜索,能找到好几个类似的软件,但是他们的定价策略甚至还比不过AudioPen,因此不考虑这类软件。

语音输入法+LLM

最简单的办法就是用语音输入法输入一段文字,然后发给任何一个大语言模型(比如ChatGPT),然后告诉它:“你现在是速录员,请把下面的口语整理为通顺的书面表达”,通过微调提示词,可以得到不同的效果。

Alog:ios平台+需要网络

如果使用的苹果设备,可以去app store搜索alog,这是一个可以使用自己的LLM key的软件,同时还支持apple watch端,是一个我比较看好的软件,它采用ios内置的本地语音转文字功能,仅需要自己去解决第二步的问题,而互联网上有很多免费的key获取途径。

OralPen:ios平台+需要网络

Allwillcome/OralPen: 出口, AI 成章| Record voice and refine it into language ChatGPT understands.

这是一个使用ios的快捷指令实现的脚本,也是通过ios内置的本地语音转文字,然后将转录稿发送给自定义的LLM,其实只要读懂了这个脚本,几乎就可以在任何一种设备上复刻AudioPen。

![[assets/Pasted image 20240716175420.png|assets/Pasted image 20240716175420.png]]

whisper+llm本地离线:任何平台+无需网络

通过上面的两个例子,我们完全可以通过whisper本地模型来转录语音,再用LLM来处理文字,如果本地算力足够,可以通过如ollama等服务在本地部署自己的LLM并通过api来使用它。

小结

看上去有很多方法,但殊途同归,他们都是采用的同样一套原理。但是AudioPen的效果出奇的好,可能作者在某些细节进行了处理,因此,如果想得到最好的效果,目前来看,我还是推荐付费使用产品。如果只是想尝鲜,完全可以用语音输入法那个方案,同时像ChatGPT本身就支持语音输入,也可以直接让它帮你总结。

本文永久更新地址:

https://blogs.qudange.top/p/2024-07-16-audiopen-substitute/

#geek #[4] #[3] #知识管理 #笔记软件
2024 年 7 月 16 日 106 43
曲淡歌
曲淡歌@qudange

2024 年 7 月 15 日

AudioPen:让Ai帮你整理碎碎念,语音转书面化文字的利器 

AudioPen:让Ai帮你整理碎碎念,口语文字书面化的利器

本文标题又为:除非你比我的独处更迷人

前言

你在独处的时候,会自言自语吗?

你觉得你的自言自语有没有价值呢?

如果有,应该如何利用它?

如果上述的3个问题的答案都是肯定的,那么请你看下去,一定会有所收获。


利用ChatGPT将口语书面化

本节标题又为:一个不破碎的你,终于拯救了一个破碎的我

在上班的路上,在放学的途中,在独处的思维漫步时,在骑着单车享受夏风时,我都喜欢碎碎念。

诸军,我喜欢碎碎念。因为我喜欢和自己对话,这让我感觉自己的思绪从未如此清晰过。

我和我谈天说地,从宇宙大爆炸聊到国际局势,从游戏版本平衡聊到习习晚风,从花前月下聊到幽微……

曾经我苦于无法将这些独处的迷人记录,而现在我发现了一种方法:语音识别+大语言模型总结。

有很多办法去实现它,如ios的捷径,一个名叫alog的app,但是我最后选择了AudioPen这个web应用,只有一个原因:它的综合效果最好。

AudioPen简介

简单介绍一下它的使用方法:
打开网页–>开始录音–>对着麦克风谈天说地–>完成录音,app开始总结–>得到一个书面化的文字总结,包括标题和内容(如果不满意的话,可以调整书面化的力度)

书面化力度分三档:
1. 低:稍微清理,去除口语词
2. 中:保留口语结构与词汇,以选定的风格重写
3. 高:在中等基础上,可能会重组其内容,可以设置长度限制

预设的风格如下:
1. Casual Memo:Write in a clear, slightly formal, and witty style. Don’t use very complex language or sentence structure.
2. Simple & Clear:Friendly, flowing, simple sentences. Use simple words. Prioritize clarity above all else.
3. Descriptive:Create vivid images for the reader using sensory language, metaphors, similes, and other figures of speech.
4. Legal:Write in a legal style. Use highly formal language that is precise, includes complex sentences, and legal terminology.
5. List:Create a bulleted list. Use short sentences. Ensure each point is written within a bullet.
6. Write like me:Write in a style similar to the following text:【】Replace this text with a few paragraphs of your own writing.

AudioPen效果展示

如果你对它的不同档位感兴趣的话,下面附上原始转录的文本与低中高三档重写后的文本。风格均采用Casual Memo

1. 原始转录

注:这里的原始转录已经被去除了语气词,如果想看直接录音后识别重写的效果,请前往我的b站账号【曲淡歌】查看相关视频。

来聊一下我对守望先锋的一些感受和看法。 第一点先聊一下地图设计吧。 我觉得地图设计首先要遵循一个底层逻辑, 就是优秀的地图设计必须做到 让玩家凭借着直觉也能获得较好的游戏体验。 或者换句话说,整个游戏的底层逻辑都应该是这样。 为什么说要让玩家凭借直觉也能获得较好的游戏体验呢? 我们这里举一个正向例子和一个反面例子。 正面例子就是国王大盗。 国王大盗作为一个几乎所有人都喜欢的地图, 他的优秀在哪?我们后面会谈到。 然后我们再举一个反面例子,月球基地。 为什么大家都讨厌月球基地? 那么我们结合国王大盗的优秀, 我们来谈一谈他们的差别在哪? 我觉得一言以蔽之就是 国王大盗是一个任何玩家凭着直觉都能获得较好体验的地图, 而月球基地是反直觉的,也不是完全不能玩, 但是如果没有经过刻意的分析和训练, 没有经过学习,你很难获得一个良好的体验。 就像一款游戏,如果需要看攻略才能够玩得舒服, 那作为游戏,它本身是比较失败的, 或者说是有很高能量的。 国王大盗他不需要引导, 然后凭着直觉就能玩的一个重要的表现就在于 他给进攻方和防守方都提供了相对来说比较平等的地理环境。 一般来说,守望先锋的非对称地图, 防守方都是有优势的, 而进攻方因为重生点更近, 所以一般会有一些地形上的劣势, 往往体现为防守方有高台可以高打低, 防守方有更多的掩体可以借助掩体来回避伤害, 然后获得喘息的机会。 那我们接着看国王大盗, 他的A点进攻是平地, 防守方虽然有一个高台, 但这个高台踩着没有这么舒服, 因此大部分人都会站在一楼和进攻方在同一个平面交战, 同时他的掩体又是相对来说比较公平的, 也就是说防守方和进攻方都有足够多的掩体使用, 同时进攻方又可以从左手的小房间进行绕后偷袭, 但是这个绕后也可以由防守方执行, 也就是说进攻方和防守方在根据直觉向前走的路上 就能够获得他们需要获得的一切。 而相比之下,为什么月球基地让大部分人都很讨厌? 其中有一点就是月球基地的防守方是自然而然的踩到了二楼, 而进攻方是自然而然的走一楼。 当然月球基地可以走二楼进攻, 但走二楼是需要付出一定的代价的, 因为前往二楼的路上需要被对面收很多过路费。 其次,因为进攻有三条路线可以选择, 所以在玩家没有足够的经验支撑的前提下, 有很多玩家不会选择走二楼。 这就是地图的设计对玩家的引导作用。 然后我再谈一谈英雄设计。 依然延续我之前说的一个观点, 就是优秀的设计是要让玩家凭着直觉就可以做出正确的行为。 那么,什么叫优秀的英雄设计呢? 首先我们要确定我们想把这个游戏变成什么样子, 究竟是团队作战还是单打独斗? 什么叫优秀的顺应直觉的设计? 比如说,法机会飞,天使也会飞, 法机和天使一般会被放到一起使用, 这个就是符合直觉的。 大锤可以举盾,但盾碎掉之后是需要一定的缓冲时间, 这个时候可以用矛魅来提供一个短暂的护盾来渡过他的技能增攻期, 所以就形成了经典的逼推体系。 而到了守望先锋2,从6v6变成5v5之后, 我们可以看到有很多经典的设计被破坏了, 同时带来了很多强调单打独斗、个人英雄主义的设计, 这就导致这个游戏在团队和个人之间不断地来回拉扯, 让玩家感觉到很痛苦。 典型例子就是伊拉瑞,作为一个辅助, 他的奶量大部分都来自于他的炮台, 而他的炮台是不可以移动的, 每次释放都要很小心, 这就带来一个后果就是在很多地图他都不是很好用, 然后他过于强大的输出, 就让玩家用他的时候会经常忘记来人。 更有甚者,有些伊拉瑞玩家会自己一个人走一遍, 然后把光塔放出来给自己一个人用, 相当于队友就少了一个辅助。 这个就是很差的设计。 然后在最近的古丁更新了这么一条, 就是增大了光塔的奶量, 但是伊拉瑞自己受到光塔的治疗会减慢。 我觉得这就是一个很好的设计, 通过这样的设计就可以自然而然地引导玩家去为团队做贡献。 当然我并不是说单打独斗是错误的, 但是如果要把这款游戏定位成团队英雄设计游戏, 那么你就不应该出太多的个人英雄主义英雄。 但我当初对守望天空下的这样一个判断, 如果这款游戏想要活得长久, 那就应该让全员都转向个人英雄主义, 因为这样可以尽量减少玩家的挫败感。 当然这个问题在于, 如果你不去修改老英雄, 只是出新英雄, 那么会诱导玩家群体的分裂, 因为新的个人英雄主义英雄和旧的团队主义英雄 势必会产生割裂。 那么我们再谈一谈 守望先锋一和守望先锋二。 我觉得守望先锋一是一款很有匠心的游戏, 而守望先锋二明显是一款为了市场和金钱妥协的游戏。 它其实在我心中根本算不上二代, 因为它没有出现本质上的区别, 也没有足够多的内容。 它只是在一代的基础上换了一个皮。 而且换皮这个动作本身也让人感到很失望, 因为一代的UI音乐,包括很多功能, 其实已经做得很好。 二代为了凸显它和一代的不同, 强行修改了这些东西。 即便到现在都有很多不完善的地方。 至于很多人说一代台速度很慢, 更新这些东西, 它本质上是为了二代买单的呀。 守望先锋一末期有两年停更的时间, 没有更新。 没有更新所以导致游戏玩家流失严重, 然后越来越多的玩家走了, 导致排位速度变慢。 那如果它正常更新, 肯定不可能是现在这个样子。 但是守望先锋二更新的内容, 其实就是守望先锋一本来该更新的内容。 你不能拿守望先锋一没有更, 但它本应该更新的东西, 来作为守望先锋二打败守望先锋一的坛子。 这样去对比是不合理的。 而守望先锋二它自己独特的卖点, 比如PVE这些东西, 其实它都没有实现, 它只是出了新地图新英雄, 这些本来就应该由守望先锋一推出的东西。 然后守望先锋二其实就是为了改变 守望先锋一的付费方式的一个噱头。 本来是当年承诺的买单自由行, 现在却要改成内购点卡自由, 内购游戏,微交易游戏, 因此它需要了一些借口。 包括它当年留下的承诺, 玩家是可以选择玩守望先锋一还是守望先锋二, 这些承诺都被出耳翻耳, 这也是让人觉得很好笑的事情。

2. 低档

本例子无法用低档重写,原因未知。

3. 中档

标题:《守望先锋》感受分享

内容:

来聊一下我对《守望先锋》的感受和看法。

先说地图设计。我觉得优秀的地图设计要让玩家凭直觉就能获得好的游戏体验。举个例子,国王大道是一个大家都喜欢的地图,因为它让玩家凭直觉就能玩得很好。而月球基地则相反,需要经过分析和训练才能获得良好体验。游戏如果需要看攻略才能玩得舒服,那它本身就是失败的。

国王大道的设计给进攻方和防守方提供了相对平等的地理环境。进攻方和防守方都有足够的掩体使用,可以绕后偷袭。相比之下,月球基地的防守方自然占据二楼,而进攻方走一楼。虽然进攻可以选择二楼,但需要付出代价。因此,很多玩家不愿意走二楼,这就是地图设计对玩家引导作用的体现。

再谈英雄设计。优秀的设计要让玩家凭直觉做出正确行为。例如,法鸡和天使会飞,一般会被放到一起使用,这符合直觉。而大锤可以举盾,但盾碎掉后需要缓冲时间,可以用毛妹提供短暂护盾。这些都是经典的设计。

到了《守望先锋2》,从6v6变成5v5,很多经典设计被破坏,带来了强调单打独斗的设计,让玩家感觉痛苦。例如伊拉瑞,她的大部分治疗来自炮台,而炮台不能移动,每次释放都要小心。这导致她在很多地图上不好用,并且她强大的输出让玩家常常忘记团队合作。

最近更新增大了光塔治疗量,但伊拉瑞自己受到治疗会减慢,这是一个好的设计,引导玩家为团队做贡献。如果游戏定位是团队合作,就不应该有太多个人英雄主义英雄。但如果想让游戏长久,就应该转向个人英雄主义,以减少玩家挫败感。

最后谈《守望先锋1》和《守望先锋2》。我觉得《守望先锋1》是一款很有匠心的游戏,而《守望先锋2》明显为了市场和金钱妥协。它没有本质上的区别,只是在一代基础上换了个皮。即使这样,《守望先锋2》也没有实现它独特的卖点,比如PVE模式,只是推出新地图新英雄,这些本来就应该由一代推出。

总之,《守望先锋2》只是为了改变付费方式而存在,本来承诺买断制,现在改成内购,这让人感到失望。

4. 高档

标题:《守望先锋》体验分析

内容:

让我来谈谈我对《守望先锋》的感受和看法。首先,我们聊聊地图设计。优秀的地图设计应遵循一个底层逻辑:让玩家凭借直觉也能获得良好的游戏体验。举个例子,《国王大道》几乎人人喜爱,因为它的设计让玩家不需特别引导就能享受游戏。而《月球基地》则相反,防守方天然占据二楼优势,进攻方如果不经过刻意学习,很难有好的体验。

再谈英雄设计。优秀的英雄设计也是顺应直觉的,比如法鸡和天使常被搭配使用,这符合直觉。而大锤举盾后可以用矛魅提供短暂护盾,这形成了经典的逼推体系。但在《守望先锋2》中,从6v6变成5v5后,很多经典设计被破坏,强调个人英雄主义的设计让团队合作变得痛苦。比如伊拉瑞,她的大部分治疗来自炮台,但炮台不能移动,这在某些地图上效果不好。

最后,我们比较《守望先锋1》和《守望先锋2》。一代是一款匠心独具的游戏,而二代明显为了市场和金钱妥协。它没有本质上的区别,只是在一代基础上换了个皮,而且很多功能反而不如一代完善。更糟糕的是,二代为了改变付费方式,违背了当初的承诺,让人觉得很失望。

总之,《守望先锋2》并没有带来足够的新内容,只是利用了原本一代该有的更新。这种做法不仅让人失望,还破坏了玩家对游戏的信任。


前人工智能时代,ASR悄然积蓄力量

自动语音识别,即ASR(Automatic Speech Recognition, ASR ),在那个ChatGPT还没有出现的年代,就已经很成熟了,即便是面向大众的民用技术,也能做到百分之九十左右。我印象中,十年前就有用语音输入法写小说的网文作者,像科大讯飞更是以语音识别为核心技术卖点,它家的语音输入效果也确实很好。

那个时代,我们就已经习惯了生活中的语音输入,但是它的作用好像也仅限于“唤狗”这种层级的操作,就像现在依然还停留在上个时代的智能语音助手,往往靠复杂的脚本来完成功能,因此说一句话让它“设置一个早上八点的闹钟”,和用一种独特的口哨来达到相同的目的,从原理上并没有区别。


后人工智能时代,LLM让Ai再次伟大

十年前吴恩达就说过,99%的准确度是语音识别的质变时刻,而即便到今天,单纯的ASR也不敢保证做到99%的精确度。

或者从某种意义上讲,人类的非标性让机器伤透了脑筋。如果你曾经进行过演讲/口播,就会发现人的说话其实充斥着没有意义的停顿和语气词,也就说完全准确的识别一个人的话语,并不能准确得到他想表达的意思。换言之,话语的冗余量很大。

但是人为什么可以理解另一个人的所说?因为人能够理解并筛选。而大语言模型(LLM)的出现,为机器理解人提供的出路。现在我们只需要用已经很成熟的ASR技术识别完语音,再把转录好的文字稿发送给LLM,让LLM来理解并以书面化的表达来重写口语稿,就能得到容易理解的文字了。

本文永久更新地址:

https://blogs.qudange.top/p/2024-07-15-audiopen/

#geek #[4]
2024 年 7 月 15 日 142 82
曲淡歌
曲淡歌@qudange

2024 年 7 月 14 日

obcsapi —— 最好的obsidian工具(需要云部署) 

前言

为什么很多人会纠结用notion还是obsidian?因为notion具有强大的在线功能,一旦使用场景超越了单设备,obsidian用户就不得不面临诸如“同步”、“发布”和“跨设备”的问题。

我使用obsidian三年有余,尝试了几乎所有同步方式,最终得出结论:目前现成的解决方法不可能得到完美体验(指对标原生在线的笔记应用,如notion)。

因此首先需要厘清自己的需求,再因地制宜去改造obsidian,这也是obsidian最大的优点:客制化潜力巨大(来源于它使用md格式文件和它繁荣的插件社区)。

比如我的工作流包括以下场景:
1. 在pc上使用obsidian客户端写笔记
2. 在手机上看b站视频、浏览器网页的时候想要分享我看的东西
3. 在手机上记录memos
4. 在手机上查看我的obsidian笔记库并编辑

其中最麻烦的事是如何在手机上得到良好体验,obsidian虽然有官方的app,但是体验不佳。而且在手机端进行复杂编辑还想要好体验本身就是一个伪命题(除非外接显示器和键盘),因此我选择使用网页(当然这里做出了妥协,即放弃了ob各种强大的功能,网页上只做简单的文字编辑),这样直接解决了跨平台的问题。

通过上面的分析后,拆解我的工作流来分析需求,可以得到三个版块
1. 同步
2. 信息输入
3. web发布

obcsapi几乎完美的符合了我的需求,下面我将正式开始介绍obcsapi这个开源项目。

obcsapi是由中国obsidian用户恐咖兵糖开发的一款obsidian工具,其官方介绍如下:

基于 Obsidian S3 存储, CouchDb ,本地存储和WebDAV 的后端 API ,可借助 Obsidian 插件 Remotely-Save 插件,或者 Self-hosted LiveSync (ex:Obsidian-livesync) 插件 CouchDb 方式,保存消息到 Obsidian 库。或者支持本地文件夹的文本编辑器。特点

  • 前端添加 Memos / 简答编辑 , 支持指令模式,有黑暗主题 ,是 PWA 应用
  • 微信测试号 微信到 Obsidian
  • 支持简悦 SimpRead Webook 裁剪网页文章
  • 支持 fv悬浮球文字图片分享保存
  • 静读天下 MoonReader 高亮标注 仿 ReadWise API
  • 通用 http api
  • 使用 Lua & Bash 拓展功能。用户可以处理任何请求
  • WebDAV 服务
  • 一个简易图床,附带命令行上传工具。
  • 云函数 或者 Dokcer 部署

可以看到obcsapi的使用前提是需要自己部署,我个人是采用自租vps部署,当然也可以使用云函数+对象存储,Nas+内网穿透等方法。

它可以做到包括但不限于如下功能:

  • 部署一个web页面,可以访问、搜索并修改obsidian整个库
  • web页面类memos,可以快速记录灵感想法

图片

  • 支持api输入,可以使用任何支持http quest的工具集成,如fv悬浮球/静读天下/简悦/ios的捷径/tasker/Windows Quicker等
  • 支持微信公众号测试号、企业微信,可以从微信端传入信息
  • 自带webdav服务,可以把obsidian库作为webdav的目录,这样就能与remotely-save等插件集成,进行同步
  • 自带图床,web上传图片自动存到图床并插入笔记
  • 支持分钟级待办提醒(微信推送、邮件提醒),邮件提醒可以自动识别最近三天日记中的所有待办并且每天早上发送邮件提醒,即每日提醒功能

还有更多功能见文档Obcsapi使用说明

最后实际的使用效果见我的b站视频:Obcsapi:如何让obsidian和notion打擂台?【元知识】_哔哩哔哩_bilibili

本文永久更新地址:

https://blogs.qudange.top/p/2024-07-14-obcsapi/

#geek #[4]
2024 年 7 月 14 日 365 76

Loading...
载入中

已到底部

没有可加载的页面

C
写微博
S
搜索
J
下一篇微博/评论
K
上一篇微博/评论
R
回复
E
编辑
O
显示隐藏评论
T
回顶部
L
登录
H
显示隐藏帮助
Ctrl+Enter
提交发布
ESC
取消并清除内容