阿里开源 CosyVoice 语音克隆部署和使用

by Harry

2024-08-03

(上次更新: 2026-05-31)

应该是 开源界音色最稳定 的语音合成和克隆模型了，支持预训练音色合成、自然语言控制、3秒极速复刻和跨语种复刻。

官方部署方式比较复杂，错误较多，我这里进行了整理和优化，支持GPU和CPU，方便大家使用。

阅读全文

FunASR实时语音识别部署和使用

by Harry

2024-07-25

(上次更新: 2026-05-31)

FunASR 模型的整理和集成，Docker一键启动，能够实时识别语音输入，准确度非常高

项目地址：https://github.com/harry0703/AudioNotes

FunASR开源仓库: https://github.com/modelscope/FunASR

效果展示

使用方法

Docker部署🐳

确保已经安装了Docker软件，没有的话，从官网下载安装 https://www.docker.com/products/docker-desktop/

阅读全文

如何利用本地模型，将音视频整理成一份结构化的Markdown笔记

by Harry

2024-07-19

(上次更新: 2026-05-31)

项目地址：https://github.com/harry0703/AudioNotes

基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统

能够快速提取音视频的内容，并且调用大模型进行整理，成为一份结构化的markdown笔记，方便快速阅读

阅读全文

ChatTTS 开源语音合成服务的部署和使用

by Harry

2024-05-29

(上次更新: 2026-05-31)

项目地址：https://github.com/2noise/ChatTTS

Windows 用户建议直接下载一键启动包，运行环境和模型都已经配置好，使用更简单。

Windows 一键启动包

百度网盘下载：https://pan.baidu.com/s/1wfdqQDTzDnMf01bV1wzKgQ?pwd=v2kb 提取码：v2kb

解压密码：harryai

阅读全文

只需3分钟，基于 LLaMA3-8B 微调一个属于你自己的嬛嬛

by Harry

2024-05-03

(上次更新: 2026-05-31)

注意：没有GPU，也可以微调一个属于你自己的大模型，只是微调的时间长一点而已，建议晚上睡觉前运行，第二天早上就可以使用了 😄

效果演示

部署环境

点击下载 LLaMA3-8B 微调代码压缩包
将下载的压缩包解压
在 终端 (macOS) 或 cmd命令提示符 (Windows) 里面，进入解压后的文件夹，创建一个新的 Conda 虚拟环境
未安装 Conda 的用户，可以到 Conda官网下载安装。

阅读全文

手把手教你把AI大模型本地知识库问答接入个人微信，实现微信内的AI智能客服

by Harry

2024-04-29

(上次更新: 2026-05-31)

前提
先搭建好 本地化的企业级知识库问答系统 ，参考《手把手教你构建一个本地化的，免费的，企业级的，AI大模型知识库问答系统》

下载Docker启动文件

因为 ChatGPT-On-WeChat 代码有 Bug，作者一直未修复，因此我修改后，重新打了一个Docker镜像，避免大家踩坑。

1
2
3

mkdir chatgpt-on-wechat
cd chatgpt-on-wechat
curl -O https://harryai.cc/chatgpt-on-wechat/docker-compose.yml

修改配置文件

打开 docker-compose.yml 文件，修改 OPEN_AI_API_KEY 和 OPEN_AI_API_BASE 为你的 FastGPT 的 API Key 和 API 地址。

阅读全文

手把手教你构建一个本地化的，免费的，企业级的，AI大模型知识库问答系统

by Harry

2024-04-20

(上次更新: 2026-05-31)

我将通过一个系列分享，手把手的教大家打造一个完全本地化的，免费的，企业级知识库问答系统

本地大模型回答演示图

知识库导入演示图

我认为本地化主要有2方面的意义：

1. 安全性

当使用外部模型或服务时，我们的私有数据，用户问题，都会被发送给第三方那我们就要面临私有数据暴露给别人的风险，甚至会导致数据泄露本地化会让我们的数据就更安全

阅读全文