liumaolin
Fix formatting in README by removing extra bold styling from the installation guide link
0112f01
| title: VoiceDialogue - 智能语音对话系统 | |
| license: mit | |
| language: | |
| - zh | |
| - en | |
| pipeline_tag: text-to-speech | |
| tags: | |
| - voice-dialogue | |
| - speech-recognition | |
| - text-to-speech | |
| - large-language-model | |
| - asr | |
| - tts | |
| - llm | |
| - chinese | |
| - english | |
| - real-time | |
| library_name: transformers | |
| # VoiceDialogue - 智能语音对话系统 | |
| <div align="center"> | |
|  | |
|  | |
|  | |
|  | |
| 一个集成了语音识别(ASR)、大语言模型(LLM)和文本转语音(TTS)的实时语音对话系统 | |
| [快速开始](#-快速开始) • [文档导航](#-文档导航) • [贡献指南](docs/contributing.md) | |
| </div> | |
| ## 🎯 项目简介 | |
| VoiceDialogue 是一个基于 Python 的完整语音对话系统,实现了端到端的语音交互体验。系统采用模块化设计,具备实时、高精度、多角色的特点。 | |
| - 🎤 **实时语音识别**: 高精度中英文语音转录 | |
| - 🤖 **智能对话生成**: 集成 Qwen2.5 等大语言模型 | |
| - 🔊 **高质量语音合成**: 支持多角色、多风格的语音输出 | |
| - 🌐 **Web API 服务**: 提供 HTTP 接口,方便集成 | |
| - ⚡ **低延迟处理**: 优化的音频流处理管道 | |
| > 想要了解更多?请查看 [功能特性详解](docs/features.md)。 | |
| ## 🚀 快速开始 | |
| ### 1. 安装 | |
| ```bash | |
| # 克隆项目 | |
| git clone https://huggingface.co/MoYoYoTech/VoiceDialogue | |
| cd VoiceDialogue | |
| # 安装依赖 (推荐使用 uv) | |
| pip install uv | |
| uv venv | |
| source .venv/bin/activate | |
| WHISPER_COREML=1 CMAKE_ARGS="-DGGML_METAL=on" uv sync | |
| # 安装额外的依赖 | |
| ## 1. 安装 kokoro-onnx | |
| uv pip install kokoro-onnx | |
| ## 2. 重新安装指定版本的 numpy | |
| uv pip install numpy==1.26.4 | |
| ``` | |
| > 📖 需要更详细的步骤?请查阅 [安装指南](docs/installation.md),其中包含系统要求和常见问题。 | |
| ### 2. 运行 | |
| #### 命令行模式 (CLI) | |
| ```bash | |
| # 启动语音对话 (默认中文) | |
| python main.py | |
| # 启动并指定语言和角色 | |
| python main.py --language en --speaker Heart | |
| ``` | |
| #### API 服务模式 | |
| ```bash | |
| # 启动 API 服务器 | |
| python main.py --mode api | |
| ``` | |
| > 详细使用方法请参考 [配置指南](docs/configuration.md) 和 [API 服务指南](docs/api-guide.md)。 | |
| ## 📚 文档导航 | |
| - 📖 **[安装指南](docs/installation.md)**: 详细的安装步骤和系统要求。 | |
| - ⚙️ **[配置指南](docs/configuration.md)**: 如何配置系统参数和高级选项。 | |
| - 🎭 **[功能特性](docs/features.md)**: 深入了解项目的所有功能。 | |
| - 🌐 **[API 指南](docs/api-guide.md)**: 如何使用和集成 API 服务。 | |
| - 🏗️ **[系统架构](docs/architecture.md)**: 了解系统的内部工作原理。 | |
| - 📁 **[项目结构](docs/project-structure.md)**: 浏览项目代码和文件组织。 | |
| - 🛠️ **[故障排除](docs/troubleshooting.md)**: 常见问题和解决方案。 | |
| - 🤝 **[贡献指南](docs/contributing.md)**: 如何为项目做出贡献。 | |
| ## 📄 许可证 | |
| 本项目采用 MIT 许可证开源。 | |
| ## 🙏 致谢 | |
| 如果这个项目对您有帮助,请给我们一个 ⭐️! |