0%

🎙️ 語音互動助理 (Voice-Activated Assistant)

語音互動助理 (Voice-Activated Assistant) 🎙️

✅ 基於 Python 開發的高效能、隱私優先的本地端語音代理系統。

這是一個基於 Python 開發的高效能、隱私優先的本地端語音代理系統。透過整合最新的 Qwen3 ASR 與 TTS 技術,實現流暢的語音指令識別與自動化回應。

VoiceActivatedAssistant

🌟 核心特性

  • 🚀 極速本地推論:使用 Qwen3-ASR 與 Qwen3-TTS,支援串流輸出,具備極低首包延遲。
  • 🗣️ 純淨自然發音:內建 OpenCC 簡繁轉換機制,確保發音皆為標準的國語/普通話,避免 TTS 模型朗讀繁體中文時產生混淆。
  • 🤫 隱私與安全:語音轉文字 (ASR) 結果僅暫存於記憶體 (RAM),程式結束後自動釋放,不留任何磁碟紀錄。
  • 🧠 智慧停頓偵測 (VAD):內建 0.8 秒連續靜音判斷,精準識別一段話的結束點。
  • 🚦 狀態機協調:當 TTS 播放時自動暫停 ASR 監聽,完美解決「自己聽到自己講話」的自我回饋問題。
  • 🛠️ JSON 驅動規則:透過簡單的 JSON 設定檔定義關鍵字、優先序與多樣化的回覆模式。

🛠️ 技術棧

  • Language: Python 3.10+
  • ASR: Qwen3-ASR (1.7B / 0.6B)
  • TTS: Qwen3-TTS
  • VAD: Silero VAD
  • Concurrency: Threading + Python Queue

🏗️ 專案宗旨

voice-activated-assistant.py 的開發初衷是為了解決依賴雲端 API 的延遲與隱私問題,打造一個完全在本地端執行的 AI 語音代理系統。它專注於快速響應與離線可用性,讓使用者能夠安全、流暢地與本地智慧互動。

我的 Github 專案

🔗 我的 Github 專案: voice-activated-assistant.py
✅ 一個隱私優先的本地端語音代理系統。歡迎 Star 🌟 收藏與提供建議!