Edge智读

Edge智读 公开 已发布

如何安装动作?

适用于
分类(旧)
其他
关键词

FanXiang histalent 航航最棒 baiye123456 用户303494031613133 7 人赞了这个动作


更多信息
分享时间 2026-03-28 22:44
最后更新 20小时11分钟前
修订版本 27
用户许可 可自己使用或修改,不可再分享
Quicker版本 1.45.0
动作大小 82.7 KB

分享到

「智能中英分拣,纯内存解码秒出声;内置沙盒环境,空选文本即可一键刹车静音。」

简介

Edge 智读

内存流水线 · 高并发沙盒 · 工业级长效版

🖼️ 动作截图预览(3张示例)

动作截图1:正常朗读
动作截图2:无缝切歌

动作截图3:一键静音

导语:彻底抛弃传统“生成硬盘文件再播放”的古典模式,融合 Python FastAPI 本地微服务隔离沙盒NAudio 三段式内存流水线架构,突破API原生限制;将千行级极客优化(背压控制/内存回收/并发调度)封装于底层,只为呈现毫秒级极速响应与工业级稳定性。

🚀 核心架构与极客特性

  • 纯内存流式解码(零磁盘读写):音频数据以网络二进制流直送声卡,全程 0 临时音频文件生成;首段/tts/stream接口秒开,后续多线程SemaphoreSlim预下载并发,告别硬盘I/O瓶颈,划词即发声。
  • 全自动免安装部署(零依赖):未检测到Python环境时,自动从华为/淘宝镜像源下载便携版Python沙盒,部署于%LocalAppData%\QuickerTTS;不配环境变量、不污染全局系统,小白开箱即用,极客可自定义端口(多端口灾备)。
  • 一键智能启停交互(Toggle):发声状态下,在屏幕空白处(不选文字)触发动作,即刻“紧急刹车”静音;内置主线程保活锁与异步解包优化,无报错、无卡顿,交互优雅。
  • 智能语境识别与防误切保护:中文优先“晓晓”、英文优先“Ava”;对mm/cm/kg/MPa等工程单位、U.S.A./Ph.D.等带点缩写做强正则保护,避免引擎误判停顿;文本分段智能适配(中文首段80字/后续200字,英文首段120字/后续350字)。
  • 工业级内存管控与容灾:内置Decode内存流容量智能回收(Capacity GC)、Playback自适应退避背压、LFU缓存淘汰算法,长期挂机零内存泄漏;ThreadPool线程池替代原生Thread,消灭百兆内存开销;强一致性断流保护+同步补偿机制,拒绝漏句跳段。
  • 24kHz音频闭环优化:强绑定24kHz 16bit单声道音频水桶,首帧探伤+内联点火,消灭时序竞态与死锁;声卡静态预热(不释放声卡实例),二次触发极速响应。

📖 交互与使用指南

🖱️ 左键极速触发(核心用法)

  • 正常朗读:选中文本(网页、Word、PDF等),点击动作图标瞬间发声;首段内联秒解,后续分段并发预下载,播放无间断。
  • 无缝切歌:正在朗读时,直接框选新文字触发动作,旧音频流水线即刻终止,新内容无缝衔接(基于令牌隔离)。
  • 一键静音(必看):播放状态下,不选任何文字触发动作,即刻终止流水线、清空音频缓冲区。

⚙️ 右键高级定制(扩展菜单)

  • 录制到文件:导出高品质MP3,自动过滤非法字符,按录制前8字时间命名;文件合并支持3次重试补偿,避免分片丢失。
  • 设置语速:独立控制中/英文双轨语速(范围-100%~+100%),参数直连edge-tts的rate接口,无损耗生效。
  • 选择朗读者:内置14款微软神经元音色,手动锁定后覆盖智能匹配逻辑;支持zh-CN-XiaoxiaoNeural等原生音色标识。

🛡️ 安全与隐私透明度白皮书

  • 网络隐私:文本仅加密发送至微软TTS服务器合成语音,动作开源透明;HttpClient禁用Cookie/自动重定向,无代理、无预认证,绝不收集系统/剪贴板信息。
  • 本地文件零污染:运行环境严格隔离于%LocalAppData%\QuickerTTS;缓存/日志/便携Python均在此目录,卸载仅需删除该文件夹,无痕清理。
  • 临时文件强管控:纯内存播放不写盘;仅录制/容灾时生成qk_*.mp3临时文件,任务结束秒删;每次启动自动清理1小时前的过期临时文件(最多保留20个)。
  • 硬盘保护机制:诊断日志硬编码限容1MB,超量自动轮转覆盖;连接失败计数+时间窗口限流,避免高频重试耗盘/耗网。
  • 沙盒安全隔离:FastAPI微服务仅绑定127.0.0.1,拒绝外网访问;MaxConnectionsPerServer限制并发(普通50/流式100),防止端口耗尽攻击。

⚠️ 极客向:故障排查与运行日志

如果按下后毫无反应或弹出报错,请优先进行以下排查:

  • 查阅双引擎日志:按下Win + R,输入%LocalAppData%\QuickerTTS回车;edge_tts_client.log(C#前台)和edge_tts_server.log(Python后台)记录完整报错(含并发下载/解码失败原因)。
  • 系统静音检查:无报错但无声时,检查音量混音器中Quicker是否静音;NAudio的WaveOutEvent默认100ms延迟,可排查声卡驱动兼容性。
  • 杀毒软件误杀:沙盒内python.exe/pythonw.exe易被拦截,需加入信任白名单;FastAPI服务启动超时会触发部署失败提示。
  • 网络环境排查:需连通微软TTS服务器,且127.0.0.1环回通信未被封锁;流式接口超时15秒,网络差会触发同步补偿重试。
  • 依赖校验失败:若提示“import fastapi/edge_tts失败”,手动删除QuickerTTS/py_embed目录,重启动作重新下载便携Python;确保系统Python≥3.8(低于则自动走便携模式)。
作者所声明的动作特征:
  • 依赖Python环境
  • 依赖第三在线服务
  • 依赖第三方组件(如DLL库、python包等): edge-tts (Python包)
  • 会自动下载依赖组件
  • 会保存状态数据
  • 含有写入本地文件的功能
  • 含有删除或更改本地文件的功能

最近更新

修订版本 更新时间 更新说明
27 20小时11分钟前 更新说明:

本次更新主要围绕“稳定性、排错能力、环境兼容性”做了优化,让动作在更多 Windows 电脑上运行得更稳,也更容易定位问题。

1.优化了首段语音的容错机制
首段语音默认仍优先使用流式方式快速开始播放;如果连续失败 2 次,会自动切换为整段下载后再播放,避免出现“后面能播,但开头丢失”的问题。

2.增强了性能与排错日志
新增了关键耗时日志,包括:
首帧出声耗时
首段流式播放完成耗时
分段下载耗时
总播放耗时
总录制耗时
这样在遇到播放慢、卡顿或异常时,可以更快判断问题出在哪一环。

3.补充了服务端生成耗时日志
后端 TTS 服务增加了更细的耗时记录,用于区分是“语音生成慢”,还是“本地接收、解码、播放慢”,方便后续继续优化。

4.修正了错误提示中的日志路径
部署失败时,现在会直接提示真实日志文件位置,避免用户去错误目录查日志。

5.提升了运行环境兼容性
放开了代理兼容,改善了在企业网络、校园网或受管终端中的初始化成功率。
同时扩展了服务端口范围,并增加自动寻找空闲端口的兜底机制,减少端口占用导致的启动失败。

整体来说,这次更新的目标不是增加功能,而是让语音播放更可靠、安装启动更顺利、出现问题时更容易排查。
26 11天13小时前 不再勾选尝试不通过剪贴板的方式获取

不再通过UIAutomation方式获取,修复某些情况可能出现无法完整获取文字、失去换行信息等问题
25 11天18小时前 1.优化后续分段背压等待退出条件
把后续分段解码时的取消判断前移到 while 条件里。停止朗读、切换新朗读或任务取消时,解码线程能更快退出等待,减少卡住感。

2.优化服务健康检查资源释放
在 /ping 健康检查中释放 HttpResponseMessage。避免频繁检查服务状态时响应对象释放不及时,减少长期运行的连接和资源压力。

3.优化录制保存同步对象释放
为录制保存流程中的 SemaphoreSlim 和 AutoResetEvent 增加安全释放逻辑。只有确认所有录制任务都完成后才释放,保留原来的超时容错行为。

4.优化缓存内存上限控制
新音频加入缓存后再次执行缓存清理,并确保超出内存限制时至少移除 1 条缓存。避免大音频加入后缓存超过 50MB 却暂时不清理。

5.优化后续分段入队内存拷贝
移除下载完成后多余的 byte[] 完整复制,直接把已下载的音频数据放入播放队列。长文本多分段播放时可减少内存分配和 GC 压力。

最近讨论

使用问题 · 128
e213fdsxcvcxvxc 2026-04-02 21:22 e213fdsxcvcxvxc 2026-04-03 09:52