新增模块。它像一个交通警察,站在离线词表的出口,负责检查每一个"易错词",并根据其特性决定它的去向。
如果词汇是 OOV (Out of Vocabulary) 或极其罕见的专有名词(如 "Gigaton"),必须在源头注入 SFSpeech,否则引擎压根不知道这个词的存在。
如果词汇是常见的同音词错误(如 "New clear" -> "Nuclear"),SFSpeech 即使加了权重也可能识别错。这种"硬骨头"直接交给 Step 1 的规则引擎暴力替换。
这一步发生在 Apple SFSpeech 真正开始听声音之前。相当于给识别引擎"植入记忆"。
逻辑: Score > 0.95 ? Pass : Fix
这是一个省电且提速的开关。如果 SFSpeech 非常确信自己听对了,直接输出。
输入源: 来自 Dispatcher 的"顽固错词"。
作用: JSON 静态规则触发。基于 AC 自动机的高速匹配。
输入源: 接收所有词表作为 Trie Constraint。
技术: Seq2Seq Context Loop T5TokenizerFast
利用上下文信息解决"语义歧义"。比如根据前文 "Energy" 将 "New clear" 修正为 "Nuclear"。T5TokenizerFast 提供了更快的 token 处理速度。
这是离线训练产出的核心资产,其训练逻辑遵循"极致过拟合 (Active Overfitting)"原则。