或许我们根本无法及时发现文字转WAV音频