至少先把视觉和听觉完整的恢复过来才是文字转WAV音频