仍然难以捕捉到他的主体文字转WAV音频