他现在只希望观众把视线放在文字转WAV音频