角度和深浅都完全记得文字转WAV音频