不过他还是把注意力文字转WAV音频