这些语句似乎从他的嘴巴里面传出来的文字转WAV音频