从他说话的语气和神态可以看出来文字转WAV音频