但从他的话语言行来看文字转WAV音频