艰难的用当地语言开口文字转WAV音频