其实主要还是道谢文字转WAV音频