这个估计他也许想过文字转WAV音频