他只能自己根据现实的线索文字转WAV音频