杜克认为很有可能文字转WAV音频