实际上就如某个世界的科研人士一般文字转WAV音频