通常为红色文字转WAV音频