Skip to main content
Open In ColabOpen on GitHub

Google Cloud 文本转语音

Google Cloud 文本转语音 使开发者能够合成听起来自然的语音,提供 100 多种嗓音,支持多种语言和变体。它应用了 DeepMind 在 WaveNet 方面的开创性研究以及 Google 的强大神经网络,以提供可能实现的最高保真度。

它支持多种语言,包括英语、德语、波兰语、西班牙语、意大利语、法语、葡萄牙语和印地语。

本 Notebook 展示了如何与 Google Cloud Text-to-Speech API 进行交互以实现语音合成功能。

首先,您需要设置一个 Google Cloud 项目。您可以遵循此处的说明进行操作。

!pip install --upgrade langchain-google-community[texttospeech]

实例化

from langchain_google_community import TextToSpeechTool
API Reference:TextToSpeechTool

已弃用 GoogleCloudTextToSpeechTool

from langchain_community.tools import GoogleCloudTextToSpeechTool
text_to_speak = "Hello world!"

tts = GoogleCloudTextToSpeechTool()
tts.name

我们可以生成音频,将其保存到临时文件,然后播放。

speech_file = tts.run(text_to_speak)