Cómo convertir ChatGPT en un asistente de voz avanzado


ChatGPT-3 no necesita presentación. Le haces cualquier pregunta y te responde en un santiamén. Pero la respuesta viene en forma de texto. ¿Qué pasaría si pudieras hablar con él, como cualquier asistente de voz como Siri?

No es ningún secreto que ChatGPT ha revolucionado el mundo de la IA. A diferencia de otros bots de IA, es capaz de comprender el contexto de una conversación y responder, haciéndote sentir como si estuvieras hablando con un humano y no con una máquina.

Pero como sigue siendo una especie de chatbot, debe ingresar una pregunta y obtener la respuesta en forma de texto. No es tan emocionante como hablar con un bot.

Este pensamiento me dio la idea de programar ChatGPT para que pueda usarse como un asistente de voz llamado VoiceGPT. Empecé a usar el procesamiento de lenguaje natural (NLP) para reconocer la voz y luego pasé la voz reconocida como una consulta al motor ChatGPT usando la API. Después de obtener una respuesta inteligente de ChatGPT, usé NLP nuevamente para convertirlo en una voz humana.

Principio de funcionamiento de VoiceGPT
Fig. 1: Principio de funcionamiento de VoiceGPT

Necesitaba una buena herramienta de PNL para esto y el mismo OpenAI proporciona una, a saber, Whisper. Pero debido a limitaciones de tiempo y espacio, finalmente decidí usar la API de Google Natural Language.

Índice del contenido

Una guía paso a paso para crear VoiceGPT

Necesitamos comenzar combinando el NLP para el servicio ttX con ChatGPT. Para hacer esto, necesitamos una máquina que ejecute la API abierta, transmita la consulta recopilada por NLP y convierta la respuesta proporcionada por ChatGPT en una voz humana usando NLP.

Puede usar cualquier computadora portátil, pero elegí Raspberry Pi para ejecutar todo esto. Para capturar la voz para el reconocimiento, adjunté la capucha de voz; También se puede usar un micrófono USB con Raspberry Pi. Sin embargo, si está utilizando una computadora portátil para ejecutar el código VoiceGPT, no se requiere un micrófono USB. Puede usar el micrófono incorporado de la computadora portátil.

Ahora necesitamos crear una cuenta e iniciar sesión en ChatGPT (ver Fig. 2).

Página de inicio de sesión de ChatGPT
Fig. 2: Página de inicio de sesión de ChatGPT

A continuación, necesitamos obtener la clave API para investigar y experimentar con el código ChatGPT como se muestra en la figura 3.

Obtener el menú API de OpenAI
Fig. 3: Entrar en el menú API de OpenAI
Clave API de ChatGPT
Fig. 4: Clave API de ChatGPT

Puede crear la clave API usando la esquina derecha de la opción API en su cuenta de OpenAI (Fig. 4).

Después de generar la clave API de OpenAI, cópiela y guárdela. Lo necesitaremos más adelante en nuestro código para desarrollar VoiceGPT.

Ahora necesitamos instalar la IA abierta en el sistema donde vamos a ejecutar VoiceGPT. Aquí puede usar una computadora con cualquier versión de Linux instalada. Usé la Raspberry Pi para esto.

A continuación, abra la terminal e instale la IA abierta y otros módulos de Python que nos ayudarán con el procesamiento del lenguaje natural. Aquí puede usar Whisper by OpenAI o cualquier otro módulo NLP. Usé Google NLP y lo combiné con ChatGPT.

Fig. 5: Clonar código OpenAi ChatGPT
Clonación del código OpenAi ChatGPT

Puede instalar estos módulos con el siguiente comando. Después de eso, puede crear su contenido de habla personalizado abierto en OpenAI o usar el chat simple en el patio de recreo. Aquí también puede configurar la temperatura, la frecuencia y otros parámetros para su asistente VoiceGPT.

sudo pip3 instalar openai
sudo pip3 instalar SpeechRecognition
Instalar sudo pip3 gTTS

Si quieres conocer otros artículos parecidos a Cómo convertir ChatGPT en un asistente de voz avanzado puedes visitar la categoría Electrónica.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir