Reconocimiento de voz con modelos de Inteligencia Artificial
Whisper es un sistema de reconocimiento automático del habla (ASR) entrenado en 680.000 horas de datos supervisados, multilingües y multitarea recopilados desde la web. Los resultados demostraron que el uso de este gran y diverso conjunto de datos mejoró significativamente la robustez del sistema ante acentos, ruido de fondo y terminología técnica. Además, permite transcribir texto en múltiples idiomas, así como traducir desde esos idiomas al inglés.
Con Whisper, los usuarios pueden realizar transcripciones rápidas y precisas sin tener que escribir manualmente, lo cual puede ser muy útil para personas que necesitan tomar anotaciones durante reuniones o conferencias importantes.
En este informe te explicamos paso a paso como instalarlo y ponerlo en funcionamiento en tu propia computadora.