No video

Cómo transcribir audio y video gratis usando Whisper y Python | Tutorial paso a paso

  Рет қаралды 55,752

Platzi

Platzi

Күн бұрын

💚 En platzi.com/l/t... hay un curso para ti. Aprende Inteligencia Artificial, ciberseguridad, liderazgo, inglés ¡o lo que tú decidas! Desarrolla las habilidades que impulsarán tu crecimiento profesional 🔥
-------------------------------------
👉 Whisper es una IA que permite transcribir cualquier audio o video a texto. En este tutorial Carlos te enseña a usarlo desde Python.
github.com/ope...
----------------------------------------------------------------------
Síguenos
Facebook: platzi.com/l/f...
Twitter: platzi.com/l/0...
Instagram: platzi.com/l/j...
@recent-platzi

Пікірлер: 81
@Dalajaa1Btk
@Dalajaa1Btk 11 ай бұрын
amigo, muy buen video y en verdad gracias por su tiempo y conocimiento, pero creo que varios tenemos el mismo problema, el repositorio se actualizo y no podemos convertir los archivos a formato srt y demas para subtitulos, le agradeceriamos de corazón que pudiese actualizar el video con esos cambios, feliz día =)
@luisdatec
@luisdatec Жыл бұрын
Está bueno !! Habrá algún ejemplo para la transcripción de llamadas ? O alguna manera de identificar cambios de tonos en la voz ? Ya que sería necesario saber que persona está hablando.
@user-eo8jk8xj3x
@user-eo8jk8xj3x Жыл бұрын
Hay una parte para identificar voces distintas?
@LastMiau
@LastMiau Жыл бұрын
Interesante, eso me recuerda cuando hice un software donde solo ponías el link de un video y lo transcribía (Creo que lo buscare para mejorarlo con este video :D )
@FelieroIngenieros
@FelieroIngenieros Жыл бұрын
tienes el software?
@seyrodriguez3509
@seyrodriguez3509 Жыл бұрын
la misma pregunta
@yorius96
@yorius96 Жыл бұрын
Actualizaron el repositorio y ahora no están esas utilidades :( alguien me ayuda a obtener el txt, vtt y srt ?
@user-eo8jk8xj3x
@user-eo8jk8xj3x Жыл бұрын
Usa la versión que si las trae
@Dalajaa1Btk
@Dalajaa1Btk 11 ай бұрын
@@user-eo8jk8xj3x ¿y cómo se hace eso? la verdad soy nuevo y me esta costando mucho trabajo el hacer todo esto xD, llegue hasta esta parte "pd.DataFrame(result['segments'])[['id','start','End','text']]" de ahi en adelante todo mal =(
@nadietepregunto8890
@nadietepregunto8890 Жыл бұрын
Cambió todo el github de whisper :c logré importar las utils con: import WriteTXT, WriteVTT, WriteSRT pero para que genere los archivos no pude, no reconoce file=vtt o file=srt
@user-pm7qt4vo1y
@user-pm7qt4vo1y 4 ай бұрын
kzfaq.info/get/bejne/d6t2mK-U09XPgas.html
@juanjosegomez143
@juanjosegomez143 5 ай бұрын
que significa y que puedo hacer? Si me aparece lo siguiente cuandp ejecuto: UserWarning: FP16 is not supported on CPU; using FP32 instead warnings.warn("FP16 is not supported on CPU; using FP32 instead")
@TheYoungGuy.
@TheYoungGuy. 8 сағат бұрын
Hola. M esale el siguiente error al usar whisper: import whisper if '/' in name or '\\' in name: TypeError: argument of type 'NoneType' is not iterable que pasa :(?
@rodrigoelestudiante683
@rodrigoelestudiante683 2 ай бұрын
2024 ya no esta txt, vtt, srt. Si alguien sabe otra forma, ayudeme
@AlbaRStudio23
@AlbaRStudio23 Жыл бұрын
Como puedo separar por la persona que habla en una conversación???
@dcorralf
@dcorralf Жыл бұрын
Muy buen video !!. me pregunto cómo hace la transcripción Whisper, es decir, importamos el modelo etc., pero para hacer las traducciones entiendo que se conectará a una API de OpenAI no ?, si no no entiendo cómo puede hacer la traducción en cualquier idioma sólo descargándonos el modelo. Alguién lo sabe ?, muy buen video Platzi, genial ! voy a estar pendiente de la escuela de Data Science de Platzi, se vienen cosas muy interesantes !!
@aemauro2616
@aemauro2616 Ай бұрын
Hola, tambien transcribe mp4?
@kilexmo
@kilexmo Жыл бұрын
Y como se hace para indenticar los interlocutores. Por ejemplo en una entrevitas. Persona A y persona b?
@carcamofelipe
@carcamofelipe 8 ай бұрын
siiiiiiiii si alguiens sabe que comparta tengo la misma duda
@emmanuelbarba2567
@emmanuelbarba2567 Жыл бұрын
Alguien sabe cómo hace eso de 7:28 la parte donde solo selecciona el espacio para eliminar, a mí se me selecciona todo :(
@antoniaprado5100
@antoniaprado5100 2 ай бұрын
Hola! esta es mi primera vez programando, cuando pego los códigos es necesario ponerle el "!" que se ve en el video? Por otro lado, luego de que ejecuto el modelo me aparece este texto: UserWarning: FP16 is not supported on CPU; using FP32 instead warnings.warn("FP16 is not supported on CPU; using FP32 instead") Agradecería su ayudita :) gracias!
@miguelangelbelloavila2385
@miguelangelbelloavila2385 Жыл бұрын
Excelente servicio, te agregare a mis favoritos, gracias por el aporte felicidades
@yarleinjulio8207
@yarleinjulio8207 Жыл бұрын
Muchas gracias, excelente video.
@juannicolasbaquerocollante3960
@juannicolasbaquerocollante3960 11 ай бұрын
No entendí eso de colab o dónde es que está metido para hacer esos comandos
@benditascolmenas651
@benditascolmenas651 5 ай бұрын
Como el repo de whisper cambio, ahora hay que ejecutar el siguiente codigo: import whisper !whisper "/content/nombre_del_archivo.mp3" --model medium Automaticamente se va a guardar el transcript en todos los formatos permitidos por whisper.
@nicolashomez
@nicolashomez Жыл бұрын
bastante interesante este mini proyecto!
@onclicker5857
@onclicker5857 6 ай бұрын
Toda la parte del SRT cambió. Podrías actualizar la info por medio de otro tutorial? Quedé perdido hasta los archivo srt, vtt txt. Ya el video quedó antiguo.
@danielavila1661
@danielavila1661 Жыл бұрын
Chevere y todo, pero algo mas facil es subir el video a youtube y dejar que salgan los subtitulos y descargar el archivo
@JulioEliseoTorres
@JulioEliseoTorres Жыл бұрын
Pero no queda con la misca exactitud.
@lucasmartinez121
@lucasmartinez121 Жыл бұрын
cuando le doy ejecutar en el ultimo paso para cargar los archivos me sale este error TypeError: __init__() got an unexpected keyword argument 'file' alguien sabe cm arreglarlo?
@alejandroibanez4632
@alejandroibanez4632 6 ай бұрын
que tal? lograste solucionar esto? estoy con lo mismo
@mariostel
@mariostel Жыл бұрын
Impresiona el proceso de transcripción de los archivos disponibles en youtube (copiar y pegar), sin embargo, la segmentación de frases todavía le falta exactitud, sobre todo en guiones no redactados previamente. Creo tener ya un proyecto decente para Platzi. Hasta ahora no he encontrado en la literatura recomendada por el curso de NLP nada sobre la distinta entonación de las mismas palabras según su posición en el segmento, es decir si van inmediatamente antes o después de una coma, punto, o signos exclamativos. Ya se por donde ir. Amo python.
@uzielmenaperez8940
@uzielmenaperez8940 Жыл бұрын
Si funciona, solo la parte final ya cambio
@ZepiDragana5783
@ZepiDragana5783 10 ай бұрын
no vi cunado instalaste python? ahi lo estas haciendo desde google cola , no?
@natalifilms8258
@natalifilms8258 6 ай бұрын
me da error cuando pego el segundo codigo
@javieralvarez1690
@javieralvarez1690 Жыл бұрын
Gran video! ahora tutorial de texto a voz :D
@lucasdiaz1311
@lucasdiaz1311 Жыл бұрын
En el traductor de google xd
@user-me1yf7sm8k
@user-me1yf7sm8k Жыл бұрын
buena su explicacion.. pero realmente es mucho mas simple de lo que ud explica son solo tres pasos en la pagina gracias
@luis96xd
@luis96xd Жыл бұрын
Excelente videos, gracias 😄
@ErikaAranda-gi6nx
@ErikaAranda-gi6nx 9 ай бұрын
algun tutorial para hacerlo en visual studio code?
@edwinpedroza5398
@edwinpedroza5398 5 ай бұрын
Negado, ando en busca de un transcriptor en el que introduzca el archivo de voz y el programa se encargue de transcribirlo sin tanta cháchara ni complicaciones de códigos que son para programadores.
@fernandachambi8144
@fernandachambi8144 10 ай бұрын
Disculpen a mi me salio esto -- UserWarning: FP16 is not supported on CPU; using FP32 instead warnings.warn("FP16 is not supported on CPU; using FP32 instead") --- Que debo hacer?
@Ramon-jr2ho
@Ramon-jr2ho 6 ай бұрын
es un problema de incompatibilidad en el hardware. Whisper utiliza FP16 (punto flotante de 16 bits) y tu CPU FP32 por eso no se ejecuta
@fernandachambi8144
@fernandachambi8144 6 ай бұрын
muchas gracias@@Ramon-jr2ho
@ZMoriarty22
@ZMoriarty22 Жыл бұрын
FUNCIONAAAAA!!!
@edwincolina426
@edwincolina426 Жыл бұрын
Como hago esto en termux
@milord229
@milord229 Жыл бұрын
gracias amigo :D
@madatyou01
@madatyou01 Жыл бұрын
Yo estoy haciendo lo mismo, pero transcribiendo videos de KZfaq. Le he querido incorporar un modelo de Transformers para que pueda hacer una suerte de resumen del mismo, pero los que he usado, gratuitos todos, hace sumarios más bien malitos. Si alguien conoce un buen modelo en español, le agradezco que lo comparta.
@RobertoRuiz-bw8ln
@RobertoRuiz-bw8ln Жыл бұрын
Gracias por compartir. Es.posible transcribir en línea con Whisper.
@danyr5951
@danyr5951 Жыл бұрын
Y pensar que azure cobra un ojo de la cara por eso
@federicoluisperez2965
@federicoluisperez2965 Жыл бұрын
No funciona mas, se actualizo o que?
@nadietepregunto8890
@nadietepregunto8890 Жыл бұрын
Si
@stephyobandoaquice
@stephyobandoaquice 11 ай бұрын
Que capo
@user-pm7qt4vo1y
@user-pm7qt4vo1y 4 ай бұрын
aqui uno actualizado para poder guardar los subtítulos kzfaq.info/get/bejne/d6t2mK-U09XPgas.html
@oscarquispesuarez3577
@oscarquispesuarez3577 Жыл бұрын
Creo estudiar ingeniería de software para el futuro,no va Ser rentable chat gpt lo hará.
@rafaelalejandrobelalcazarb2081
@rafaelalejandrobelalcazarb2081 Жыл бұрын
Mire este video y me dieron ganas de tutorial pasando de texto a voz desde colab
@danielavila1661
@danielavila1661 Жыл бұрын
Eso si estaría interesante
@comunidadhispanagaming7496
@comunidadhispanagaming7496 Жыл бұрын
le falto mas volumen
@wrangelsuarezmeguillanes1544
@wrangelsuarezmeguillanes1544 10 күн бұрын
Mucha vaina el uso
@user-oc1go3su2y
@user-oc1go3su2y 2 ай бұрын
Super difícil de realizar.Jajajaja Ya se lo aprendieron? Forget It.😢
@BedoyaEdison
@BedoyaEdison Жыл бұрын
Necesito una explicación para dummies, no entendí ni forro, no podrían haber hecho algo menos complicado?
@richybambino
@richybambino Жыл бұрын
Uy, poco engorroso, creo que la eficiencia en cuanto a tiempo no es la más ideal, hay herramientas como Transkriptor que acepta todo tipo de audios y además videos y lo transcribe a Word, txt y otro formato y en segundos. es muy eficiente, lo malo que debes pagar por esa eficiencia.
@iPollitoR
@iPollitoR Жыл бұрын
De hecho el código fuente, lo sacan de aquí
@danielvalencia1981
@danielvalencia1981 Жыл бұрын
Primer comentario
@chicotemido3647
@chicotemido3647 10 ай бұрын
De que sirve eso si no comentas nada? que ridicula gente como tu que solo hacen burradas
@chicotemido3647
@chicotemido3647 10 ай бұрын
Hola Carlos, me inicio en esto del Python y me llamo mucho la atención la plataforma que usas para ejecutar el código. Como se llama? Hay algún tutorial para manejarlo? Oye y tengo otra pregunta, si tengo un video en Inglés, hay alguna manera de hacer la transcripción y traducirlo al español? Gracias por toda la ayuda que me puedas facilitar. Me pareció interesantísimo esta herramienta que usas que definitivamente te tengo que felicitar por esto que nos enseñas y ME SUSCRIBO
@carlosgardellamerino9589
@carlosgardellamerino9589 9 ай бұрын
Hola! La plataforma se llama Google Colab, es muy potente! te sugiero que busques más info sobre ella en youtube. Básicamente te permite escribir comandos en una hoja en línea ya sea en Python 3 o R, que se guardan en Drive, y ejecutarlos con una terminal prestada por google (tus comandos se envían por internet, se ejecutan en la terminal asignada, y se envía de vuelta el resultado). Espero te sirva de ayuda!
@garochaarte
@garochaarte Жыл бұрын
me sale este error: UserWarning: FP16 is not supported on CPU; using FP32 instead warnings.warn("FP16 is not supported on CPU; using FP32 instead") si alguien me puede ayudar
@Isaax_63
@Isaax_63 Жыл бұрын
Me pasa lo mismo
@solimarrodriguez8863
@solimarrodriguez8863 Жыл бұрын
Igual a mi… ¿cómo se arregla el error?
@jesusloor1606
@jesusloor1606 Жыл бұрын
import warnings warnings.filterwarnings("ignore", message="FP16 is not supported on CPU; using FP32 instead")
@jesusloor1606
@jesusloor1606 Жыл бұрын
@@solimarrodriguez8863 import warnings warnings.filterwarnings("ignore", message="FP16 is not supported on CPU; using FP32 instead")
@jesusloor1606
@jesusloor1606 Жыл бұрын
import warnings warnings.filterwarnings("ignore", message="FP16 is not supported on CPU; using FP32 instead")
Cómo crear tu primer videojuego | Tutorial con Scratch
39:52
U3L1020 Pytorch, Tensorflow i Keras
8:48
FP_IOC_DissenyCursos
Рет қаралды 6
Unveiling my winning secret to defeating Maxim!😎| Free Fire Official
00:14
Garena Free Fire Global
Рет қаралды 8 МЛН
Look at two different videos 😁 @karina-kola
00:11
Andrey Grechka
Рет қаралды 15 МЛН
Вы чего бл….🤣🤣🙏🏽🙏🏽🙏🏽
00:18
Build Anything With ChatGPT, Here’s How
1:24:05
David Ondrej
Рет қаралды 1 МЛН
El problema de Freddy con PHP
16:35
Platzi
Рет қаралды 52 М.
How to Install & Use Whisper AI Voice to Text
12:44
Kevin Stratvert
Рет қаралды 463 М.
ChatGPT + Whisper en interfaz de Gradio Google Colab, outputs de texto y audio
12:27
Pasa AUDIO a TEXTO con la inteligencia artificial de forma GRATUITA y sin ERRORES
7:47
Academy TotemGuard - Meritxell Viñas
Рет қаралды 60 М.
Best FREE Speech to Text AI - Whisper AI
8:22
Kevin Stratvert
Рет қаралды 953 М.
5 herramientas para aumentar tu productividad con AI
13:03
Platzi
Рет қаралды 242 М.
Unveiling my winning secret to defeating Maxim!😎| Free Fire Official
00:14
Garena Free Fire Global
Рет қаралды 8 МЛН