Рет қаралды 60,210
在11月7号的openAI开发者大会上,openAI宣布了whisper的升级版本whisper V3,相较之前的版本,whisper V3对非英语语言的处理能力得到了极大的增强提高。
OpenAI的whisper是一个通用的语音识别模型,它可以将语音转换成文字。 它是基于一个大规模的多语言和多任务的监督数据集训练的,能够处理不同的口音、背景噪音和专业术语。 它也是一个多任务模型,可以进行多语言语音识别、语音翻译和语言识别。
本期视频我们来看看如何使用Google Colaboratory部署使用Whisper, Google Colab是一个完全免费的python程序运行应用,我们通过浏览器就能免费使用google 提供的高算力gpu和tpu,无需任何环境配置,运行大部分的人工智能软件应用。
Colab Whisper 代码:
第一行:!pip install git+github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
第二行:!whisper "文件名(需要替换).mp3" --model medium
语音识别后,直接翻译为英文:
!whisper "文件名(需要替换).mp3" --model medium --task translate
使用最新的Whisper v3模型
!whisper "文件名(需要替换).mp3" --model large-v3
免费VPN:
privado vpn (中国可用)
官网:bit.ly/3IO5WI1
zoog vpn (中国可用)
bit.ly/3YqdCpW
👇
老张推荐:
今后,AI软件将成为我们工作生活中主要生产力工具。但是这些应用都是以美元计价的,对于中文用户来说,价格是比较高昂的。所以使用合租账号将是最经济的AI应用方案。
“银河录像局” 这个网站提供了全方位的AI工具合租账号,其中涵盖了ChatGPT Plus,Photoshop AI, Midjourney, Notion AI, Office 365, Adobe全家桶 等主要的AI应用。 相比单独的账号,合租账号的价格十分低廉,对于中文用户是友好的AI工具使用方案。
官方网站:nf.video/
账号购买“优惠码”:calz