微信搜索superit|邀请体验:大数据, 数据管理、OLAP分析与可视化平台 | 赞助作者:赞助作者

Whisper 官方版本离线安装及断点续传下载 + screen 后台管理全流程指南

我的操作 aide_941 1℃ 0评论

🚀
Whisper 是 OpenAI 开源的强大语音识别模型,支持多语言转写。
本文详细介绍如何在 Linux 环境下离线安装官方 Whisper,如何利用断点续传安全下载大模型,结合 screen 工具实现后台任务管理,避免断线烦恼。

一、环境准备 🛠️
Whisper 依赖 Python3 和 ffmpeg,另外用到 wget 断点续传和 screen 任务管理。

sudo apt update
sudo apt install -y python3 python3-pip ffmpeg wget screen git
AI写代码
bash
1
2
python3 和 pip3:Python环境
ffmpeg:音频处理依赖
wget:断点续传下载工具
screen:后台任务管理神器
git:克隆官方仓库
二、安装官方 Whisper 🎉
官方提供了 pip 安装方式,简洁快速:

pip3 install git+https://github.com/openai/whisper.git
AI写代码
bash
1
如果想本地调试,可以克隆仓库安装:

git clone https://github.com/openai/whisper.git
cd whisper
pip3 install -r requirements.txt
python3 setup.py install
AI写代码
bash
1
2
3
4
三、创建模型存储目录 📂
建议统一管理模型文件,避免混乱:

mkdir -p /data02/YangXian/whisper/models
AI写代码
bash
1
四、断点续传下载官方 Whisper 模型文件 📥
Whisper 官方模型体积较大,直接下载容易断线导致失败,推荐用 wget -c 实现断点续传。

模型名称 文件大小 官方下载链接(示例)
tiny 70MB https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt
base 140MB https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt
small 244MB https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt
medium 740MB https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714f32e89e936602e85993674d08dcb1/medium.pt
large-v2 2.9GB https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt
下载脚本示例 📝
创建一个脚本,方便统一批量下载:

!/bin/bash

MODEL_DIR="/data02/YangXian/whisper/models"
mkdir -p "$MODEL_DIR"
cd "$MODEL_DIR" || exit 1

declare -A models=(
["tiny"]="https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt"
["base"]="https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt"
["small"]="https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt"
["medium"]="https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714f32e89e936602e85993674d08dcb1/medium.pt"
["large-v2"]="https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt"
)

for name in "${!models[@]}"; do
echo "📥 开始下载 $name 模型…"
wget -c -O "$name.pt" "${models[$name]}"
done

echo "✅ 所有模型下载完成,存放于 $MODEL_DIR"
AI写代码
bash

运行:

chmod +x download_official_whisper_models.sh
./download_official_whisper_models.sh
AI写代码
bash
1
2
五、使用 screen 管理后台下载任务 🔥
模型文件大,下载时间长,推荐使用 screen 管理后台任务,避免中断。

创建 screen 会话:
screen -S whisper-download
AI写代码
bash
1
运行下载脚本:
./download_official_whisper_models.sh
AI写代码
bash
1
按 Ctrl + A,然后按 D,将任务挂起,安全退出。

恢复 session:

screen -r whisper-download
AI写代码
bash
1
查看所有 session:
screen -ls
AI写代码
bash
1
六、Python 调用官方 Whisper 本地模型示例 🐍
安装好模型后,可直接加载本地模型使用:

import whisper

model = whisper.load_model("/data02/YangXian/whisper/models/medium.pt")

result = model.transcribe("your_audio_file.mp3")
print(result["text"])
AI写代码
python
运行

七、总结 💡
环境准备齐全,安装 Python、ffmpeg、wget、screen
采用官方 Whisper,保证稳定与兼容
使用断点续传,避免下载中断导致失败
利用 screen 实现后台稳定运行
简洁 Python 调用示例快速上手
以上流程适用于各种 Linux 服务器或本地开发环境,助你轻松完成 Whisper 离线安装及模型管理!

 

————————————————
版权声明:本文为CSDN博主「杨靳言先」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_55666050/article/details/148603560

转载请注明:SuperIT » Whisper 官方版本离线安装及断点续传下载 + screen 后台管理全流程指南

喜欢 (0)or分享 (0)

您必须 登录 才能发表评论!