Buzz离线本地部署教程

Buzz 是一款可以自动识别语音为文本字幕的软件工具,基于 OpenAI 开源的 Whisper 自动语音识别模型,可以批量将音频或者是视频中的内容自动转化为带有时间的字幕,速度非常快,是一款能极大提高效率的生产力小工具。我体验下来转换效果还是很不错的。具体怎么样见测试……

1. 附件表

按照国际惯例,先放附件表,Github可能连不上,请使用霍格沃兹环境或使用GitHub国内加速

文件名网站类型霍格沃兹文件大小适用系统
Buzz-1.1.0-windows.exeGithub需要331MBWindows
Buzz-1.1.0-mac.dmgGithub需要279MBMacOS
Buzz-Windows-X64.zipGithub需要1.51GBWindows
Buzz-macOS-X64.zipGithub需要404MBMacOS on X86
Buzz-macOS-ARM64.zipGithub需要283MBMacOS on ARM
Bandzip官网不需要10.86MBWindows

2. 和CapsWriter 的区别

  • 优点:支持数十种语言的转换,支持自动识别语种,支持自选模型大小(可以根据设备选择模型),图形化界面更方便小白用户操作,支持翻译(翻译为英文)。
  • 缺点:不是完全本土化,识别不是那么精准。

3. 软件下载安装

1. 下载

  • 打开Github仓库发布页 ,或者从附件表下载
  • 找到最新版本,下载你的系统能运行的软件包,比如我的电脑是Windows10 64位就选择第三个。

2024-12-04T01:17:31.png

  • 值得注意的是,1.1.0版本以下都不是压缩包,而是安装包,模型需要单独下载

2024-12-04T01:38:55.png

2. 安装(会解压/安装直接看第4步)

1. 1.1.0版本及以下版本的安装

  1. 找到下载下来的文件,双击打开,提示要管理员权限请选择“
    2024-12-04T02:11:03.png
  2. 依次点击Next-->选择安装目录-->Install-->Finish,我已经安装过了,没有选择安装路径的选项,但是安装路径其实是可以更改的。
    2024-12-04T02:14:16.png
    2024-12-04T02:15:59.png
    2024-12-04T02:16:05.png

2. 1.2.0版本的安装

  1. 找到下载下来的文件,右键选择解压到其他文件夹
    2024-12-04T02:24:14.png
  2. 选择你找得到的文件夹(比如桌面),确定,解压以后找到解压出来的文件夹
    2024-12-04T02:31:53.png
  3. 解压出来以后是一个可执行EXE文件,直接双击运行
    2024-12-04T02:33:36.png
  4. 依次点击Next-->选择安装目录-->Install-->Finish,和1.1.0版本及以下版本的安装步骤一样
    2024-12-04T02:38:05.png

4. 下载模型

1.打开以后默认是英文的(我也忘记怎么设置的中文了[doge]),选择帮助,选择偏好设定
2024-12-04T03:11:50.png

  1. 选择models,下载你想要的模型,一般最好依据你的机器性能选择,Tiny是性能最好的,但是识别精确率比较低,往下精确率会逐渐提高,但是也意味着转换时间变长,对设备的要求也更高。
    2024-12-04T03:15:30.png

5. 使用测试

1. 语音识别

  1. 关闭窗口返回首页,第一个麦克风图标按钮是语音识别,点击即可打开识别窗口
    2024-12-04T03:06:24.png
  2. 打开以后,第二项选择你下载好的模型,软件默认选择Tiny,第三项选择模式,翻译还是语音转文字,第五项选择语言。如果是默认的检测语言,中文转换结果可能会是繁体
    2024-12-04T03:06:58.png
  3. 点击录制开始录音,点击停止开始语音转文字

2. 音视频转换

  1. 软件支持本地文件和远程文件(直链)转换,+是本地文件识别,🔗是远程文件识别
    2024-12-04T03:27:45.png
  2. 这里使用上篇测试视频进行转换测试,选择文件时可以在右下角选择文件类型
    2024-12-04T03:35:36.png
  3. 我选择的是Whisper (Large-v3),耗时41秒,双击你的转换结果即可查看详情。我试过了,转换效果简直惨不忍睹😅,换个模型基本能解决,毕竟不是专门的中文模型,可以理解
    2024-12-04T03:38:13.png
    2024-12-04T03:38:26.png
    2024-12-04T03:40:21.png
  4. 换一个日语的视频(选自Re:0 从零开始的异世界生活)进行测试,也是一样的模型
  • 第一次转换,使用的是Tiny,耗时50秒,准不准展开看吧,我是觉得边都不沾

    Tiny转换结果
    テムを押さえなってす あぶ いや、が突然すばるのみから始かれた自転で嫌なよ顔していたが どうやくと あれは すばるではない そう 私は魔女教大臣教 タイダッタンと デテルギュスロマニコンティ デッス うっ うっ うっ うっ 地図に 実に素 baht の一人皮炎です これ雴、お貓子もグループの 😵 覺時芽 Choice Within 我致アイの行気に入れの ですね 突然引けない ago に当愛に 彦に せー愛に 戻 senators が 2アイニアイニ イチ いあい
    スロール!目をすばすだ! ムーダーです すでに行く対応性が私の意識がにあるのです 気付け取れ 自分が何をしようとしているのか 何のためにここまで戻ってきたのかを思い出せ 何です 何が あ、そこくそもあるか バカやろ 俺は 絶対受付のまに関係 この水でに私の夢見さっき バンマレオレは 夏キッサーバールだ やってくれいるせ お前のその刑で 何を言いたすながすわい いな 俺をとは何だよ 風なくなる その前に 海出すわい その私はできない あとでなと君を言った 私になりが話すことがあったんじゃないのか あ、あるかった うん、それ あ、なぜそうにねーは アイリーサー ほう 頭が
    おらんでいいよ 素晴らか 私もおらむから あ、スタッ
    アイリー 他の誰にもできないでしょう 素晴らしいのがこれがのためだよ だからと言って 私の夜空でやったと思う 私でもあなたの力で 全体に憎縮してくれること ああああああああああああああ かなまかんな 私はこれが 私は私は 君とエリス 望むのけつだもしい とのは私の太くだ いずれパスを受けだろ
    私が俺を向かったなった
    それ Do
    いつborins
    她してくれ まくらく
    去れ
    こう

  • 第二次使用Large-v3,内存直接接近爆满,CPU占用也提升到70%附近,GPU占用也到50%附近浮动
    2024-12-04T03:57:58.png
  • 漫长的等待了11分40秒以后,结果出来了,好像还是挺准的,到底怎么样展开看看吧

    Large-v3转换结果
    でも遅いのです イヤが突然スバルの身から弾かれた時点で嫌な予感をしていたが どういうこと? あれはスバルではない そう、私は魔女教滞在司教、タイラ担当、ペテルギウス・ロマニコンティです 実にいい、実に素晴らしい体です これほど馴染む体は何十年ぶりか 狂人め、今すぐその体から出ていけ 狂人? そう、私は愛の狂気にいるのです 慈愛に敬愛に純愛に情愛に親愛に性愛に友愛に 愛に愛に愛に愛愛愛 愛に愛に愛に愛愛愛 愛に愛に愛に愛に愛に愛に愛に スバル、目を覚ますんだ 無駄です すでに肉体の制御は私の意識下にあるのです 気づけスバル 自分が何をしようとしているのか 何のためにここまで�öってきたのかを思い出せ 何です?何があったのクソもあるか 馬鹿野郎 俺はペテルギ ユリウスの胸、この身すでに私の指先! 頑張れ、俺はナツキ・スバルだ! やってくれユリウス、お前のその剣で! 何を言い出すんだ、スバル! 今、俺を止めなきゃ勝てなくなる! その前に… ダメだ、スバル!それはできない! 後でなと君は言った! 私に何か話すことがあったんじゃないのか! 悪かった…それ、話せそうにねえわ… ユリウス!
    頼む…
    恨んでいいよ、スバル君… 私も恨むから…
    ユリウス! 他の誰にもできないで! 私は…スバル君の…これが望みだよ! だからといって… 私が喜んでやったと思う? クルシ様のための力で…天下に約束した力でこんなことを… ああ、馬鹿な、馬鹿な…私はこんな…ふさわしき器を… 君とフェリスに望まぬ決断を強いたのは私の不得だ… いずれ罰を受けるだろう… ああ… ああ… 私が滅ぶことなど…

    2024-12-04T04:28:30.png

6. QA

暂时没有

7. 结束

至此教程结束,致敬每一位开源作者。如果对你有用,请给原作者点个Star支持开源精神。

对本文有什么疑问或者意见(或者有啥想对我说的),欢迎在评论区评论补充Ciallo~(∠・ω< )⌒★