AI Transcription是一款强大的语音转文字工具,它能够快速、自动地将音频和视频文件转录成文字和字幕,全部离线完成,确保了高度的准确性。该工具结合了OpenAI的Whisper技术和Apple的语音识别技术,能够处理如播客、演讲、讲座或语音消息等多种语音内容。AI Transcription的特点包括AI驱动的音频到文本转换器、简单的拖放操作启动自动转录、以及由OpenAI的Whisper和Apple语音识别技术提供支持。重视隐私设计,确保用户的音频数据不会离开Mac,所有计算都在设备上离线完成。它界面友好、设计轻量却功能强大,支持将转录内容导出为纯文本、CSV、SRT和WEBVTT文件格式,并能够根据单词、句子或持续时间分割段落。此外,它支持多种输入格式,如MP3、WAV、CAF等。该应用得益于Georgi Gerganov出色的工作,他将OpenAI的Whisper模型以C/C++(whisper.ccp)进行了移植,使这款应用得以实现。

功能

AI Transcription:使用 Whisper 技术进行语音转文字

AI Transcription 是一款高效的语音转文字应用,利用 OpenAI 的 Whisper 技术和 Apple 语音识别技术,自动、快速且离线转录音频和视频文件,提供高度准确的结果。无论是播客、演讲、讲座还是语音消息,AI Transcription 都能将其转为文本和字幕。

特性

  • AI 驱动的音频转文本转换器
  • 拖放即转录:自动开始转录
  • 由 OpenAI 的 Whisper 和 Apple 语音识别技术提供强力支持
  • 隐私设计:您的音频数据不会离开您的 Mac。所有操作都在设备上进行,完全离线。
  • 用户友好、轻量级设计,功能强大
  • 导出转录文本为纯文本、CSV、SRT 和 WEBVTT 文件
  • 时间分隔:可按单词、句子或持续时间分割段落
  • 支持输入格式:MP3、WAV、CAF、AIFC、M4A、MP4

此应用的开发离不开 Georgi Gerganov 及其出色的 OpenAI Whisper 模型 C/C++ 端口(whisper.ccp)的工作。