您实际上需要为转录软件付费吗?
我经常看到Wispr Flow的广告,这是一款人工智能支持的转录工具。这个宣传--你可以通过大声说话而不是打字来写得更快--非常引人注目,尤其是如果你是一个打字速度慢的人。营销承诺您将能够“以思维的速度写作,比键盘快4倍。
"我打字的速度已经超出了我的想象。(Fast打字员还是思维迟钝的人你决定。)但是Wispr Flow的核心承诺不仅仅是转录-它是后处理。该工具使用两个步骤。首先,现代人工智能转录工具将您的声音转化为文本;
其次,大型语言模型(LLM)删除填充词并将您的单词格式化为完整的句子和段落。其想法是,您可以说出您的想法,并观看它们变成正确格式的文本。这适用于您计算机或手机上的任何文本框。我已经测试过几次了,不得不承认结果相当不错。
苹果的口述功能在其所有设备上都是免费的,效果很好--谷歌在Pixel手机上的助理语音打字功能也是如此(该功能很快将进行另一次人工智能升级)。但删除填充词并将所有内容格式化为段落的软件具有真正的价值。
Wispr Flow设计时尚,通过简洁的图形引导您完成设置过程。那么问题是什么?价格WisprFlow的费用为每年144美元(按年计费),或者在极其有限的免费试用后每月15美元。
但围绕Wispr Flow构建的技术--基于人工智能的转录和LLM--已广泛使用。在语音转文本方面,Nvidia的Canary和OpenAI的Whisper都是开源的,这意味着它们可以完全免费在您自己的设备上运行。
大多数人工智能爱好者已经在为OpenAI、Claude或Google的Gemini付费,其中任何一款都可以处理Wispr Flow的后处理部分。Olama、Google Recorder或Apple Intelligence等免费本地工具也可以。
考虑到这一切,我一直在想:Wispr Flow是否有一个好的、免费的、平台不可知的替代方案?我尝试了几种应用程序-这是我的发现。
Spotify,最佳免费替代品如果您想在不订阅的情况下快速获得Wispr Flow的好处,那么您的表现可能比Spotify更差,后者可在macOS和Windows上使用。它不是开源的,但可以免费下载,不需要帐户即可使用。
有一个Pro计划,每月10美元或每年100美元。只有当您使用Spotify的云模型时,才需要付费计划。您可以选择使用本地模型,该模型是免费的。或者,如果您已经为OpenAI或Groq等服务付费,则可以添加API密钥并使用其进行转录-Spotify可以免费使用。
Spotify提供可选的转录后格式。您还可以选择不同的LLM提供商来进行文本的转录后格式化。
作为Mac用户,我选择使用Apple Intelligence-它完全免费,并且在我的测试中效果良好。但它支持OpenAI、Anthropic和Groq,以及其他一些LLM提供商。
该应用程序还允许您根据需要编写尽可能多的自定义提示以进行转录后处理,每个提示都有自己的键盘快捷方式。我最喜欢的事情之一是Spotify可以完全离线工作。
如果您使用本地模型进行转录,并使用Apple Intelligence等本地模型进行转录后格式化,则整个过程将正常运行,而不会有任何数据离开您的计算机。从隐私的角度来看,这很好,从功能的角度来看,即使您的互联网不稳定,该功能也可以发挥作用。
毫无疑问,这比设置Wispr Flow还要多。不过,完成后,您将拥有一个无需每月订阅的工作应用程序。我建议尝试一下。其他一些免费替代方案正如我之前所说:人工智能转录和LLM都是广泛使用的技术。
因此,目前有许多Wispr Flow替代方案也就不足为奇了。对于Mac用户来说,完全免费且开源的MacParakeet是一个不错的选择。它是开源的,无需帐户即可完全免费下载和使用。应用程序中也没有追加销售。
使用本地模型(Parakeet或Whisper)处理转录,格式步骤支持各种LLM(本地和在线)。
这是我找到的最接近Wispr Flow的完全免费的应用程序。另一个仅限Mac的选项,是开源的,如果你从GitHub下载代码并自己编译,就可以免费使用。该应用程序的其他费用为25美元,一次,之后您可以使用所有功能,而无需任何持续的付款。
请注意,格式化步骤需要来自Gemini,Anthropic,OpenAI或Claude等服务的API密钥。Windows和Linux用户应该看看FOSS Voquill,它是完全免费的开源软件(因此是FOSS),可以离线工作。
它没有提供格式化步骤,这令人失望,但我之所以包含它,是因为它是我找到的最好的免费Windows和Linux选项,没有任何烦人的追加销售。出于任何原因不喜欢上述选项的Windows用户和Mac用户还有一个选择:OpenWhispr。
这个开源工具不需要帐户(但您必须找到一个微小的“在没有帐户的情况下继续”按钮)。该应用程序提供订阅,但您可以选择设置本地模型和外部API密钥以避免付费。你真的需要用声音打字吗?Wispr Flow有其优点。
首先,它很容易配置,并且具有一致的用户界面。我可以理解为什么有人可能选择付费订阅。但如果现在资金紧张,还有免费选择。我很高兴探索这个成长领域,但我会坚持使用键盘。
Wispr Flow以及类似的应用程序承诺让你以思维的速度写作,但我打字的速度比我想象的要快。如果我能有一秒钟的哲学意义的话,写作就是我的想法。输入一个句子、查看它并精炼它并不是写作过程中令人讨厌的部分--而是写作过程。
我经常不知道我对某件事的看法是什么,直到我花时间完善我的想法。我不禁觉得,如果我不是打字,而是与电脑交谈,很多内容都会丢失。但每个大脑都是不同的,这些工具可能对您很有效。这就是为什么我很高兴有这么多选择。