
7月4日的新闻,Technology Media 9TO5MAC昨天(7月3日)发起了一篇博客文章,以比较和测试Apple系统的新转录API。就速度而言,该API被认为优于OpenAI窃窃私语模型,但仍然存在一定的精度差距。注意:媒体使用9th5MAC每日播客音频测试的时间为7分31秒,比较了新的Apple Transcription API,OpenAI V3 Whisper V3模型(通过MacWhisper应用程序)和Nvidia的Pareakeet V2型号。测试平台是MacBook Pro笔记本电脑,其配备了16 GB的M2 Pro芯片,并使用两个包含的面部空间:公制:CER和公制:WER分析真实的字符错误率(CER)和单词错误率(WER)。结果表明,V2长尾小鹦鹉的转录时间最低,只有2个totwo,但高CER和WER。伟大的耳语V3涡轮增压器的精度最高,但转移时间长达40秒。苹果模型有一个速度更接近Paraquito,但比最后一个更精确。模型转录时间错误错误率单词错误率v22sec 5.8%12.3%窃窃私语。结果表明,每个模型的工作原理都不同,但是耳语仍然会导致准确性。 CHATGPT(O4-MINI-HIGH)型号转录时间错误率单词错误率V22S 6.0%12.3%大于V3 Turbo40s 0.1%1.0%Apple9s 3.5%8.2%Gemini(2.5 Pro)转录错误率转录率转录率转录率转录率,v22s v22s 7.6%12.3%whish 5.3%whish 5.3%whish 5.3%whish 5.3%