会速记目前还处在内测阶段,还未上线,不过可以通过一个演示示例了解它是如何工作。会速记支持上传时长 1 个小时以内的 wav 或 mp3、pcm格式文件,目前只接受中英文。接下来它需要花点时间生成文字,官方说法是,1小时音频5分钟转写完成。
创始人欧咏群表示,接下来你会在网页上看到转录好的文字,但这并不意味着转录结束。文本不会区分大小写、没有标点符号,更没有分段,你需要在文本框中手动编辑,然后再做导出。这个过程也会被记录,就像所有的人工智能学习过程一样,它用来帮助算法纠正错误,提高准确率。
这个过程就相当于用机器算法取代了速记员、听写员的工作。“会速记会在广泛的领域内带来积极影响,提高生产力,包括医疗机构、法律、商业和媒体。”欧咏群说道。
专业领域的人工听写效率低,1 小时的录音往往需要花费 4-6 个小时,每小时语音的成本大约在80元左右,会速记能把完成工作的时间平均缩短 80%。
会速记也有语音实时转写功能,1秒内出文字,可以使声音、文字同步直播。标准普通话转写准确率可达95%以上;
众所周知,语音识别并不是什么新鲜事物,手机里的各种语音助理比如 Siri都基于此。用户关心的唯一问题可能是到底识别的准确性有多高。
据介绍,会速记通过麦克风硬件接收,通过语音转写引擎,最后在线上呈现文本分享,准确率在92%左右。
会速记开发了一套智能会议系统,主要针对于会议、教育、培训等需要将语音转成文字需求较高的场景,将会议发言实时录音并转成文字;现场显示屏幕进行文字同步直播。
现阶段产品还未上线。欧咏群表示,硬件开发产品周期会在6个月到9个月,未来硬件客单价设立在699-899元这个区间,服务收费每小时音频时长30元。
目前已经与众筹平台达成合作,产品上线首选在众筹平台上曝光。至于软件方面,会速记通过PC端和移动App端对用户进行服务。目前与科大讯飞达成战略合作,主要是使用了科大讯飞API接口的SDK技术。