生活

百度推出AI音频转录工具SwiftScr

2019-04-08 13:52:20来源:励志吧0次阅读

百度推出AI音频转录工具SwiftScribe,让你20分钟搞定1小时的录音 | 钛快讯 钛媒体 15:53 SwiftScribe支持上传转录wav和mp3格式的音频文件。一段30秒左右的音频转录成文本时间大概为10秒,而一段1分钟左右的文件大致需要30秒的转录时间。

钛媒体快讯 |百度美国于昨天推出转录工具SwiftScribe,一个利用人工智能,让用户能快速将音频转成文字的免费页工具。

百度在近年一直在持续改善其新一代深度语音识别系统DeepSpeech2。DeepSpeech2系统由百度硅谷人工智能实验室(SVAIL)研发,并在去年被麻省理工科技评论评为2016年十大突破技术。

百度在语音技术领域不断进步,语音接口更为实用和有效。用户可以愈加便利地与身边的设备进行互动。百度的深度语音识别系统(DeepSpeech2)包含了一个非常庞大的神经络,引入了数以百万计的转录语音。有时它在识别汉语语音片段方面,要比人为识别更加准确。 麻省理工科技评论写道。

百度在去年也推出了应用DeepSpeech2的安卓输入法应用TalkType,让用户能够快速语音输入文字。国际科技巨头如微软、亚马逊、苹果以及谷歌同样在语音识别领域投入大量精力,但在长段语音识别转录上仍不及百度。

SwiftScribe支持上传转录wav和mp3格式的音频文件。一段30秒左右的音频转录成文本时间大概为10秒,而一段1分钟左右的文件大致需要30秒的转录时间。SwiftScribe支持用户上传1小时长的音频文件,1小时的音频则需要20分钟左右的处理时间挖坑机
,百度的项目管理人武田介绍道。

但SwiftScribe的功能目前还没有很完善,在转录成功后,用户还需自行对文本进行。SwiftScribe转录出来的文本是不带标点符号的乙二胺品牌
,用户需要自行断句、并对可能出现的错误进行更正、以及英文单词大小写等。不过SwiftScribe同样提供变速阅读工具,让用户在校对时可以调慢播放速度。

图片来源:VentureBeat

SwiftScribe的开发灵感源于武田在加州大学圣芭芭拉分校读研期间的采访经历。

我的母语不是英语,要整理一段1小时录音对我来说要花上10个小时。而对于专业人士来说,时间也不短鲜蜂王浆品牌
,大概要6小时, 武田说道。

武田和同事Nina Wei在跟几个速记员交流过后也为开发SwiftScribe找到了不少灵感。武田的团队认为SwiftScribe能给速记员带来1.67倍的效率提升,能缩短40%的工作时间,这也意味着他们能花同样的时间赚到更多的钱。

显而易见,SwiftScribe并不只是单单面向于速记员,它基于页,并免费为用户提供服务,对于其他如等需要经常整理音频文件的职业,SwiftScribe可谓是提高效率的神器。

我们希望在未来能够将其商业化, 武田说道,透露在技术成熟后增加收费服务的打算。

武田的团队计划未来给SwiftScribe加入音频自动转录文字、为视频上字幕等功能,以及增加支持文件格式,并加入自动添加标点符号的功能。

(本文首发钛媒体,综合自VentureBeat、MIT Technology Review等外 。Garrett/编译)

更多精彩内容,关注钛媒体号(ID:taimeiti),或者下载钛媒体App

时间获取TMT行业新鲜资讯和深度商业分析,请在公众账号中搜索「钛媒体」或者「taimeiti」,或用扫描左方二维码,即可获得钛媒体每日精华内容推送和搜索体验,并参与活动。

钛媒体 中国的财经科技信息服务提供商。关注公众号:钛媒体(ID:taimeiti),旨在为创新、创业、创造人群,提供效、专业,价值的信息交流平台,和相关的职业与资本服务。我们拥有行业内质量的内容、作者(意见)及产品线,通过连接创造力的创新、创业及变革者,打造中国的线上影响力社群。

现在的讯飞做的讯飞听见其实也是能完美实现语音转文字功能,讯飞做得灵犀语音助手也是相当不错,其实感觉这个主要的就是语音识别正确率的高低,不然就很鸡肋了。

15:00 via pc

阿里云、讯飞去年一直都说有这样的应用,但大规模商用竟然是百度,还是美国搞出来的。

19:56 via pc

我们会向您的号发送验证码,请查收并按提示验证您的号。如果您没有收到短信,请留意垃圾短信拦截

经检测,你是“钛媒体”和“商业价值”的注册用户。现在,我们对两个产品因进行整合,需要您选择一个账号用来登录。无论您选择哪个账号,两个账号的原有信息都会合并在一起。对于给您造成的不便,我们深感歉意。

分享到: