媒体监测和推荐平台

搜索结果

当前位置:首页 > 搜索结果

登顶世界顶级赛事,科大讯飞开启转写新赛道,对AI应用的想象力可以更多

人工智能同大数据和互联网结合起来,打磨出更多新产品来满足社会刚需,是新基建背景下人工智能企业发展的重要方向。作为国内最早专注语音识别的厂商,21年的技术积累让讯飞成为语音AI领头羊。如今讯飞产品多线开花,开启智能转写赛道构建新的技术护城河。

最近,新基建这个词火了。

新基建中的「新」,不仅在于硬件设备的新,更在于场景、用户需求的新。

新基建对拉动GDP稳定增长、解决就业问题有重要的提振和牵引作用,同时带动核心产业和技术升级,推动新消费的形成,是非常重要的战略举措。

人工智能同大数据和互联网结合起来,打磨出更多新产品来满足社会刚需,是新基建背景下人工智能企业发展的重要方向,也是科大讯飞正在探索的新路。

深耕21年,讯飞的AI+价值显现解决诸多社会刚需

5月27日,录音笔产品升级发布会上,科大讯飞执行总裁胡郁也指出,会尽快让用户体验到AI技术和产品融合的真正效果。

2020开年,受疫情的影响,很多地方采取了社区隔离政策,外地员工无法回到原工作地,给企业复工带来了很多问题,线下的生产经营无法正常开展,但很多企业工作都可以线上开展,这时就需要视频会议、语音聊天、内容共享等移动办公方式。

面向企业,讯飞听见智能会议系统 L1 就是一款多功能视频会议、实时语音转写及翻译为核心功能的智能办公设备,L1在疫情期间期间大放异彩,为大量企业提供了办公会议、远程视频会议等智能高效办公服务。面向消费者,SR系列录音笔和会议宝做记录可以提高使用者工作效率。

疫情期间为了避免集中教学引发病毒扩散传播,全国各地纷纷停课,严重影响了正常的教学活动。

科大讯飞的线上课堂发挥了大作用,让同学们足不出户就能学到与课堂上一样的知识,而线上课程学生和老师的互动减少了,大部分时间是知识的灌输。

针对在线课堂,讯飞智能学习机推出了「停课不停学」解决方案。讯飞学习机X1 Pro搭载了10.1英寸2.5D高清润眼屏,最大限度的保护学生的视力。

高通八核处理器,配备3G运行内存以及32G存储空间进一步提升了机器反应速度,提高学习效率。

智能学习机前后均配备摄像头,方便同学在线提交作业、反馈问题以及求助等。

当潮水退去才知道谁在裸泳。人工智能行业鱼龙混杂,只有真正在做事的,致力于解决社会刚需和痛点的企业才能经受住考验。

近日,讯飞的消费者业务同比保持了稳定增长,还发布了多款针对特定场景的录音笔产品。SR系列录音笔可以满足职场白领和商务人士的日常会议记录需求,而A1系列价格亲民,更适合学生群体。

破局:录音笔产品受众窄刚需强,智能转写成为新护城河

一个东西火了,立刻就会有大批人蜂拥而至,在短时间内迅速涌现出大批功能、外形、甚至品牌都类似的产品。

录音笔市场,是一个窄受众、强刚需的市场,因此竞争尤为激烈。身处这个市场中,不光要跟同行竞争,还要面临其他智能产品如手机、iPad等具有更广泛受众产品的市场挑战。

要想胜出,就需要在专业性上建立壁垒,在新赛道上拉开差距。而这个新赛道,就是智能转写。

对用户来说,一个录音笔,录音功能的好坏、录音质量的高地只是第一层次的需求,可以随意转换成便于操作的文字内容才是最终的需求。

而对于录音笔厂家来说,满足用户的第一层需求,已经不存在太大的差异了。如果有,那也是目前的硬件无法实现的。而在满足用户终极需求层面,依然存在着巨大的升级空间。

讯飞的优势,恰好就在这「最后一步」上。

无论是会议记录、讲课内容,如果单靠人工来整理,一个小时的录音可能需要花费好几倍的时间才能最终整理出来。

汉语有很多多音字,也存在很多方言。同一个词,不同人读起来可能差异巨大。一个南方人可能无法念出翘舌音,而一个北方人可能一句话里全是儿化音。同一个读音的词,在不同的领域中可能对应的就是不同的文字。每个人说话风格不同,很多人在说话的时候会不自觉的加入口头语例如「嗯」「然后」「我说」「是吧」等等……

能否准确的将各种复杂场景下的录音内容转写成文字,考验的是一家公司的AI技术硬实力。它需要的是语音识别技术的积淀、海量的语音数据以及自然语言处理的创新。

而讯飞,恰巧在这三个方面都有占据了优势。

作为国内最早专注语音识别的厂商,21年的技术积累使得讯飞一直是这个细分领域的领头羊,积累了大量的语音数据。有着这样坚实的技术基础,讯飞拿到了2016年CHiME-4、2018年CHiME-5、以及2020年CHiME-6三届比赛冠军。

CHiME由英法美三国联合推出,而今年的CHiME-6被称为「史上最嘈杂」。比赛的目的是希望学术界和工业界针对高噪声、高混响、自由讨论场景提出全新的语音识别解决方案,从而进一步提升语音识别的实用性和普适性,属于国际语音识别评测中的高难度比赛。

讯飞的机器翻译也处于国内第一梯队,神经机器翻译技术已商用多年,满足了多语种翻译加转写的前置条件。后端的自然语言处理引擎(语义角色标注、依存句法分析、语义依存分析等)加领域完备的知识库为用户提供专有名词、短语片段、句子级的纠正功能,可对终端的转写错误进行实时纠正。

至此,讯飞在智能转写赛道中,奠定了其行业领先的地位。

讯飞智能转写产品全面推新升级

技术实力有了,好产品还会远吗?

最近,讯飞转写赛道就推出了两款入门新品,面向更多元化的消费市场,价格也更亲民。

互联网时代,产品思维最重要的是研究用户的行为,以用户为出发点拓展不同场景下的产品创新和功能升级。不管是年轻的学生群体,还是职场精英都可以找到满足需求的讯飞C端产品。

海量的会议记录几乎是当代大众刚需,讯飞会议宝S8正是看准了这一市场,专门面向企业白领。会议宝S8插入电脑即可同时对会议内容进行转写、录音、编辑。

更方便的是,这款会议宝可以随插随用,无需充电。

而且为了保护数据安全,会议数据存在电脑端以及云端,即使设备本身丢失,会议数据也不会泄露。

这台提升办公效率的AI转写神器,目前全网预约价589元并提供1年免费不限时转写服务。

另一款入门级便携式录音笔产品A1则是面向新兴市场,A1连接讯飞听见APP即可进行实时录音和转写服务,机身小巧便携,方便学生群体课堂记录。这款产品外观更加潮流化,可以DIY,更适合对产品颜值要求较高的年轻用户群体。

除了面向不同市场的产品创新,讯飞还针对旗舰产品SR系列进行了重要性能升级,包括录音、转写和编辑三大方面。

录音方面,最远拾音距离可达15米,降噪同时,可对非人声进行过滤。

转写方面,准确率均高达98%。针对方言,SR系列又升级了12种方言,包括粤语、河南话、四川话、重庆话、云南话、贵州话、天津话、河北话、东北话等等。两种少数民族语言藏语、维吾尔语也可以识别出来。

语种方面,最新的升级版除了中文和英文,还可以识别日语、韩语、俄语、法语、越南语和西班牙语。开会时,有的双语背景人士还喜欢中英夹杂,这个时候讯飞的优势就更加明显。

此外,讯飞此次还升级了7大专业领域的转写优化,包括IT科技、财经贸易、文化体育、医疗、政法、运营商、教育。

可根据说话人的语汇,对转写内容「量体裁衣」。领域识别优化,一方面基于完备的领域专业词库,另一方面还有后端的知识引擎帮助校正语音识别中的错误。

另一大技术升级就是智能编辑。讯飞利用AI技术可以自动过滤掉没有用的语气词,重复词、无意义词,讲话长篇大论还可以智能编辑分段。

开启转写赛道,直击用户刚需技术全面领先

讯飞深知,置身于一条赛道之中,技术的积累决定了起跑线的位置,而只有不断的创新,才能保证前进的速度。

但,创新并不是盲目的试错,而是要紧密的沿着「用户刚需」这个边界不断探索。

疫情导致停工停学,居家隔离,促使远程办公、远程上课成为趋势。而讯飞听见、智能转写等产品,正好满足了用户的远程刚需。

根据腾讯研究院给出的数据,早在3年前,美国就已经有超过八成企业引入了远程办公制度。疫情期间,包括Twitter、Facebook在内的各个大厂纷纷开启远程办公模式,而中国在远程办公领域的渗透率还远远不够。

疫情虽然带来了危机,但却为国内普及远程办公、远程上课带来了新的机遇。原来对远程办公不了解、甚至对这种办公形式心生抗拒的企业,也逐步认识到了远程办公的重要性和必要性,理解其存在的意义,认识到其中的价值。

远程办公需要的不仅仅是一个视频会议软件,更重要的是能够第一时间将会议内容转化为更易传播和保存的内容,减轻与会人员浪费时间去做声音转文字等重复的体力劳动。

一场会议结束后,不仅需要第一时间给出会议记录,还应该在会议过程中,能够及时对重要内容进行记录和批注;尤其是涉及到多语种会议的时候,还需要能够及时对演讲者的内容进行翻译。这些,讯飞都能轻松实现。

比如,中小型企业可以使用讯飞听见完成实时的会议内容实时展示、记录、整理、分享;跨国企业可以使用它实现实时双语字幕视频会议(实时语音转写翻译的准确率最高可达 95%),培训机构也可以通过其独特的文档结构化存储和二维码分享功能,迅速沉淀培训成果,提升获客效率。

对于重要的会议内容,讯飞听见甚至可以随时随地进行重点标记。其自带的鹅颈式麦克风和外置A1麦克风,能够做到人物角色区分,让会议记录的转写结果更加智能,回听查找也更加方便。

而讯飞学习机是讯飞人工智能服务从云端走向硬件的一次大胆尝试,学习机还加入了智能作业批改,一方面让学生能够随时随地、更快速的得到反馈,另一方面也能够极大的减轻老师的负担,将更多宝贵的时间用在提高教学水平上。

我们常说,机会是留给有准备的人,而每一场危机都是一次考验。正是由于讯飞的技术实力过硬,产品才能快速适应不断变化的需求,加之硬件的更新升级,使得讯飞能够从容应对危机,在转写赛道上领航旗帜不倒!